$V2EX
Solana
Give SOL to Copy Address
使用 SOL 向 xiqingongzi 打赏,数额会 100% 进入 xiqingongzi 的钱包。
Web  收录于 VXNA 的 1 个网站
27 篇文章 feed address
xiqingongzi
0D

xiqingongzi

Just Keep Shipping
🏢  高级产品经理
V2EX 第 57504 号会员,加入于 2014-03-05 22:35:38 +08:00
今日活跃度排名 4887
根据 xiqingongzi 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
xiqingongzi 最近回复了
3 天前
回复了 8675bc86 创建的主题 程序员 AI 是不是基本杀死了 blog
blog 是自己写给自己的。不是写给别人的。
可以考虑发到 wordpress 的 plugin directory
有个「我是鱼」,你看看
是的。作为某小龙的模型产品,补充一些我的看法(仅个人看法)
评测和体感不一致

1. 作为终端用户,我的建议是,不要太相信榜单,只作为参考,甚至也只能作为参考。原因是榜单本身是一个开卷考试,理论上如果你想考高分,你可以塞尽可能多的数据拟合题目,以获得足够高的分数。(为什么不是每个模型都刷满分?因为还需要加入其他类型的数据,以确保模型的在其他榜单效果上足够好)。所以,榜单看看就行。关键还是自己的使用体感或者自己的评测指标。

2. 关于打榜推理:打榜推理的好处是用量可控加时间短,所以可以上八路推理;得到比较好的效果。但如果是日常使用,一个是损耗比较大,因为日常的问题往往不需要那么多并行推理选其一(大部分问题没那么复杂,这也是为啥 claude code 把 ultrathink 作为一个单独的 magic word 来使用);另外一块是要考虑到成本,国内的竞争非常的卷,以至于各家可能都是贴着成本在做,甚至亏本在卖 API ,这样导致其实很难会选择给你最强的模型推理方案。
123 天前
回复了 radishzz 创建的主题 分享发现 好消息, PakePlus 改名了
感觉 pake 作者要恶心死了 hhh
124 天前
回复了 Charon2050 创建的主题 问与答 哪家 LLM 的色情类角色扮演效果较好?
开源模型可以自己考虑
124 天前
回复了 Charon2050 创建的主题 问与答 哪家 LLM 的色情类角色扮演效果较好?
国内的都不太用看..有安审拦截.🙀
求加群,微信 ixiqin_com
143 天前
回复了 Livid 创建的主题 Solana 20250805 - Cold Wallet 操作说明
V2EX 第 57504 号会员,加入于 2014-03-05 22:35:38 +08:00
看了一下,时间过的真快啊,也是加入 V 站 11 年了。
真 · 实干家。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   833 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 17ms · UTC 22:13 · PVG 06:13 · LAX 14:13 · JFK 17:13
♥ Do have faith in what you're doing.