V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  sillydaddy  ›  全部回复第 3 页 / 共 130 页
回复总数  2588
1  2  3  4  5  6  7  8  9  10 ... 130  
真是应了那句老话:“手上有把锤子,看啥都像钉子,想砸两下”。哈哈,非喷勿怒。
16 天前
回复了 livib 创建的主题 奇思妙想 如何设计一个支持高强度对线的社区
我支持 OP 做出来。虽然名叫对线,但它暗含了很深刻的道理。/doge
什么道理呢?那就是 Roam Research 想要达成的那个目标:每个观点都有对应的支撑,论据层层叠叠,直到最底层的某个事实。
把对线想象成一棵树(一棵表达引用关系的树),最上层的观点一直延伸,直到被最下面的事实支撑。
而对线的过程就是挖对方的树,可以挖中间部位(指出逻辑推导错误),也可以挖根部(指出事实错误)。
我看了原文,说的是「研究者为了短期性能提升,会倾向于注入自己对领域的人类知识;但从长期来看,真正重要的只有利用大量计算」,意思是倾向于通用计算的。而你自己的是“反向苦涩教训”吧。
@newtype0092 也就是说,对于「「北京的糖葫芦是不是很有名?」」这个问题,如果模型的第一个字是「不」,那么你试验 1 亿次,也得不到「不对」、「不是」这样的答案。
@newtype0092
或者换个说法,当输入「北京的糖葫芦是不是很有名?」之后,模型回答的第一个字是「不」,然后,后续模型该选择什么呢?「不对」?「不是」?「不错」?后续字的选择是按照 LLM 的理解来选择的,而不是说此时「对」、「是」、「错」这 3 个字的概率分别是 1%,1%,98%。我敢说,「不」字后面「对」、「是」这 2 个字的概率,肯定是 0 !
@newtype0092 #24
「 LLM 的数学模型就是个概率模型,不存在对意思的逻辑判断」你的意思是 LLM 无法进行逻辑判断吗?
「长上下文没有偏离是因为 Attention 机制」,我反驳的是有人简单的认为 LLM 的概率,是对下一个 token 的概率选择!比如在糖葫芦的例子中,他们认为 LLM 就是在用概率在“没”,“不”,“是”,“对”,“说”,“你”这些字中选择下一个字,所以,他们认为 LLM 就是概率机器,没有理解。 而恰恰是这个例子,说明了 LLM 是在对“北京的糖葫芦很有名”表达肯定的回答,无论它以概率选择哪个字,都是如此。
18 天前
回复了 xfn 创建的主题 生活 大家在成长过程中有过"开窍"的那一刻吗?
哈哈,楼主的经历让我想到一件事。我有次机缘巧合玩桌上足球,开始不会,几局之后,表现爆表。然后我心里说,我喜欢玩这个,我太爱玩了。但其实在那之前,我看过别人玩过,然而并没有任何感觉,只感觉无聊过家家。看起来擅长做和喜欢做,并没有那么互相独立。
我觉得对 LLM 的一个误解(或者说被误导),就是认为 LLM 是以词作为下一个拣选单位,认为它是在以一定的概率选择下一次词( token )。
为什么不能是以“意思”作为拣选单位呢?

用一个 v 友举的一个对话例子:
A: 北京的糖葫芦是不是很有名?
B: 没错!尤其是在冬天,街头的小贩会卖糖葫芦,山楂蘸上糖浆,酸甜可口。
A: 真想买一个尝尝,感觉很有童年回忆!

在输入 “北京的糖葫芦是不是很有名?”之后,LLM 要回答肯定的意思的话,就有多种方式,“没错”,“不错”,“是的”,“对的”,“说的太对了”,“是呀”,“你猜对了”,“你怎么知道?”,LLM 可以以一定概率选择这些词里面的一个,那么第一个字,就可能是“没”,“不”,“是”,“对”,“说”,“你”这些里面中的任一个。但无论选择哪个,它都是为了表达肯定的意思,而是否表达肯定的意思,恰恰反映了 LLM 对这个问题的理解!不是说以一定概率选择某个词,就说明了 LLM 是随机的选择哪个,没有任何理解能力。否则,如果 LLM 是以词元作为选择的单位的话,怎么解释 LLM 在输出成千上万 token 之后,仍然没有偏离问题而出现意思上的胡言乱语呢。为什么你问他 100 遍,仍然只能得到相近的回答呢?
18 天前
回复了 izToDo 创建的主题 Google 被 Gemini 3 Pro 的生成的前端效果惊艳到了
不过,根据昨天 gemini 3 pro 在 cursor 中的表现,我觉得实际表现应该是不低于 sonnet 4.5 了,网上的测评分 2 者的编程能力也是不分伯仲。
18 天前
回复了 izToDo 创建的主题 Google 被 Gemini 3 Pro 的生成的前端效果惊艳到了
之前 gpt5 刚出来,我在 Youtube 上看到一个介绍视频,说它能一键生成媲美 photoshop 的画图软件,我不信然后试了一下让它做一个 mspaint ,结果它真一键做出来了。我说天哪,这让程序员怎么活。后来我准备让它完善一下,加上某某功能(记不太清了,反正是 mspaint 就有的功能,我一直希望有个 macOS 下的 mspaint ),结果它露馅儿了,怎么都做不好,我松了口气。
当时是网页端测试的,不知道是不是上下文受限。总之,我的意思是一键生成 xx 东西,不太能证明实际的表现。
@guduyuzhe
https://v2ex.com/about : “请不要把 AI 生成的内容发送到这里” ,会被站长封号的。
20 天前
回复了 caca1caca 创建的主题 Solana 确定就是现在了,我已加仓到 2💎
没有你的这段日子,确实冷了很多。空气冷了,氛围冷了,价格也冷了。。
20 天前
回复了 forgottencoast 创建的主题 生活 保存数据跨越 20 年
@forgottencoast 是某些邮件的附件,大小在 5MB 以内的 doc 格式文件,表现就是那 2 个附件始终下载不下来,会报错,其他的文件都是好的,而且可以确认当年发送的时候是好的。很明显就是附件对应的云存储出错了,检索失败或者校验失败。不过也很正常,10 年了,还是免费的邮箱。
20 天前
回复了 forgottencoast 创建的主题 生活 保存数据跨越 20 年
我之所以问那个问题,除了换设备会丢数据,还有一个触发的点:我从网易邮箱下载之前邮件的附件,不到 50 个附件里面,居然损坏了 2 个。差不多 10 年时间吧。
20 天前
回复了 sillydaddy 创建的主题 问与答 如何保存数据跨越 50 年?
@longsays
@Ketteiron
幸亏你们提醒,查了下,U 盘和 SSD 盘,都是需要定期通电,断电情况 2 年都坚持不了。。机械硬盘的数据靠磁性物质,很持久,但机械硬盘里面的零件固件润滑油也需要定期通电,否则也会出状况。。想归个档太难了。
1  2  3  4  5  6  7  8  9  10 ... 130  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   4061 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 48ms · UTC 04:09 · PVG 12:09 · LAX 20:09 · JFK 23:09
♥ Do have faith in what you're doing.