V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  coefu  ›  全部回复第 27 页 / 共 42 页
回复总数  828
1 ... 23  24  25  26  27  28  29  30  31  32 ... 42  
@icyalala 你对智能的理解量,决定了是不是不如老鼠咯,你和我都不在一个频道上,有什么可讲的,不要艾特我了。
@trungdieu031 我过过脑子,当前 LLM reason 的能力怎么来的?不是 RL 后训练得到的? COT 真要有提升的话,还关参数量什么事情? 9B 的 LLM 带上 COT 能和 671B 的不带 reason 的比?
@trungdieu031 不是 GPU 的摩尔定律没到头,是他把芯片越做越大来提升的性能。因为 GPU 的独立性,他把现在电路板都做成芯片也行。
@icyalala 老鼠能感知危险,LLM 能吗?你对于智能的理解很片面。
@trungdieu031 别闹,但凡单卡能无敌上限,他会卖一体机?还搞光交换机拓展机柜?
@NoOneNoBody 乐观估计几十年。
@catazshadow yep ,摩尔定律到头了,无法切割原子。另外纵向立体堆叠也要考虑热量的问题。
@cmdOptionKana 人脑内部演算,就是杨立坤现在搞的世界模型这条路。
@cmdOptionKana 不能,见我上述,语言只是智能的一个子集。
为了对股东有个交代,但凡有一种新的“大脑”模型,能对于陌生环境的问题,通过极少的训练(后者 0 训练,直接在动手的过程中学习)就能解决,谁用强化学习(针对特定场景试错巨量次来取得成功的经验)这种笨办法啊?
我纠正#64 的回答。

1 是 RL 的路线,2 是世界模型的路线。是因为本身缺少一个从根本上就无法高效泛化的“大脑”才走上面 2 个路线。

我纠正一下我的这个回答,因为 2 我回答错了,

这两种方法都是 RL 强化学习的方法,1 是在线强化学习,2 是有模型强化学习。
对于当前那些具身双足机器人学习家政或者别的人类技能的时候,用强化学习来做,那是没办法的办法,并不是这个办法是最优解。强化学习策略的泛化能力,在环境有根本性变化之后,就很低了。但是世界环境的特征是无穷的啊,怎么可能靠枚举来解决。或许在家政这个具体的领域,环境是可以收敛的,但是这个环境系数依然是庞大的。
@cmdOptionKana 你误解了我的观点,我的观点是对于技能泛化的能力。狼孩回归社会之后,擦桌子拖地不需要训练几千次才掌握,这就是我的观点。
@windghoul 栓 Q 。
@sillydaddy 你讨论的攻击味道太浓烈了,我回答了你艾特我的问题。
@cmdOptionKana
1.1 还没上小学的娃娃,他们可能不会读写文字,但是他们想玩手机,但是他们都不知道手机这两个字怎么写的。文字不完全代表智能。
1.2 原始人时代,文字还没有发明之前,智能也是存在的。
1.3 当前的 AI 是一个宽泛的定义,狭隘 AI 定义下的 LLM 看起来有局限性的智能。
1.4 强人工智能的 AI 还需要几十年发展。
@sillydaddy 下次否定别人的时候,不要带吧这个字,会让你没那么自信。我没说机器人训练为什么不如文本和视频训练。你所说的机器人训练的 2 种方法,只是在当前技术基础上的方法。你说的 1 是 RL 的路线,2 是世界模型的路线。是因为本身缺少一个从根本上就无法高效泛化的“大脑”才走上面 2 个路线。
你请一个保姆,还要让她训练几个月擦桌子和拖地?
自己没读过几本书就不要这么狂。
为什么没有人和我对线?我是来真心讨论的,我也有那么一丢丢的先验知识储备,看过几本书的。
@cmdOptionKana 你所掌握的知识和技能,包括但不限于学校学习到的,工作积累到的,为人处世的,以及从你家到公司,你的行为等等等。
@chairuosen 目前用于训练 LLM 的数据就是极限了,唯一没有极限的就是每个人每天眼睛里看到的画面和耳朵里听到的声音,手的触觉,嘴的味觉,这些数据是无限的,只要有人,就会有新鲜的不同的。需要一个类脑的系统来接受和处理这些数据,但肯定不是当前的 LLM ,也不是当前的 ANN 流派能解决的。
1 ... 23  24  25  26  27  28  29  30  31  32 ... 42  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5604 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 03:02 · PVG 11:02 · LAX 19:02 · JFK 22:02
♥ Do have faith in what you're doing.