V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  kaichen  ›  全部回复第 1 页 / 共 21 页
回复总数  405
1  2  3  4  5  6  7  8  9  10 ... 21  
9 天前
回复了 LoneFireBlossom 创建的主题 OpenAI GPT 连学话都学不会
大模型是个概率模型,你骂他,和他讲反例,只会把概率引导到更加不符合你需求的结果

另外,由于上下文有限,你聊越久前面的内容会遗忘,或者注意力大幅降低
#19 @shuimugan

gpt4 代码写很烂,只有 claude-3.5 才能写出大概正确的代码片段

我的观点是,现在民用本地设备,跑模型写代码这个事情非常不实惠,买个 cursor 20 刀一个月,是本地跑的 100x 效果
可以参考一下这个 aider 的排行榜,基本的算法题,

本地跑 72B 4bit 量化的要 40Gb 显存,也才能做答个 60 分

跑起来很快的 8B 小模型,就 30 多分,你用这个来写代码,就像教小学生写作业,得被气得半死

https://aider.chat/docs/leaderboards/
13 天前
回复了 DemianL 创建的主题 Apple 现在国补和促销的 MacBook 都是库存么?
你买最新款的不就不是库存了么?比如 M4 的
24 天前
回复了 chungon 创建的主题 macOS 纯生产力, M1 Max Studio 还是等 M4 的 Mac Mini
去买官翻的 mac studio 有性价比

去闲鱼买 mac studio 更有性价比

其实你要的是内存,大部分时候用打不到性能的完全释放,另外 mac studio 的散热是能支持性能持续释放的,比本子和 mini 都好
24 天前
回复了 malagebidi 创建的主题 罗技 罗技鼠标计划性报废,还有什么推荐的?
@HomeZane 去 PDD 买贴纸贴上 https://i.imgur.com/agAJ0Rd.png
24 天前
回复了 mfsw 创建的主题 OpenAI 聊天机器人,如何训练?
大力出奇迹,几本书是不够,要很多很多。

参考,推理能力超过 gpt-3.5 的 Llama3

- https://ai.meta.com/blog/meta-llama-3/
- https://ai.meta.com/blog/meta-llama-3-1/

> Meta reports on Llama 3.1's page on Huggingface, using 39.3 million hours of H100 80GB instances to train all 3.1 models (8, 70, 400 B).

大概是,两万四千张 H100 训练 74 天

> Llama 3 is pretrained on over 15T tokens that were all collected from publicly available sources.

大概等同于 60TB 数据,在它的技术报告里,提到这是更大的数据集上做清洗去重的精华

---

所以先有这么多的资源才能训练得到高质量机器人
@drymonfidelia

有几个技巧,提升他写对的成功率。

最直接的,@Web ,要求他联网查询再回答。

遇到冷门的库,你可以把文档 URL 贴给他进行索引,然后 @ 索引的文档名字。具体在 cursor 设置里,可以添加文档,他也内置了一些流行的 py/js 库的文档。

某个改动有对应代码示例的网页,比如某篇博客,复制 URL , @ 贴 link ,他会去扒拉这篇内容,作为参考。这种对于你用的某个库版本特别老或者特别新的时候,比较有用。
再大的项目,你日常开发也是会在项目管理层面切到比较小的范围。甚至一些需求改动的时候,你要做个小 demo poc 想法,那么这就回归到小项目了。

在比较小的范围,你改动某个函数实现,某个接口返回数据结构,或者某处界面,你框选,然后提具体的改动内容,比起你自己手动在那敲也是更高效的。

并且你本来就知道怎么实现的,那么让他先出个初稿,再改吧改吧,也比每个字自己敲快。
比 replit agent 好一些,由于只能用 wasm 的,一旦用到引用 native module 的包会出问题
本地有做 embeding ,你在选项里可以看到 index 的情况,还可以做 reindex 。

但最终肯定会发给 llm ,不然 ai 怎么知道相关上下文。

现在的产品只能选,经手方存不存。
把轴拔出来再按回去

特别是空格键,应该旁边还有卫星轴,或者其他支撑结构,可以检查一下是否拆出来的时候弄歪了
你问大部分的模型,都会说自己是 chatgpt ,因为大部分厂商都拿 chatgpt 来合成训练数据,用来训练自己的模型。

这不是判断模型真假的标准。
57 天前
回复了 ltfree 创建的主题 以太坊 目前 eth 全节搭建硬盘占用问题
现在这么多人自己跑节点的么?
区块链,证明我持有这把公钥对应的私钥

1. 用私钥签名一段数据哈希(如转账)
2. 网络节点还原哈希对应的公钥(椭圆曲线)验证公钥所有者,以及检查公钥所有者记账的金额余额

区块链上的账目实际上是记录在公钥上,即某个公钥持有对应资产数量
@emberzhang jina 这个不好用,其实暴力一点直接丢给 deepseek 效果非常完美,就是费钱
63 天前
回复了 xibobo 创建的主题 奇思妙想 突发奇想-一个 AI 构成的朋友圈
有这种虚拟推特,上来给你一堆 follower ,提供给你情绪价值

https://apps.apple.com/us/app/socialai-ai-social-network/id6670229993
70 天前
回复了 lekai63 创建的主题 Zed 唏嘘,免费的 Zed AI 居然没人推荐
刚刚起步的状态,距离好用还有些距离,可能你三个月后再来分享,会有更多使用后好评的体验
内存肯定越大越好,日常开发超过 16g 差别不太大,但不足时启用 ssd 缓存也不太能感知到。

对于体感明显,选 m3 还是 m3pro 更大的可能是能耗考虑,前者可以一天,后者只能大半天。
@falcon05 #17

哈哈哈,composer 已经在最新版本 0.40 里从 beta 放出来,成为正式功能了🎉
1  2  3  4  5  6  7  8  9  10 ... 21  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3518 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 38ms · UTC 11:11 · PVG 19:11 · LAX 03:11 · JFK 06:11
Developed with CodeLauncher
♥ Do have faith in what you're doing.