V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Philippa  ›  全部回复第 1 页 / 共 54 页
回复总数  1066
1  2  3  4  5  6  7  8  9  10 ... 54  
Gemini3 正在 Cursor 上尝试,感觉不错,目前也是刚开始用说不出它和 Codex ( CLI )哪个更好。
Claude Sonnet 4.5 从 Codex 出来其实就已经不行了,经常性错误归因,而且没有根据就作出误导性判断。opus4.1 也是如此(在 Claude Code 上用)。

我的标准是:正确/分析能力 > 速度/工具使用

Gemini3 和 Codex gpt-5-codex-high (目前 gpt 5.1 Coding 方面有不听指令问题,见 Reddit ,暂时 skip ) 都肯定好于 Sonnet 4.5 和 opus4.1 。
Codex 是慢一点但是它的分析和正确率要好很多,天花板比 Sonnet 4.5 要好很多。
44 天前
回复了 Natsuno 创建的主题 Android 今年的 OV 二选一
oppo 的天马屏不差,在 bilibili 的实测视频,不要听一堆留言。比如 find x8s+ 的天马屏明显比 ultra 的要好,更养眼。

我转了 find x8s+ 两个月,总结 oppo 系统很难用,换回了 iPhone

1. 搜 map 是搜不到 google map 的,你要搜 “地图”。有时搜索什么结果都没有(外出时那叫一个烦,搜个 app 还要切换中文输入法,有时还不显示)。
2. 健康步数授权前就会积累,点击授权会删掉你所有的历史数据(大怒)。
3. 偶尔屏幕操作短暂不响应。
4. 外放比 iPhone 差。
5. 安装外网 app 要断网,经常提醒这是高危 app 建议卸载。
6. 短信拦截也要授权,但不授权它也会拦截。
7. 拍视频发 instagram ,会提醒不兼容,要花很长时间转 SDR 才能发。iPhone 没这个问题。
8. 国内云服务真的不敢用,后台估计一堆人随时打开你的相册随便看
9. 删不完的广告
10. 很多 Android apps 质量很差,这和 oppo 无关,但是非常影响体验。比如 instagram 聊天历史消息一直加载不出来,要删除数据重新安装才有,其他 app 也是,andorid 不是多了黑边就是少了动画

换安卓之前我觉得 iPhone 真是腻透了,换了 find x8s+ 刚开始觉得不错,电池真的好。过了 2 个月换回 iPhone 17PM 感觉终于不用忍受了。
54 天前
回复了 Philippa 创建的主题 Claude Claude Code 再次大幅度提价
@hellboys 是这样的
60 天前
回复了 Philippa 创建的主题 Claude Claude Code 再次大幅度提价
64 天前
回复了 maizero 创建的主题 MacBook 期待更轻薄的 Macbook Air
@sodayo @facebook47

你为何要把你自己的感受强加我呢,你咋就觉得我要折磨自己的腰呢,我就不喜欢吊个充电宝咋了,我就不喜欢连线咋了。买电子产品还要比个高低,这是高度个人主观的东西。好了,重了,你赢,很厉害,真的幼稚
64 天前
回复了 maizero 创建的主题 MacBook 期待更轻薄的 Macbook Air
很多所谓外出跟旅游是两回事,人们假设的外出:到处都是电源,还要关心音响和接口传输速度等等,要么就是酒店和旅游景点来回,车上还有电源。

实际上旅游外出:没时间去等充电,也没那么多电源,越轻便越好,续航越久越好,需要时拿来把视频图片拉过去,甚至应急还能帮手机充电,差个东西啥的。而且最好就一件,别拖着个电脑,鼠标,电池,电源之类的。拿上 ipod 碰一下子就连上了。出外旅游需要电脑,拿去咖啡厅桌子也不大拿上去一放就 ok 。就算有什么临时东西要开电脑,也没有散热口,随便一扔回来擦擦就可以。用 pro 都是工作用的。
64 天前
回复了 maizero 创建的主题 MacBook 期待更轻薄的 Macbook Air
@facebook47 拖着条线不行,而且外出不是哪里都有电源,macbook 中度使用可以一天到晚
64 天前
回复了 maizero 创建的主题 MacBook 期待更轻薄的 Macbook Air
mba 的芯片能耗那么好拿出去都不用带电源,windows 本本很多场景都需要带上电源,这重量就蹭蹭上来了
64 天前
回复了 Philippa 创建的主题 Claude Claude Code 再次大幅度提价
@sealinfree

我感觉 sonnet4.5 吸收了 gpt 的那种规整,完整性,整体体感不错。cc 的代码比 gpt 好,gpt 的代码更像人一般写的代码,但很多代码没有空行,很多堆砌。但 gpt 做代码分析和提升真的很不错。以前没 codex 时我都是 cc 里配置 mcp 连过去 gpt 让它分析分析,现在两个 terminal 一起用。

sonnet4.5 对比 opus4.1 的确是速度是快了,但规划时,尤其是新代码时我觉得 opus4.1 那个分析还是高一个层次。但在处理已有代码,测试一路下来,sonnet4.5 的确是新层次。

cursor 那边的确同模型效果也不佳。
66 天前
回复了 Philippa 创建的主题 Claude Claude Code 再次大幅度提价
测试 codex gpt-5-codex high 效果其实不错,本来就订阅了 gpt ,这下直接把 claude code 取消了,毕竟 200 美元一个月却只能用 sonnet ,那 claude code 毫无优势。
69 天前
回复了 CNM47589 创建的主题 iPhone iPhone Pro 上面的 USB3 用处大吗?
必须的。

17 pro 拍视频 4k + HDR ,一秒几百 M 的大小,必须连接外部储存才能用。
我外接了一个 4T 的 SSD ,也就拍 2 到 3 小时就没了,手机本身最大也就 2T 。

在外旅游,一可能没网络,二是上传 iCloud 也来不及,必须是存 SSD 的。这些场景 USB2 完全无法用。
76 天前
回复了 4ever911 创建的主题 Claude Claude Code 降智问题解决了吗?
没感觉到降智问题,一直使用 opus4 model ,只要定义好方法,它会自己不断测试修复大半个小时直到出现理想结果。
76 天前
回复了 lpffernando 创建的主题 Android 安卓主力机推荐
国产机硬件好,国外系统稍微好一点。oppo findx8 刚买时我觉得很好,后来经常推送消息没通知,时不时一堆信息一起推。国外 app 必须翻墙。oppo 运动授权前有数据,授权后数据自动给我全清了。去了国外用 google 地图搜 google 没结果,搜 map 也没结果,搜地图才有,有时还延迟几秒。屏幕滑动点击滑动有时 2 秒无响应,搜索栏的推荐新闻去不掉,安装境外 app 或 apk 需要断网安装,短信拦截关不了,不授权还是在跑。有的 app 无法选择图片部分权限。图片和通信录等不敢用,他们后台全都能看。AI 只能用它的小布,无法切换成 gemini 。现在 android google play 也比以前 android 封闭多了,很多好游戏也消失了强制联网。

好处就是电量大,充电快,屏幕高频调光,内存大 app 留存好。信号好。拍照比 iphone 好。可以安装 tiktok 破解版。

但不方便的地方太多了,尤其是云服务和丢数据之类的,还有搜索不支持中英,不能忍。

建议贵点买三星,我又换回 iphone 了。
已经摸到了,在海外摸到的。亮面边框,一想到 3000 毫安都没有,果断放下
天钡,更便宜一点。配了 2 条 64G 内存,24h 开机。运行下来一直稳定。
我本来是买铭帆的,贵几百块,结果几天都不发货,很离谱。
于是退货从京东官店入 GEM12+ 还便宜几百块,第二天就到了。
119 天前
回复了 zhwguest 创建的主题 OpenAI 感觉 GPT-5 智障了
我有大量 4o 的记忆,因此还是 4o 那味,但是现在不会像 4o 无脑吹捧了,我觉得是个提升。也不像 o3 那样书呆子。
@sampeng Thanks

今天研究并试验了一下,我个人觉得 TDD 并没有带来什么额外的东西,只是流程上发生了变化,似乎真正带来增益的是测试来把关。其他发现比如:

1. Tokens 用得很多,开了订阅其实没所谓,但是那个 tokens 多 = 很久,今天测试用的前端项目 5 个 cycles 今天跑了半小时+,效率不行。
2. 检查了测试,除非人为写测试 description ,否则还是问题。
3. 由于是写 markdown 来驱动开发,比在 IDE 里选中行,直接告诉如何实现效率要低很多,也更加不可控。
4. 前端需要更好的测试方法,单元测试无法解决 UI 界面测试问题。
5. 有时候 agent 会 skip 掉往 github 添加 comment 或更新 tag 的步骤。
6. 有时候 agent 会忽略掉生成代码,只是分析了一遍,我觉得这是 markdown agent 的问题,不同于 n8n/dify/code 的 agent ,它无法确保步骤被执行。

说实话,我挺期待能够找到更加自动化的方法。目前后端我只敢半自动,因为后端和数据相关,崩溃没关系,最怕数据结果算错了,那个很致命。另外后端设计除非 API 这种,否则无论 opus 还是 sonnet 还是经常犯傻。前端目前我能够 90% 以上生成,但前端却难在自动化测试。

说个题外话,我觉得目前最好使的是 Claude Code 加个 mcp server 外接 gpt ,让 gpt 和 opus 同时出方案,相互比对代码性能更加,并且强制测试。
可能要给 issue 和 issue 之间加一个依赖注入,让它能够自动把复杂的需求转化成线性顺序去解决 issues 。
很好的想法,感谢分享

但 op 有没有想过如何把需求 context 关联和顺序问题?比如说:

1. 使用 “人和动物 class” 创建一个人物
2. 使用 “人和动物 class” 创建一只宠物
3. 让人物去摸宠物

1. 如果 agent 先读取 issue 时先读了 3 ,会导致奇怪的问题。
2. 如果 agent 先读取 1 然后马上读取 3 ,可能会导致生成了不符合要求的宠物 code 。
132 天前
回复了 Rosen2 创建的主题 程序员 React Router V7 初尝试
Tanstack 很好用,有了 AI 后就更好用了。没有魔法的框架出事时也容易 debug ,Next 一坨,漏掉 use client 那个 debug 完全不相关。
1  2  3  4  5  6  7  8  9  10 ... 54  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   791 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 21:49 · PVG 05:49 · LAX 13:49 · JFK 16:49
♥ Do have faith in what you're doing.