V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  maolon  ›  全部回复第 2 页 / 共 11 页
回复总数  212
1  2  3  4  5  6  7  8  9  10 ... 11  
39 天前
回复了 iflint 创建的主题 Google Gemini 3 Pro 这么牛吗
@wniming #25
gemini 3 pro 对标的是 gpt 5 thinking/high 模式,你直接用免费版的 gpt5 那肯定是满嘴跑火车了,我试了下,另外搜索我觉得还是 gpt 靠谱一些,gemini 才是一不留神满嘴跑火车的那个,下面是我把你问题贴给 5 thinking 里节选 vi 部分的回答:

• set -g status-keys vi
Uses vi-style editing in those prompts, with insert/command modes:
• In insert mode you type normally
• Esc → go to command/normal mode
• In command mode:
• h / l – left/right
• 0 / ^ – beginning of line
• $ – end of line
• w / b – next/previous word
• x – delete char under cursor
• dw / dd – delete word / delete line, etc.
看你是做项目还是做产品,项目简单,产品难,以及和楼上说的一样,你能做到一个持续盈利的独立开发产品就已经超过 99%的同类人了
白嫖 gemini pro + 白嫖 perplexity pro + 白嫖 cc + $20 gpt plus 自用 + $100 gpt pro 和朋友 shared codex ,cursor 自从他们那段时间瞎改付费 plan 就再也没碰过他们了
准确的说是后训练这步操作里,在 RL 过程中错误的语法会被惩罚,而正确的语法会被奖励。

语法这种东西一般是可以定性的(而且也相对比较稳定,一般新版本也只是在老语法上加东西,很少会去改已有语法),错就是错,对就是对,只要有大量的正确的训练例子做基础,哪怕不是那么大的模型也不会犯语法错误。

而 api 这种东西
1. 没有一个很明显的对错标准,有可能上个版本这个 api 还存在,下个版本就 deprecated 了,模型可能训练了老版本的 api
2. 这么多的库,有些常用的被训练进去了,还有很多不常用的没有训练(以及模型参数量本身太小做出的取舍)
3. 库和库之间很可能 api 的名称相差很小,导致训练后模型很难做出区分

TLDR:语法容易训练,api 难,且要经常保持更新,所以语法基本不会错,api 经常错
或者 github.com/Fission-AI/OpenSpec ,现在都是 SDD 开发模式了
@C64NRD 哈哈哈哈 太形象了🤣
47 天前
回复了 miscnote 创建的主题 程序员 Claude 和 Gemini 的个人感官对比
gemini 2.5 pro 当时的 0325 版那是全能型选手,创意写作,写代码,架构,阅读超长文本,除了 agent 能力稍差,其他能力基本碾压同时期的全部对手。
可惜被 google 自己一刀砍废了,0506 时期的版本只要超过 20w tokens 就开始说胡话,0605 之后稍稍修复了这个问题,但是其他能力基本都不行了,只剩一个写作能力还在线。
iOS26 感觉是解决不了掉帧问题了
切负一屏非常明显的掉帧,升到 26.2 都还没解决,像什么下滑搜索框会抖一下(这个搜索框之前还有 hdr 高亮 bug ), 背景开了 3d 锁屏的时候返回动画丢失这些 UI bug 数不胜数, 估计能修到明年 27 去
首先所有榜单都只能是参考,每个人的用法天差地别,其次这些榜单每一个都是有侧重点的
另外还有一个很简单的判断方法,什么时候 claude 和 openai 开始对标国产模型了,那他们就真超越了。
谁对标谁就用被对标的那个, simple as that
codex $100 + 自用 plus $20 + free gemini pro + free cc
我觉得大部分目前的系统都是采用你说的 2.这个方案,也就是模型自己判断要不要召回。

至于速度问题,其实可以用一些 trick 解决,比如开始召回就会固定/非固定的输出语音,比如“让我想想”,“我回想一下我们聊过的内容”这样的语音来拖时间,一般再怎么搞 300ms 也能召回完成了,而你拖时间的这句话应该会比这个时间长。

我之前产品用的 livekit 他们的服务,你可以去看看。
56 天前
回复了 snsn 创建的主题 Apple 17pm 今天换个新贴膜感觉不错 推荐一下
@7 我裸奔一个月了,暂时没有任何问题,这代屏幕有抗反射导致膜不好找,然后本身玻璃也升级了二代的超瓷晶耐摔和刮很多,干脆就直接裸奔了
是 bug ,codex 的 team 在处理这个问题,他们今天对所有用户的用量重置了一次
虽然说 llm as a judge 的评分肯定是不靠谱的,不过定性他们一向做的不错 (卧槽 盒!) https://i.imgur.com/UFE8hU9.png
现在(或者以后)不搞文档是真的会有问题,都是规范驱动开发( Spec Driven Development )的时代了,文档即代码, 反而你说代码注释必要不,我觉得没那么必要了
@chenguangwei 应该说原文就一股子 gpt 味( gpt5 ), 怕不是直接把那个视频的 transcipt 一股脑丢进 gpt 里要他分段总结生成网页搞出来的东西,你说他说的再对还是很膈应人
60 天前
回复了 VisualStudioCode 创建的主题 互联网 Linux Do 为何发展得如此之快?
两边都有号
l 站比本站大规模讨论大模型应用早至少三到四个月,缺点是用户没那么多程序员讨论深度有限, 现在本站讨论也多起来了就很少回 l 站了,偶尔回去看一眼也是羊毛居多
不过 l 那边讨论一直控制的不错,用户友善很多,不像本站一言不合就冷嘲热讽
参考当年 nginx 的争议,你就知道什么不该碰了
66 天前
回复了 sikuu2al 创建的主题 职场话题 焦虑!下周回来公司要求开 ai 分享会
Claude 那不就 Claude skills 么,又新又好,还符合你提升效率要求
1  2  3  4  5  6  7  8  9  10 ... 11  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3402 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 45ms · UTC 04:32 · PVG 12:32 · LAX 20:32 · JFK 23:32
♥ Do have faith in what you're doing.