V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  IndexOutOfBounds  ›  全部回复第 1 页 / 共 8 页
回复总数  146
1  2  3  4  5  6  7  8  
@zerofancy 感谢反馈,下个版本会着重优化细节体验
11 天前
回复了 HiBugs 创建的主题 职场话题 准备裸辞了
@weenhall5 确实,自己想,老婆也支持
@reeco 非 openai ,比如 gemini ,deepseek 也支持 json 输出的,算是一个通用的规范了

https://openrouter.ai/models?fmt=cards&order=newest&supported_parameters=structured_outputs
@otakustay 暂时不支持 function call ,不过确实有这个想法,自动注入结构体 Method
@abc634 我理解场景有些区别,markdown 是半结构化的,主要用于直接展示,比如直接让 AI 用 markdown 写篇文章,这是很好的选择

json 是开发内部使用的,比如你需要提供接口给前端做二次展示

另外通过 json schema 可以做到很强的约束,比如文中给文章分类的例子,通过 enum:"Technology,Science,Business,Health,Education,Other" 强限制分类范围
HPA 还可以基于自定义指标,比如 QPS ,这样后续维护只需要关注每个请求的资源变化就可以了
limit 一般是 Request 的两倍到四倍,太高超卖谁也用不高
Request 大概估个范围 + HPA
最近我也在推广 https://www.v2ex.com/t/1106892 ,同样惨淡哈哈,想加下老哥联系方式,交流交流经验
@doujiangjiyaozha 是的,所以单个文章长度太长就没法完了,比如论文。但感觉如果是基于新闻 chat ,每篇新闻一般不长,全文效果会好些
爬虫是不是可以加个快捷方式 “一键爬取当前网站”
@doujiangjiyaozha 好奇老哥你这个 rag ,有办法基于全文吗

比如现在 rag 搜索出来的都是 “片段”,可我希望再进一步拿到片段对应的文章,基于全部文章再 chat
22 天前
回复了 lifesimple 创建的主题 程序员 写代码老容易分心,不够专注怎么治?
@wubotao 几乎全中 😂(原谅我在挖坟
24 天前
回复了 CyouYamato 创建的主题 程序员 淘宝 cursor 涨价了
买了一个月的共享账号,不知道为啥现在用一个半月了,还能接着用😂
@pizone #19 ,#21
对你描述的这个场景我是认同的。
你提到了 “搜索关键词”,而 “向量化”可以理解为进一步支持语义搜索
知识库也可以理解为一种搜索场景,只不过他搜索出来的是片段,一篇文章拆成了多个片段,多篇文章的零散片段混在一块,肯定容易说胡话
我理解你是想拿完整文章做分析,比较能保证准确度。这个确实比较适合 rss 的场景,文章长度不会太长,没必拆开再给 ai

btw 不是给你提需求😂,只是正好我有个类似的个人项目(框架层的,不是产品层),同时也有个 Chrome 插件在推广,感兴趣可以 wx 聊一聊( glidea123 )
@pizone OP 能否支持阿里云的音色,感觉更自然些
@pizone 我也有类似的想法。主要是把 RSS 摘要打标后向量化存起来,再搞搜索推送
@Lingo2020
“访问这个网站一点动静没有”:开了自动导读的情况下复现了,过长的文章开自动导读看起来有 bug 。感谢 v 友反馈,我修复下。你可以先关闭自动,手动按下 Alt + Space 试一下
https://i.imgur.com/TfBZoch.png

“打开 gmail 网页版,如果点击右上角头像,无法再点击弹出菜单,被一个搜索框挡住” 这个没复现出来,可以截图我看看。不过确实有一些体验上的问题 gmail 这种单页应用切换界面后导读不会自动刷新
27 天前
回复了 joynvda 创建的主题 程序员 大模型服务使用推荐
代码 & 其它:Claude 3.5 sonnet & gemini-exp-1206 (嫖的 Cursor 会员
内容总结:Gemini Flash (感觉回复没有太多 AI 味,还便宜
网页翻译:DeepSeek V3
@Travers 哈哈因为我也不喜欢用不知道哪来的内置模型,多半看起来不是很聪明
1  2  3  4  5  6  7  8  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   6174 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 27ms · UTC 02:14 · PVG 10:14 · LAX 18:14 · JFK 21:14
Developed with CodeLauncher
♥ Do have faith in what you're doing.