V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  SSang  ›  全部回复第 2 页 / 共 11 页
回复总数  209
1  2  3  4  5  6  7  8  9  10 ... 11  
2025 年 9 月 5 日
回复了 laijh 创建的主题 Local LLM 个人电脑,适合跑哪个本地大模型?
看看 ggml 的模型: https://huggingface.co/collections/ggml-org

ggml-org/Qwen3-0.6B-GGUF
ggml-org/Qwen2.5-Coder-0.5B-Q8_0-GGUF
ggml-org/gemma-3-270m-GGUF
2025 年 9 月 5 日
回复了 Noby 创建的主题 Local LLM 目前哪个大模型适合本地部署用来纯翻译?
如果一定要本地的话,可以看看 ggml 的 0.5B 模型,我感觉这个是真有点东西,我本地补全用的 qwen2.5-coder:0.5B ,i3-14100 的 CPU ,占用 30% 左右,也能做到 1s 左右的响应时间。
2025 年 9 月 5 日
回复了 Noby 创建的主题 Local LLM 目前哪个大模型适合本地部署用来纯翻译?
qwen2.5:3b 都跑不动的话,其他模型应该也不太行了,不然试试 qwen2.5:0.5b ?不然还是调用 API 吧,API 调用的话 qwen2.5-7B 基本上能做到秒级的翻译了。我视频字幕实时翻译和网页翻译现在用的就是 qwen2.5-7B (调用 siliconflow 的 API )
2025 年 9 月 5 日
回复了 SSang 创建的主题 Local LLM 大语言模型中规模和模型大小的关系?
@dyexlzc 你问大模型,他只会回答你一堆“可能”

qwen 回答说:Q4_K_XL 使用了更智能的权重分组方式,能够用更少的参数达到相同的精度
claude 回答说:在 GGUF 中,K 系列的 XL 实际上可能指"eXtra Low precision"

这让我怎么敢相信。我需要的是准确的回答。

另外你的回复也不是我问的问题。
Niz66 有 35g 的胶腕。
但他不是 HHKB 配列,我是:

1. ESC 改到 CapLock (因为 Niz66 还有保留 Ctrl )
2. Backspace 换 2U ,需要拆机剪胶腕

关灯续航应该达不到 1200h ,我工作用,好像是一个月一充吧,对我来说感知很小,所以也没啥印象多久充一次

键帽问题,我是买那种按斤卖的无刻键帽垃圾包,从里面单独找两个按键,因为根本不可能有 1.75U 的 ESC ,我单独找了一个 1.75U 的黄色的无刻 R2 来当 ESC 。单独一两个键帽还是好找的。剩下的买套件。

或者可以试试 3D 打印单独的几个键帽。
2025 年 8 月 1 日
回复了 Dg3gWjbFvvq 创建的主题 程序员 大家是怎么保持工作之外的“技术热情”的?
换个语言(手动狗头)
2025 年 8 月 1 日
回复了 connecting 创建的主题 程序员 是使用 openai api 的 tools 参数,还是自己写提示词
先用默认的呀,哪个你觉得不满意再去调整他
其实你这些话直接在面试时候说就好了,如果他不认同,那两边理念不符合,那就直接走。
2025 年 7 月 24 日
回复了 rehoni 创建的主题 程序员 怎样才算是一个优秀的微服务
@cookii 别急,我还没说完呢。喊 “微服务已死” 的那波人,大多都是小公司,小团队,我想说的是,微服务是不会死的,死的是那些用着微服务的小团队。
2025 年 7 月 24 日
回复了 rehoni 创建的主题 程序员 怎样才算是一个优秀的微服务
微服务设计本身并没有优劣之分,只有适合和不适合。团队有三四个人时,或服务规模扩张时,大单体可以拆成小单体,避免代码的互相腐蚀。再随着规模扩大,小单体可以拆的更小,就变成了微服务。

微服务更多的是反应的团队协作问题,而在架构设计上,微服务理念并不一定是直接体现在服务拆分上的。

事实上,你可以看看主流的架构,无论哪个架构,都在提倡 “高内聚、低耦合”,所以,微服务的 “思想” 并不是一个专利,你仍然可以在单体服务上贯彻微服务理念。“解耦本身就是优秀”

至于你说的独立库,更多的是管理上的东西,你看 K8S ,也在使用巨型仓库,但他们有优秀的上下游管理自动化脚本。所以不是说你独立了仓库就一定是最好的,工程化不是一套公式就能打完的。

而你说的分布式、可扩展,这更多的是服务拓扑,你总不能说大单体就不能分布式,就不具备扩展性,很多设计优秀的大单体,他的扩展性能远超微服务。
2025 年 7 月 24 日
回复了 rehoni 创建的主题 程序员 怎样才算是一个优秀的微服务
康威定律说:organizations which design systems ... are constrained to produce designs which are copies of the communication structures of these organizations. — M. Conway (一个组织的系统通常被设计成这个组织通信结构的副本)

微服务起源与大型团队多人协作,你先看看你的团队有几个人。如果就两个开发有什么可微的呢?

我相信,b 站,京东,阿里,一定还用着微服务架构,因为这能解决他们的问题,但对于你的团队呢?能解决什么问题?你不知道怎样的微服务才算优秀,那你有没有考虑过你们团队,你们的项目根本不适合使用微服务呢?
2025 年 7 月 24 日
回复了 rehoni 创建的主题 程序员 怎样才算是一个优秀的微服务
“微服务已死” 虽然说的有些严重了,但并没有太多夸张的成分。服务架构永远不可能存在公式,你的需求千奇百怪,资源也在不断变化。如果你的问题原本的架构解决不了,那换成微服务,大概率也解决不了。没有任何一个架构是银弹,有的只是符合当下需求。
2025 年 7 月 24 日
回复了 rehoni 创建的主题 程序员 怎样才算是一个优秀的微服务
微服务就不可能优秀
2025 年 7 月 15 日
回复了 61366756 创建的主题 Go 编程语言 go 语言大佬请看过来
go 的主流是不用框架,你看哪个出名的开源项目是用框架的
如果你只是要改代码,那你直接上手就行了,gozero 虽然很屎,但是他至少代码结构还算是清晰的,你只有 crud 的功能的话,直接上手改就好了。如果你还没开始写,那我劝你别用框架。

如果你一定要用框架,protobuf 和 graphql 是值得研究的。否则,Gin ,gorilla/mux 就已经足够了,别搞花里胡哨的。
你要是公司要求当我没说,你要是自己想学,我不能理解为什么你会对一坨史山感兴趣。
2025 年 7 月 15 日
回复了 61366756 创建的主题 Go 编程语言 go 语言大佬请看过来
protobuf echosystem
如果你是某个插画团队的管理层,你这套工程化方案可以说是非常无敌了。只可惜你是想要创业。
NCE 的意思是,只是能运行是相对简单的,但这只是概念验证,并没办法实际落地。

但 NCE 举得例子不好,因为大多数人并不理解 L3 的定义,L3 自动驾驶是指有条件自动驾驶( Conditional Driving Automation ),这是 SAE (美国汽车工程师学会)定义的自动驾驶分级标准中的第三级。他在广义上指在特定条件下,车辆可以完全自动驾驶。

我只是要实现特定条件的完全自动,就能说实现了 L3 ,这当然简单了。但你只是实现了你就敢卖吗?做出来和做好,是有很大的差距的。

当然有些东西做出来就能用,就能开始卖钱了,但也有很多东西仅仅是做出来,是没办法真正投入生产的。
2025 年 3 月 31 日
回复了 SSang 创建的主题 问与答 翻译模型哪家强?
Qwen2.5 我用的 SiliconFlow 的 Qwen2.5-7B-Instruct ,我感觉速度还不够,支撑不了 Potplayer 实时翻译,并且经常会夹杂英语和繁体,比较迷惑,对与一些俚语基本上没有识别能力。

@mumbler @BenX 感谢,我会尝试一下 Gemma3 和 Phi-4

@relaxchen SakuraLLM 我好像经常有听说,我也去尝试一波,不过我的代理商似乎没提供这个模型,你是用 ollama 或 vllm 部署吗?

@0x400 Grok 用起来感觉怎么样,我确实也被敏感词困扰,特别是看美剧,那敏感词一多,直接就开始乱翻了。

@SkywalkerJi Deepseek 这种思维链模型实在是太慢了,用在翻译有点浪费。

顺便补充一下我的使用场景:
- Potplayer 实时翻译( https://github.com/Felix3322/PotPlayer_Chatgpt_Translate )我觉得这个的 Prompt 可能稍微也有点问题,有空也再研究研究。
- Goldendict 单词翻译( https://github.com/gitsang/goldendict-llm )我自己随手写的,还在优化
- 网页翻译(沉浸式翻译 Chrome 插件)我愿称之为最强全文翻译
1  2  3  4  5  6  7  8  9  10 ... 11  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2419 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 26ms · UTC 06:12 · PVG 14:12 · LAX 22:12 · JFK 01:12
♥ Do have faith in what you're doing.