V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  qieqie  ›  全部回复第 2 页 / 共 10 页
回复总数  182
1  2  3  4  5  6  7  8  9  10  
就算标准库内置了,在发布的时候不也得搞定其它库的依赖吗,除非你依赖的第三方都是源码形式的库。
还是写一个 release 的时候 ldd 然后打包依赖的脚本吧,最后 LD_LIBRARY_PATH 一下。
195 天前
回复了 KingCoding 创建的主题 程序员 求助:大模型如何处理大量工单数据
找一个最小体积的模型比如 qwen 0.6B/ 1.7B ,拿你历史上跑过的数据微调一下
196 天前
回复了 chouqiu 创建的主题 程序员 如何让 AI 稳定的输出指定 json 结构
现在 vllm, sglang 这些推理端点的结构化输出可以直接用 cfg 状态机制导,屏蔽掉不符合语法规则的 token 输出。
基本概念有误,神经元的数量和神经连接的数量不是一个概念。如果要和 LLM 比,一个 N 输入 M 输出的线性(全连接)层是 N * M ,而不是 N+M
论坛形式的那一批乐器/音乐制作网站早就完了,一般最后沦为装备讨论和交易平台。
如果你之前用的 aistudio 的,可以试试谷歌云 vertex ,会视使用量开放 rate limit 上限。
@seth19960929 看看 sys.path
@seth19960929 vector 还需要一个把 size()传到 c 接口,要不可能访问越界。另外就是注意 vector 本身的作用域,很可能把指针传给你的 python 之后 vector 就析构了。
ModuleNotFound 一般是没有__init__.py 或者用了相对 import 之类的问题。
ctypes 只能用 c api ,你需要在接口上把 vector<double>换成 double*和 size_t
260 天前
回复了 SlanWyf 创建的主题 OpenAI 大模型 API 和官网月费的能力是不是差别很大
模型能力当然是 api 比 chat 上限高。但 chat 会有一些内置的小工具,比如文件/画图/搜索,对不懂 api 那一堆参数是干嘛的普通用户更方便。
@flyqie 大吞吐量下的内存分配、拷贝、GC 的压力。从 c++程序员视角来看,标准库里不符合预期的内存操作太多,不止是 net ,也包括 buffer, compress, hash 等等相关的库。
chat 参数是固定的,且一般都有软性上下文和输出长度的限制。
有一些能力只有 api 有,比如 tools, structured_outputs, 中间补全等等。
@bbao 天天糊屎山的 CRUD 仔确实用不上。之前我把某知名开源分布式存储的 http 组件从标准库重构到 fasthttp ,整体吞吐至少提升了 15%
288 天前
回复了 cat 创建的主题 问与答 DeepSeek 一直不稳定,为啥不推出付费渠道?
不在乎 c 端用户那三瓜俩枣
建议 Inference 额外显存里加上最大 context length 作为参数。
先把语言 spec 定稿写出来,有没有可能 parser generator 搞不定的语法从设计上就是错的?
技术路线不一样:有需要配合的灵动活体(做一系列眨眼、摇头之类的动作),不需要配合的炫彩、深度活体,早年还有一系列边框、摩尔纹检测的。
自驾去西藏的话,规划好每天在低海拔地区休息,高反几率不高。
Datagrip, DBeaver 这些早就支持 duckdb 了
2024-06-19 23:05:08 +08:00
回复了 wueryi 创建的主题 Elasticsearch 请教个 es 向量查询的问题
ES knn 性能就是低的匪夷所思,甚至比 ssd ondisk 索引方案还低一个数量级。
1  2  3  4  5  6  7  8  9  10  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5618 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 35ms · UTC 03:02 · PVG 11:02 · LAX 19:02 · JFK 22:02
♥ Do have faith in what you're doing.