V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  buaacss  ›  全部回复第 2 页 / 共 5 页
回复总数  97
1  2  3  4  5  
2023 年 9 月 28 日
回复了 WhoCanBeRich 创建的主题 C++ 为什么我那么喜欢 C++??
@joyhub2140 笑死,距离产生美嘛
2023 年 9 月 14 日
回复了 sanyang001 创建的主题 Android 求靠谱敏感词过滤方案
贡献个低成本的方案

首先是分词,用 hanlp 的多语言分词模型就不错,tok 的分词效率很高。可以把自家的敏感词当作 force 字典加进去,然后对于误杀的,只要保证词长度比敏感词更长就能解决。

然后对每个分词作 ac 自动机检测,只要有一个命中就报错出来。

然后可以再做一层 zero-shot-classification ,把每个敏感词分个类,比如刀属于管制器械,但是刀剑神域是游戏,命中的时候判断刀剑神域是不是管制器械,可以进一步降低误杀概率,hg 上一大堆 zsc 的模型。随便搞一个,之后还能积累一波数据做个微调。

我们的场景相对来说没有太多敏感词,所以主要的性能消耗在 hanlp 的分词,实际运行效率非常高。10 万量级的词库,50 个 30-50 个字符的检测差不多 200-300ms 。
![4090](//i.imgur.com/DUHY6ka_d.webp) 测试
2023 年 8 月 1 日
回复了 isSamle 创建的主题 程序员 显卡拓展方案?
![4090]( https://i.imgur.com/DUHY6ka_d.webp?maxwidth=760&fidelity=grand) 上张图,架子放不下 4090 ,用乐高 diy 了一个,大小刚好合适。目前还没有烧接口。
2023 年 8 月 1 日
回复了 isSamle 创建的主题 程序员 显卡拓展方案?
https://item.taobao.com/item.htm?spm=a1z10.5-c-s.w4002-24199657618.30.665b5e772gTfaq&id=694709333551
https://item.taobao.com/item.htm?spm=a1z10.5-c-s.w4002-24199657618.20.665b5e772gTfaq&id=667265648824

他们家的扩展坞还可以的。我现在就用它接 4090 。pcie3.0 可以跑满。sd 跑图什么的很轻松。

玩儿 LLM 跑个 4bit 量化的 llma2 13b 没有问题。训练的话最高调过 13B 模型。
2023 年 5 月 24 日
回复了 buaacss 创建的主题 程序员 transformers 混合精度一定需要 Ampere 架构的 gpu 吗?
@ShadowPower 我使用的是 2080ti ,是 Turing 架构的。从我目前的测试上看,使用 fp16 会溢出,使用 bf16 按您的说法是会转回 fp32 ,会更慢。但是我确实看到加速了不少而且显存也下降了。

使用单精度,我 bs 最多只能设置到 8 ,需要大约 32 个小时训练
使用 bf16 ,我 bs 可以设置到 16 ,需要大约 16 个小时完成训练
使用 fp16 ,会直接溢出
2023 年 5 月 18 日
回复了 Jasonhhh 创建的主题 程序员 关于 gh-ost 工具
从库的所有操作是 binlog 来做的,你在主库上进行了什么操作,从库上就会一样做一次。所以复制表,复制数据,最后 rename 表都会在从库上做一次。唯一要注意的问题是主从延迟,gh-ost 有一个参数可以控制复制速度,延迟高于这个值的时候就暂停复制。
2023 年 5 月 16 日
回复了 yuyue001 创建的主题 程序员 ChatGPT 有哪些推荐的插件?
webpilot ,目前用的最多的就是这个。可以浏览互联网,提问的时候也会根据爬取的网页内容进行回答。如果在页面里有相关问题的超链接,也会爬取多个页面进行关联查询。
2023 年 5 月 13 日
回复了 buaacss 创建的主题 分享创造 让 gpt 给 oh-my-zsh 修了个陈年 bug
@scukmh 是的,omz 已经推送了更新,升级即可解决
2023 年 5 月 11 日
回复了 buaacss 创建的主题 分享创造 让 gpt 给 oh-my-zsh 修了个陈年 bug
@fkverexadmin 这个问题连 omz 维护者都解决不了,issue 列表里一大堆相关 issue 。搜一下就能看到维护者说可能是其他平台的问题,包括但不限于 iterm2 、vscode 、gnome terminal ,gpt 直接精准定位了问题。我怀疑你脑子可能有点儿问题,建议也去问问 gpt 怎么治疗一下
2023 年 4 月 5 日
回复了 fengpan567 创建的主题 程序员 chatGPT 套了 warp 都救不回来
我也是 429 ,等了一天,好了
2023 年 4 月 5 日
回复了 viewer003 创建的主题 分享创造 我用 GPT4 写了个 macOS 的云剪贴板小工具
太棒啦!
2023 年 3 月 9 日
回复了 poyanhu 创建的主题 云计算 阿里云 CEN 云企业网,价格好贵呀。
一直想和人一起合租来着,亚太专线。
笑死,现在有几个人会质疑编译器? GPT 就是自然语言编译器,大家发出的质问就像当年汇编工程师看到 c 语言一样对自己的人生产生了怀疑。
@wganbleuthall 非常正确!大家看看市场上现在有没有招聘初级汇编工程师?我这么说吧,现在市场上你能见到的数据库套皮工程师( crud boy )不管是什么后端还是前端,在 GPT 面前统统都是以前的初级汇编工程师。
其实作为 chatgpt 吹,楼上说的那些个问题,好像你请个“人"去写就不存在了呢,呵呵呵。

人不也是个黑盒,知人知面不知心的 case 还少了?

前有兄弟阋墙,后有删库跑路。

我保守预测一下,10 年内,初级工程师岗位将不复存在。
2023 年 2 月 5 日
回复了 chaleaochexist 创建的主题 程序员 RPC 和 http 相比优势在哪里?
楼上有补充强类型的,我也再来贡献各 case 。文本协议比特位翻转导致数据库更新了全表。

update xxx set a=1,b=2,c=3 where id=xxx;

被宇宙射线击中后,3 变成了#,导致后面的文本直接变成了注释

3 的二进制是 00110011
#的二进制是 00100011

第一次看到我都吓傻了
1  2  3  4  5  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2895 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 39ms · UTC 07:33 · PVG 15:33 · LAX 23:33 · JFK 02:33
♥ Do have faith in what you're doing.