V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  est  ›  全部回复第 20 页 / 共 642 页
回复总数  12830
1 ... 16  17  18  19  20  21  22  23  24  25 ... 642  
240 天前
回复了 pinkbook 创建的主题 汽车 求助:小米 su7 与沃尔沃 s60 如何选择
@ThomasKim eπ007 底盘看评测都说稀烂。
245 天前
回复了 JWilling 创建的主题 小米 对于小米汽车此次事件的一些思考
我也写了 。。 /t/1123237
小米这事,哪里有证据不能打开车门了?都直接撞失能了吧。
260 天前
回复了 zyp38263547 创建的主题 宽带症候群 中国联通申请了 PCDN 识别的专利
说白了就是吃了核心网的流量,不管你什么技术,都封杀。
你用 cloudflare argo 跑反代就行。主机不要监听公网端口。
264 天前
回复了 nealHuang 创建的主题 Apple 发现 Mac 自带了网络质量测试工具
% networkQuality
==== SUMMARY ====
Uplink capacity: 829.894 Kbps
Downlink capacity: 388.094 Mbps
Responsiveness: Low (1.101 seconds | 54 RPM)
Idle Latency: 92.458 milliseconds | 648 RPM


这也太搓了。
265 天前
回复了 seekseat 创建的主题 职场话题 硬件工程师待遇为何不如软件工程师?
如果硬件工程师考虑地球上一个地方温度条件不足怎么办?他可能会综合地理,纬度,气温,洋流等等,最后小心翼翼设计一套复杂的暖通工程

软件工程师:replace(太阳, 更大的太阳)
266 天前
回复了 heyjianjun 创建的主题 电动汽车 买车决赛圈极氪 001 还是蔚来 ET5T
byd 发布 5 分钟充电 400km 了。。蔚来危。。。。
另外再说一个简单的 token 吐字效率计算。大语言模型你可以看成所有参数都需要顺序激活一次参与计算,假如 7G fp32 的 LLM 每一秒钟输出一个 token ,就至少需要 28 GB/s 的显存带宽。
7B == 7,000,000,000 ,得到 7G 。每一个参数 4byte (fp32) 那么就需要 7x4 == 28GB 显存

用了 fp16 优化就只需要 14GB 显存。用 int8 量化就需要 7GB 显存,用 int4 量化就需要 3.5GB 显存

当然 transformer 还有很多其他的各个环节提升,这里 x4 x2 x1 x0.5 可以进一步打折优化。这里只是一个大概的计算
@julyclyde 我名字记这么准确,那我肯定知道自己在说什么。
归根结底还是实名制

实名制归根结底还是 周济 干出来的第一发。
windows 吗?不开多个系统用户账号?
**物业费 (含公摊)** 每月 1680 元


靠。。
1 ... 16  17  18  19  20  21  22  23  24  25 ... 642  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5810 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 82ms · UTC 02:05 · PVG 10:05 · LAX 18:05 · JFK 21:05
♥ Do have faith in what you're doing.