V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Folder  ›  全部回复第 7 页 / 共 11 页
回复总数  215
1  2  3  4  5  6  7  8  9  10 ... 11  
@cleverstronger #168 零零散散写了半天, 然后告诉我要注册才能提交...
356 天前
回复了 jiuzhougege 创建的主题 生活 久病成医了都
@kk2syc
@jiuzhougege #15
确实, 楼主说的这些症状我都有, 但是我几乎不吃零食不喝饮料.
2024-12-24 18:18:23 +08:00
回复了 CoreRax 创建的主题 问与答 纯好奇,《来自深渊》算不算是一种邪典作品?
看完黎明卿感觉神作,等了好久续作一出来就去看,结果看了一半看不下去了。不知道是我变了还是动画方向有点变化,感觉有点刻意猎奇……
@cleverstronger #35 好好, 已注册🥰
YXZhZmx5QHRydXN0eWxpbi5jb20=
一直在用 Simple Translate, 很简陋, 一直想换了.
2024-12-06 15:00:20 +08:00
回复了 mereith 创建的主题 开源软件 写开源项目被骂了
我这几天也遇到个这样的老外. 讲了半天道理, 发现最好的办法是不回复. 不回了之后他还急得去其他回复里跟别人说我怎么样😂.
几天后去看下, 发现他已经被点踩点到负了.
可以参观下: https://www.reddit.com/r/computervision/comments/1h35tpi/comment/lztupov/
2024-12-06 14:53:54 +08:00
回复了 mereith 创建的主题 开源软件 写开源项目被骂了
@CEBBCAT 访问不了啊. 是被 D 了吗?
2024-11-27 08:15:18 +08:00
回复了 wkong 创建的主题 程序员 项目开源一年,终于 3000 star 了,截图纪念。
试了下 demo, 用户名随便就写了个 114514, 结果进去发现里面的人全是野兽先辈数字笑死 https://i.imgur.com/GBsc04u.png
2024-11-23 20:59:55 +08:00
回复了 Folder 创建的主题 算法 C++如何优化矩阵乘法 gemm
@dingyaguang117
你是说它们不是传统的 C=AB, 而是用了 Strassen/Winograd 之类的方法减少了复杂度吗?
2024-11-23 17:01:03 +08:00
回复了 Folder 创建的主题 算法 C++如何优化矩阵乘法 gemm
@foool #19
非常感谢你的回复.
1. 最大 GFLOPS 这个我没算, 是以 openblas 的为目标优化的 (试过别的库, 有比 openblas 更快的).
2. 3. 很好的建议, 我回头再优化测试看看.
4. 我是脚本跑 100 次取最优值的.
5. 使用 schedule(static)是因为 for 循环中每次计算量近似才用的, 不过我试过去掉这个, 其实性能基本没区别.
2024-11-23 15:32:41 +08:00
回复了 Folder 创建的主题 算法 C++如何优化矩阵乘法 gemm
@tankeco
是的, 这点我也觉得要花时间想下怎么减少 index.
其实已经优化过一次 index 了, 现在保留的都是为了分块和区分多线程访问空间的, 后面个人感觉这不是影响速度的最大的因素就没继续花心思了.
2024-11-23 15:19:36 +08:00
回复了 Folder 创建的主题 算法 C++如何优化矩阵乘法 gemm
@toma62299781
感谢分享
2024-11-23 14:17:03 +08:00
回复了 Folder 创建的主题 算法 C++如何优化矩阵乘法 gemm
@WonderfulRush
刚看完这篇文章然后看到你的评论...
那个文章挺好的, 但是技术部分讲得有点简略, 而且其实很多提到的技术我已经用了, 比如 blocking, simd 等等.
2024-11-23 13:34:57 +08:00
回复了 Folder 创建的主题 算法 C++如何优化矩阵乘法 gemm
@Donaldo ppt😂
2024-11-23 12:08:45 +08:00
回复了 Folder 创建的主题 算法 C++如何优化矩阵乘法 gemm
@AirCrusher 谢谢分享, 这个有点猛汇编都用上了, 我回头看下. 其实后面我看过类似的就是 flame 的教程, 基本上里面的技术都应用到了已经.
2024-11-23 12:05:17 +08:00
回复了 Folder 创建的主题 算法 C++如何优化矩阵乘法 gemm
@nagisaushio 这个确实有一些帮助, 不过只能提升一点点大概 0.1GFLOPS 吧, 还是和 openblas, blis 这些有断档的差距. 感觉更多还是算法设计方面的问题, 这部分不知道该怎么做了.
2024-11-23 11:59:43 +08:00
回复了 Folder 创建的主题 算法 C++如何优化矩阵乘法 gemm
@elfive #2 什么库不重要, 主要是想自己优化 gemm 来学习一下. 实际项目中会都测试一边选性能最好的用的.
2024-10-31 14:29:50 +08:00
回复了 wkj89 创建的主题 Apple 3580 拿下 Mac Mini M4
好帅的结账单啊
1  2  3  4  5  6  7  8  9  10 ... 11  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   919 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 28ms · UTC 23:22 · PVG 07:22 · LAX 15:22 · JFK 18:22
♥ Do have faith in what you're doing.