如何从头构建一个自己的大模型呢?从底层最基础的神经网络开始实现 lenqu • 5 天前 • 最后回复来自 me007 | 8 |
LLM 静态批处理和 Continuous Batch 相关疑问的求解 huc2 • 5 天前 • 最后回复来自 bug2018 | 7 |
有没有久坐提醒类服务,最好是基于啥啥啥模型的那种活体检测。 YaD2x • 9 天前 • 最后回复来自 cutecore | 13 |
LLMs 文本标签(分类)任务怎么做比较好? CNYoki • 11 天前 • 最后回复来自 mumbler | 5 |
能推荐个偏实战的 tranformer/LLM 的课程么? ttgo • 11 天前 • 最后回复来自 TimePPT | 3 |
深度学习在自己电脑上跑, Linux 环境,选择 WSL 还是物理机 Ubuntu? jiashuaibei • 19 天前 • 最后回复来自 jiashuaibei | 12 |
CUDA 搞深度学习, 1TB 的一块硬盘, C 盘留多大合适? jiashuaibei • 18 天前 • 最后回复来自 Kazetachinu | 26 |
怎么理解 RNN 循环神经网络工作原理? James369 • 20 天前 • 最后回复来自 James369 | 12 |
ReLU 函数在 x> 0 的时候也是线性的,套 ReLU 函数是怎么实现激活作用的? lisisi • 26 天前 • 最后回复来自 sanebow | 4 |
阿里新开源的 QwQ-32B-Preview 模型有啥特殊性? cowcomic • 50 天前 • 最后回复来自 cowcomic | 4 |
上楼梯的时候,人是怎么判断脚该抬多高的 abcfreedom • 52 天前 • 最后回复来自 8355 | 47 |
小白求教,输入语音指令输出统计图表这样的功能是否可以实现? jiangziheng • 59 天前 • 最后回复来自 mazyi | 1 |
狗东 cfe 滑块验证码轨迹模拟 KingZZZZ • 91 天前 • 最后回复来自 naythefirst01 | 1 |
能分享一下研究大模型微调的技术论坛和站点吗? nyxsonsleep • 94 天前 • 最后回复来自 nyxsonsleep | 2 |
有没有针对机器学习“图片训练集”的管理软件? andforce • 101 天前 • 最后回复来自 jeremyl313 | 2 |
[请教][内存问题]Flux 部署 liu731 • 116 天前 |
有深度学习交流群吗?没有我拉一个 Chihiro316 • 134 天前 |
关于 immich 机器学习智能搜索的疑问。 monkey110 • 134 天前 • 最后回复来自 To5tE | 3 |