V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  huangyezhufeng  ›  全部回复第 1 页 / 共 5 页
回复总数  83
1  2  3  4  5  
10 天前
回复了 rpish 创建的主题 机器学习 有什么能本地跑的机器学习项目吗?
@kid1412621 太穷了 Orz
16 天前
回复了 rpish 创建的主题 机器学习 有什么能本地跑的机器学习项目吗?
https://github.com/ai-glimpse

因为作者只有一台 16G 的显卡,所以这些基本都可以本地跑。
34 天前
回复了 huangyezhufeng 创建的主题 机器学习 BERT 论文复现: 经验 & 教训
@dryadent 👍,确实是踩过坑才知道:D
> https://datahonor.com/blog/2025/02/20/dl_book/#neural-networks-from-scratch-in-pythonnnfs

大语言模型三剑客:
Build a Large Language Model (From Scratch)
Super Study Guide: Transformers & Large Language Models
Natural Language Processing with Transformers

深度学习基础:
Neural Networks and Deep Learning(NNDL)
Neural Networks from Scratch in Python(NNFS)
Dive into Deep Learning(D2L)
Grokking Deep Learning
93 天前
回复了 jrlee1204 创建的主题 程序员 大模型学习路径求大佬指导!
“底层比较原理性的东西是否可以先跳过”
个人认为可以的

“模型微调”需要学习的东西
我建议看 Natural Language Processing with Transformers ,Huggingface 工程师写的,可以跟着敲代码,也没那么多底层细节。适合 Learning by doing.

后面想补 LLM 底层原理知识,可以看 Build a Large Language Model (From Scratch)和 Super Study Guide: Transformers & Large Language Models.

如果对深度学习基础不熟,可以先从一些基础的知识学起。比如读一下 Neural Networks and Deep Learning(NNDL)。

https://datahonor.com/blog/2025/02/20/dl_book/ 这里简单写了上面几本书和其他一些相关书籍的书评,也可以参考看下。
129 天前
回复了 xuegy 创建的主题 Python 如何分离屎山中 Union 类型的变量
其实从开始用`Union`开始,就已经把潘多拉魔盒打开了一半。再用`getattr`,几乎是不可避免地成为屎山了。

为了避免误解,补充说明一下,用`Union`和`getattr`都没问题,前提是会用。从这个半个钟的单测来看,似乎并不是如此。
@XIVN1987 这个估计难,毕竟丑那么多年了也没怎么动过:D
@twig traceback 的问题可以看 https://docs.python.org/3/library/sys.html#sys.tracebacklimit ,是可以控制的
@TrackBack 如果依赖很老的库确实麻烦。如果是因为 Python 版本的问题,可以试下类似这种[方法]( https://python-poetry.org/docs/dependency-specification/#multiple-constraints-dependencies):

```toml
[project]
# ...
dependencies = [
"foo (<=1.9) ; python_version >= '3.6' and python_version < '3.8'",
"foo (>=2.0,<3.0) ; python_version >= '3.8'"
]
```
212 天前
回复了 cnfans 创建的主题 Python 关于 Python 学习问题
https://datahonor.com/cs/programming/general/learn/?h=cs1#books

我推荐从斯坦福的 CS106A 开始学。
一般来说,搞 ML 的代码写的一般都会比较随意(无贬义),因为大部分时候没必要写那么好。根本在于代码主要是为了做实验,不需要长期维护。所以如果想找一些 best practice, 就找哪些非 ML 且长期维护的 Python 库参与贡献比较好。
230 天前
回复了 UB 创建的主题 Python 请教,关于 Python 库的接口设计
两者都不可取,建议和 redis-py 对齐: https://redis.io/docs/latest/develop/clients/redis-py/
>All responses are returned as bytes in Python. To receive decoded strings, set decode_responses=True.

也就是说把选择空间留给用户。
大家有疑问的地方欢迎到博客评论区交流~
251 天前
回复了 huangyezhufeng 创建的主题 分享创造 AIC: AI Commit Message Generator
@xiaket #6 哦哦,这个意思,我研究下看看
251 天前
回复了 huangyezhufeng 创建的主题 分享创造 AIC: AI Commit Message Generator
@arielherself 我来研究一下
252 天前
回复了 huangyezhufeng 创建的主题 分享创造 AIC: AI Commit Message Generator
@l4ever 用过不好用,所以才自己写的。而且个人有不使用这些 IDE 的使用场景。
252 天前
回复了 huangyezhufeng 创建的主题 分享创造 AIC: AI Commit Message Generator
@xiaket 是说命令从`aic`换成`git-aic`吗?这个主要是考虑能少打几个字就少打几个字
确实是这样,博客的访问量太低了。我自己的博客正经也写了七八年了,几乎没啥人看,所有加起来不如在某乎答一道题的访问量还多。不过这不妨碍我继续写,主要是写给未来的自己看。
1  2  3  4  5  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   808 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 27ms · UTC 22:17 · PVG 06:17 · LAX 14:17 · JFK 17:17
♥ Do have faith in what you're doing.