我最近把自己在加密量化投研里用的一套“自动化研究流水线”整理成了一个开源项目:LLM Alpha ( llmalpha ) Repo: https://github.com/JiangZhihao123/llmalpha
它解决什么痛点?
做量化研究最耗时间的往往不是“写回测框架”,而是重复劳动: • 想一个假设 / 因子 → 写代码 → 回测 → 发现不行 → 改 → 再回测 • 更麻烦的是:回测好看不代表稳,得做 WF 、滚动窗口、看衰减、看换手成本…… 这些流程如果靠人工做,速度慢且容易漏。
llmalpha 的目标就是把这套流程自动化:让 LLM 负责提出候选(因子/信号/策略逻辑)并生成代码,让系统负责分层验证、防过拟合、以及把成功/失败沉淀成可复用的经验。
核心思路(不是端到端黑盒下单)
项目按行业更常见的方式拆成三层: Factor (因子)→ Signal (信号)→ Strategy (策略) 并且把验证写进默认流程里: • 因子层:IC/IR 、单调性、换手等(先拦住纯噪声) • 信号层:胜率/盈亏比/频率/衰减等 • 策略层:Walk-Forward ( 60/20/20 )+ 多时间段滚动一致性(尽量筛掉只在某段行情成立的东西)
此外会把每次研究的成功/失败原因写入 SQLite 知识库,后续生成假设会参考历史经验,形成闭环。
工程上都包含什么? • LLM 智能体:支持 OpenAI / Anthropic / Ollama (本地) • Binance 数据下载(异步高并发) • 向量化回测( VectorBT ) • 参数优化( Optuna ) • CLI:research / improve / analyze / backtest / kb 查询等 • 自动补数据、early-stop 等
3 分钟上手
初始化知识库:
llmalpha kb init
让 LLM 开始全自动研究(缺数据会自动下载并继续):
llmalpha agent research
指定研究目标/类别/迭代次数:
llmalpha agent research -r "创建一个使用 RSI 和 MACD 的动量策略" -c momentum -n 10
我希望收集的反馈 1. 现在的验证指标/阈值设置是否合理?有没有你们常用的更稳的做法 2. 你更希望它支持哪些数据(现货/合约、更多交易所、更多周期) 3. factors/signals/strategies 的扩展方式是否够清晰(欢迎 PR )
最后:这个项目定位是“研究工具/框架”,不做收益承诺,也不鼓励跟单。 欢迎大家拍砖、提 issue / PR 🙏