@
charslee013 我的用途比较偏门,也许不合理,供参考
VARBook 项目中 Milvus 的主要作用:
1 、存储和索引库: 存储从优质代码仓库中提取的变量命名示例 (通过爬虫获取并用 AST 解析 + 文本嵌入模型转换为向量数据)。
2 、相似性搜索: 基于用户输入,找到相近的变量命名示例(利用 LLaMA 3 将中文描述转为英文索引)。
3 、上下文增强: 为 LLaMA 3 提供相关上下文,提高翻译准确性(Milvus 检索结果用于 LLaMA 3 生成变量命名含义参考 prompt)。
最终形成的 prompt 结构为:
1 、自定义的变量命名基础 prompt
2 、Milvus 检索 + LLaMA 3 生成的含义参考
3 、用户输入变量描述(英文)
主要目的是给 LLaMA 3 提供更丰富的上下文
------ 分割 ------
各个作用的参考数据(仅供参考):
1. 存储和索引库:
- 变量名: user_login_time
- 代码片段: datetime user_login_time = getCurrentTimestamp();
- 向量表示: [0.23, -0.45, 0.67, ..., 0.12]
2. 相似性搜索:
用户输入: "用户最后登录时间"
LLaMA 3 翻译: "user last login time"
Milvus 检索结果:
- user_login_time (相似度: 0.92)
- last_access_timestamp (相似度: 0.89)
- user_last_active_date (相似度: 0.85)
3. 上下文增强:
Milvus 检索结果用于 LLaMA 3 prompt:
"Consider these similar variable names:
- user_login_time: represents the timestamp when a user logs in
- last_access_timestamp: indicates the most recent time a user accessed the system
- user_last_active_date: stores the date of the user's last activity"
最终 prompt 结构:
1. 基础 prompt: "Generate a meaningful and concise variable name in English."
2. 含义参考: [Milvus 检索结果 + LLaMA 3 生成的描述]
3. 用户输入: "user last login time"