先叠甲,个人看法,没有说别人做的不好,觉得不对的可以联系我删帖。
偶然看到的一个 AI DB 应用,https://zhuanlan.zhihu.com/p/648633185
看了下官网和文档挺像回事,github 的 star 还挺高,可随即我仔细看了下 SQL 就发现了错误 截图来自官方文档 https://doc.sqlgpt.cn/zh/ai/nl2sql/ 表 student_course 是没有 score 字段的。
同样的需求我用 minimax 给出了正确的答案,所以他们用的 AI 大模型可能是通用的,并不是专业的 SQL 大模型,耗时 6 个月做出来也不仔细校验 SQL 的正确性,就想着完成项目骗 star ?
我个人想法是这种用大模型加持的应用越来越多是好事,但是单纯的套皮就会出现准确性专业性的下降,这种应用的核心还是专业的模型,而不是通用的,其他体验上面的优化我觉得都是次要。作为大学生的毕设项目我觉得不错,但是在阿里开源这种项目是不是有点滥竽充数了。
最后说点个人想法,自从国外 gpt 出来后,国内的各种大模型如雨后春笋般冒出来了,别人没出来前你们是一声不吭,差距不是一般大呀,作为程序员,对所做的事会越来越没成就感吧,因为 AI 的能力越来越强了,未来我们何去何从,是不是面试的时候问一句,你会 gpt 吗?有没有懂的老哥一起讨论一下,最近 gpt 课程也是卖的越来越火,传统 JAVA 课程已经没人学了吧。我们该怎么抓住风口上的机会,还是说最终它就是一场闹剧,我们都是帮 AI 更好的工具人,作为廉价语料喂给了 AI 。
1
purensong OP 老哥们可以聊下还有哪些套皮 AI 应用,我看那个项目也早就发布了,我今天才看到....
|
2
tangtang369 2023-10-31 09:15:13 +08:00
应该用的是 chatgpt 只是自己套了一层 prompts
|
3
sunsan05 2023-11-01 17:12:58 +08:00
有些开源模型,需要自己做 RLHF 矫正或自己做大量的 QA 然后 LORA 一下。比如开源项目 CHATRWKV 。
这些基础模型里面已经有过一定量的 SQL 文本录入,所以矫正起来还是有空间的。 |