首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
215.84
546.46
V2EX
›
Claude
我用来测试 AI 准确度的问题:「SNES 游戏宇宙巡航机的英文名是?」
Livid
·
PRO
·
1 月 31 日
· 1346 次点击
这个问题甚至 Sonnet 4.5 都会答错。
如果是用其他 Local LLM ,会得到更离谱的瞎编答案。
测试
问题
答案
9 条回复
•
2026-01-31 19:26:48 +08:00
1
incubus
1 月 31 日
1
你会不会骗别人粘贴大模型的回复然后给封号[狗头]
2
xuromky
1 月 31 日
这是正确的答案吗
3
Livid
MOD
OP
PRO
1 月 31 日 via iPhone
@
xuromky
Gradius III 是正确答案。
4
sgt
1 月 31 日
随手用 gemini3pro 测了一下,得到正确答案
@
Livid
5
Tink
PRO
1 月 31 日
开启思考模式试了一下手边的几个 AI , 基本都 OK
6
Kudos
1 月 31 日
7
rayyume
1 月 31 日
openclaw + google-gemini-cli/gemini-3-pro-preview 回答正确
8
wwhc
1 月 31 日
1
本地部署的 Qwen3-next-80b 可以回答出是 Gradius III
9
Silent7Wang
1 月 31 日
deepseek 没开搜索也答出来了
关于
·
帮助文档
·
自助推广系统
·
博客
·
API
·
FAQ
·
Solana
·
2644 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 22ms ·
UTC 12:11
·
PVG 20:11
·
LAX 04:11
·
JFK 07:11
♥ Do have faith in what you're doing.
❯