V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
chenshiforever
V2EX  ›  问与答

请问以下大家是否有合理的解决方案来判断题目与答案是否合理?

  •  
  •   chenshiforever · 2023-09-22 02:20:00 +08:00 · 751 次点击
    这是一个创建于 439 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我最近收到了一个大型题库包,数量级是千万,题库里面存在部分脏数据,有以下几种比较典型:
    首先我的字段是 题目 选项 答案
    1 、只有题目,没有选项+答案
    2 、有题目+选项,没有答案
    3 、有题目+答案,没有选项,但是答案是 ABC 之类的
    下面难度就高了
    4 、题目选项答案,均有,但是答案是不合理的,类似于 [无,暂无,略,言之成理即可,或者一些标点符号] ,反正就是无意义的答案
    5 、第 4 点的衍生,存在答案,但是是错误答案,比如应该正确选 A ,库里面反而选的是 C(这种情况极少,但是还是存在)
    6 、。。。
    目前最基本的要求就是把 1 、2 、3 给筛选出来,,但是想不到合理的方案~求救,QAQ
    5 条回复    2023-09-22 13:39:02 +08:00
    murmur
        1
    murmur  
       2023-09-22 07:46:59 +08:00
    做在线教育么,还在筛选题库那不是完了,现在都是 AI 自动出题,你这还在纠结真题数据哪里来
    forvvvv123
        2
    forvvvv123  
       2023-09-22 09:46:24 +08:00
    着急的话,123 写正则,写上几十条估计就能解决问题了,跑几遍然后人工看一看数据再补正则;

    1234 ,长期效率高一点的方法可以训练 AI 去识别,是个明确的分类问题,训练出来后面效率高很多;

    然后,最靠谱的是人工打标,尤其要商业化的时候,质量只能靠这个来保证。
    saulshao
        3
    saulshao  
       2023-09-22 10:32:34 +08:00
    你这个问题其实很容易回答:
    判断是否合理的前提是要分析题目和答案的语义,并按照人类的标准来进行理解。

    我这么说完,你应该很容易猜出答案:
    程序是没办法的,只能靠人工。
    chenshiforever
        4
    chenshiforever  
    OP
       2023-09-22 13:36:55 +08:00
    @saulshao 人工做不到啊,太多了。。。
    chenshiforever
        5
    chenshiforever  
    OP
       2023-09-22 13:39:02 +08:00
    @forvvvv123 我也想过训练,但是这个真不会。从哪里入手都不知道,
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5420 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 08:25 · PVG 16:25 · LAX 00:25 · JFK 03:25
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.