V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
valkyrja
V2EX  ›  问与答

如何实现快速中文搜索?

  •  
  •   valkyrja · 2017 年 5 月 11 日 · 1756 次点击
    这是一个创建于 3189 天前的主题,其中的信息可能已经有所发展或是发生改变。
    有 500 条中文字符串需要在 13 万条的备选数据里检索相似度最高的五条,请教大佬们有好的实现方法吗?目前的思路是用 bk tree 来做,不知道是否可行?
    3 条回复    2017-05-12 00:43:10 +08:00
    valkyrja
        1
    valkyrja  
    OP
       2017 年 5 月 11 日 via Android
    标题好像打错了😂是中文近似匹配
    luxinxin
        2
    luxinxin  
       2017 年 5 月 12 日 via iPhone
    得看近似是什么样的近似了,编辑距离是一种近似,同义词也是近似,两者实现的难度完全不一样
    valkyrja
        3
    valkyrja  
    OP
       2017 年 5 月 12 日 via Android
    @luxinxin 谢谢大佬 我指的就是编辑距离 不需要同义词 所以想到了 bk 树 不知道中文用这个方法靠谱吗
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   4320 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 09:41 · PVG 17:41 · LAX 01:41 · JFK 04:41
    ♥ Do have faith in what you're doing.