V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
TONYHEAD
V2EX  ›  问与答

觉得Gmail里面的搜索并不如想象中的强大。

  •  
  •   TONYHEAD · 2012-02-14 16:33:32 +08:00 · 3573 次点击
    这是一个创建于 4658 天前的主题,其中的信息可能已经有所发展或是发生改变。
    Gmail网页版,在一些英文加数字的字串中搜索表现较弱。

    例如我有封在inbox里的邮件,主题和正文均包括 MSKU1234567 ,但无论我分别搜索MSKU, 1234567或是MSKU1234567 ,均回答搜索不到。包括加上in:anywhere 来搜索也一样。

    而搜索一些please, customer之类的单个英文单词或者是短语please let us know if却没有问题。

    大家可以随便找点词语搜索一下自己的Gmail吗?例如英文和数字夹杂的收据号码什么的,看看搜索效果如何。
    6 条回复    1970-01-01 08:00:00 +08:00
    sobigfish
        1
    sobigfish  
       2012-02-14 16:41:20 +08:00
    很诡异
    比如我搜“件为”搜不到,搜“附件为” 就可以.
    sobigfish
        2
    sobigfish  
       2012-02-14 16:43:47 +08:00
    数字7位搜不到 8位搜的到,貌似是他们索引的问题。
    Errpt
        3
    Errpt  
       2012-02-14 16:47:02 +08:00
    分词技术阿,一般的分词都是按照辞典里面有的词来建索引的。
    ayanamist
        4
    ayanamist  
       2012-02-15 01:07:01 +08:00   ❤️ 1
    如果知道这种海量数据的搜索其实是按索引搜索而不是真正的全文搜索,那就能理解这种情况。
    对于英文,按照英文习惯,以空格分词,可以匹配所有已知未知的单词,除非这个单词内包含有其它已知的高频单词,否则不可能匹配到,因为不可能无限分词。
    中文的问题更为复杂,因为中文里没有空格作为自然分词符,所以只能依赖大词库。所以长久以来中文分词一直效果不好。
    Echoldman
        5
    Echoldman  
       2012-02-15 10:10:36 +08:00
    非常同意,确实用着好!
    xiangheka
        6
    xiangheka  
       2012-02-15 13:17:20 +08:00
    gmail 也不支持 html写信
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2765 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 12:02 · PVG 20:02 · LAX 04:02 · JFK 07:02
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.