V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
WildCat
V2EX  ›  问与答

如果数据量为 2G, VPS 内存只有 1G,有没有对中文支持好的全文搜索方案? ES 最低推荐为 2G

  •  
  •   WildCat · 2016-02-24 08:11:40 +08:00 via iPhone · 2488 次点击
    这是一个创建于 3195 天前的主题,其中的信息可能已经有所发展或是发生改变。
    ES or Solr 似乎是最好的两个选择,对于个人业余项目来说,用主流工具更有意义,坑也比较少。但是这两者对 RAM 对要求都不低吧?

    其他基于 C/C++ 的方案不知道有什么可以推荐的吗?比如 Sphinx ?

    简单说下需求:
    - 有比较好用的中文分词插件
    - 内存需求较低
    - 准确率一定不能低
    - 考虑未来把这个项目转化为营利性项目的情况

    感谢。
    13 条回复    2016-02-24 13:42:43 +08:00
    vibbow
        1
    vibbow  
       2016-02-24 08:16:38 +08:00 via Android   ❤️ 1
    LZ 这是要把金钱问题转换成技术问题啊……
    hellojinjie
        2
    hellojinjie  
       2016-02-24 08:21:03 +08:00   ❤️ 1
    mysql
    用二分法分词,自己建索引。

    以前的 php 论坛有些就是这么做的。
    WildCat
        3
    WildCat  
    OP
       2016-02-24 08:27:25 +08:00 via iPhone
    @vibbow 学生,没辙啊😭 以前觉得 rails 吃配置,知道我遇到了 ES
    bcxx
        4
    bcxx  
       2016-02-24 08:37:29 +08:00   ❤️ 1
    pg 吧,自己调一下分词方案应该还是能用的
    AntonChen
        5
    AntonChen  
       2016-02-24 08:46:22 +08:00   ❤️ 1
    ES 1G 也能用
    WildCat
        6
    WildCat  
    OP
       2016-02-24 08:55:54 +08:00 via iPhone
    @AntonChen 主要是担心稍微有点用户这个服务就挂掉了
    cxh116
        7
    cxh116  
       2016-02-24 09:05:53 +08:00   ❤️ 1
    把 es 跑到 OpenShift 这样的免费平台,反正 es 只需要 http 通信,完全没问题.
    当然前题是 vps 在国外.
    AntonChen
        8
    AntonChen  
       2016-02-24 09:05:58 +08:00   ❤️ 1
    看用户数量 和查询效率什么的 我也没详细测过并发 不太好说 如果你说 1000 用户 考虑分散什么的 感觉没什么问题
    wohenyingyu01
        9
    wohenyingyu01  
       2016-02-24 09:29:30 +08:00   ❤️ 1
    能用钱解决的为何要用技术解决呢,把这精力花在别的地方不是能赚更多么……
    WildCat
        10
    WildCat  
    OP
       2016-02-24 09:56:11 +08:00 via iPhone
    @cxh116 好方案,谢谢!


    @AntonChen 嗯!


    @wohenyingyu01 问题是没有钱,如何解决?
    zhjits
        11
    zhjits  
       2016-02-24 09:56:48 +08:00 via Android   ❤️ 1
    Sphinx 之类的?
    kran
        12
    kran  
       2016-02-24 10:02:10 +08:00 via Android   ❤️ 1
    mysql 本身支持中文分词好久了
    即便是旧版,也很容易实现
    wklken
        13
    wklken  
       2016-02-24 13:42:43 +08:00   ❤️ 1
    可以考虑用下 solr, 占用资源不多
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1104 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 19:00 · PVG 03:00 · LAX 11:00 · JFK 14:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.