V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
alex321
V2EX  ›  Java

问一个如何在 Hadoop 中正确引入 IK 资源包的基础问题

  •  
  •   alex321 ·
    alexroyce315 · 2016-09-02 13:54:11 +08:00 · 1724 次点击
    这是一个创建于 3011 天前的主题,其中的信息可能已经有所发展或是发生改变。
    情况是这样的,由于用 PHP 做那 2000w 文字的词频提取耗时太长了,就 Google 了一下,发现 Hadoop 可以做词频分析,就在虚拟机上部署好了 Hadoop ,基本的 WordCount 跑通,然后就想着更改一下,使用 IK 来分词,下载了 IKAnalyzer2012_u6 资源包,把 IKAnalyzer2012_u6.jar 先后放在 /usr/local/hadoop-2.7.3/example 目录下、/usr/local/hadoop-2.7.3/bin 目录下、/usr/local/hadoop-2.7.3/lib 目录下,/usr/lib/jvm/java-8-openjdk-amd64/lib 目录下,结果,当我执行 ./bin/hadoop com.sun.tools.javac.Main ./example/ChineseWordCount.java 的时候,怎么来都给我下面这样的错误:
    ./example/ChineseWordCount.java:7: error: package org.wltea.analyzer.core does not exist
    import org.wltea.analyzer.core.IKSegmenter;
    ^
    ./example/ChineseWordCount.java:8: error: package org.wltea.analyzer.core does not exist
    import org.wltea.analyzer.core.Lexeme;
    ^
    请 v2er 们指教一下。。
    1 条回复    2016-09-02 18:29:52 +08:00
    apoclast
        1
    apoclast  
       2016-09-02 18:29:52 +08:00
    在虚拟机上跑 hadoop...还不如直接本机跑
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2824 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 07:25 · PVG 15:25 · LAX 23:25 · JFK 02:25
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.