这是一个创建于 3011 天前的主题,其中的信息可能已经有所发展或是发生改变。
情况是这样的,由于用 PHP 做那 2000w 文字的词频提取耗时太长了,就 Google 了一下,发现 Hadoop 可以做词频分析,就在虚拟机上部署好了 Hadoop ,基本的 WordCount 跑通,然后就想着更改一下,使用 IK 来分词,下载了 IKAnalyzer2012_u6 资源包,把 IKAnalyzer2012_u6.jar 先后放在 /usr/local/hadoop-2.7.3/example 目录下、/usr/local/hadoop-2.7.3/bin 目录下、/usr/local/hadoop-2.7.3/lib 目录下,/usr/lib/jvm/java-8-openjdk-amd64/lib 目录下,结果,当我执行 ./bin/hadoop com.sun.tools.javac.Main ./example/ChineseWordCount.java 的时候,怎么来都给我下面这样的错误:
./example/ChineseWordCount.java:7: error: package org.wltea.analyzer.core does not exist
import org.wltea.analyzer.core.IKSegmenter;
^
./example/ChineseWordCount.java:8: error: package org.wltea.analyzer.core does not exist
import org.wltea.analyzer.core.Lexeme;
^
请 v2er 们指教一下。。
1 条回复 • 2016-09-02 18:29:52 +08:00
|
|
1
apoclast 2016-09-02 18:29:52 +08:00
在虚拟机上跑 hadoop...还不如直接本机跑
|