1
ChangQin 2018-06-20 08:57:10 +08:00
有,go 程序设计语言前几节就有这个 demo
|
2
jiezhi 2018-06-20 09:01:02 +08:00
python 入门里也有这个 demo 吧
|
3
xy2401 2018-06-20 09:01:56 +08:00
mark。我之前想统计 比如 spring 文档里面 的高频词汇,感觉需求类似
|
4
yuanfnadi 2018-06-20 09:02:11 +08:00 via iPhone
Java 入门时候写过类似 demo
|
5
lhx2008 2018-06-20 09:03:36 +08:00 via Android
读进来切一下,python 可以用 counter,java 可以用 stream
|
6
NaVient 2018-06-20 09:03:40 +08:00
python --> from collections import Counter
|
7
qilishasha 2018-06-20 09:09:43 +08:00
数组长度数组长度
|
8
kingname 2018-06-20 10:18:18 +08:00
|
9
laoyuan 2018-06-20 10:26:14 +08:00
手写原生
|
10
simapple 2018-06-20 10:31:28 +08:00
nltk
|
11
soho176 2018-06-20 10:45:39 +08:00
是准备统计最近十年高考英语卷,出现频率高的单词吗?
|
12
fengche361 2018-06-20 10:59:52 +08:00
爬取+分词+wordcount ?
|
13
yuriko 2018-06-20 11:04:34 +08:00
第一反应是 MapReduce 的范例……
|
14
hyi 2018-06-20 11:19:29 +08:00
学 python 时写过一个统计英文 txt 单词词频的 python 小脚本,用的是 nltk 库,你可以参考下思路,https://github.com/Hangyi/parse_words_frequency
|
15
jyf 2018-06-20 11:32:09 +08:00
主流的爬虫一般都会统计词频 因为有个流行的算法 TF-IDF 就是拿词频作为计算基础的
|
16
woscaizi 2018-06-20 11:46:23 +08:00
写过一个类似的东西,是统计小说中 2 到 5 字的词语出现的次数,没有考虑是否是有意义的词的情况
https://github.com/pandaTED/zhihuSpider/blob/master/src/main/java/cn/panda/hello/Hello.java |
17
Tink 2018-06-20 12:14:02 +08:00 via iPhone
这点功能不如手写
|