ps : 这俩还在更新吗..
pg 的中文分词需求感觉蛮大的啊。哪里有好的社区可以求指导咩
1
ptsa 2021 年 6 月 28 日
更新不频繁。 应该都能用
|
3
MinQ 2021 年 6 月 29 日
https://ai.tencent.com/ailab/nlp/en/embedding.html
可以把这里面的词抽出来作为词典,质量还是很高的 |
5
MinQ 2021 年 6 月 29 日
@dzdh 不需要,下载下来是一个训练好的文件,里面是词+对应的词向量的形式
读到内存里(可能需要至少 16G 以上的内存),然后把词库提取出来给 jieba 用 https://www.biaodianfu.com/tencent-word-embedding.html |