1
ShadowStar 2016-08-26 11:47:42 +08:00 1
bloom-filter
|
2
scnace 2016-08-26 12:21:26 +08:00 via Android
bloom filter +1
|
3
holyghost 2016-08-26 12:24:21 +08:00
DAT
|
4
nobodyhere 2016-08-26 12:50:46 +08:00
内容长度为 n ,关键词个数为 m ,这个单次过滤的复杂度为 O(n*m),做离线过滤还可以勉强凑合,放线上应对 QPS 就惨了
标准做法是做出 O(n*1),用 trie 树 |
5
UnisandK 2016-08-26 12:58:08 +08:00
对内容中每个字符取 md5 会爽到飞起吧
|
6
SourceMan 2016-08-26 13:04:41 +08:00
https://github.com/imaben/php-akm 只有个 PHP 版的,可以参考实现
|
7
shakoon 2016-08-26 13:19:35 +08:00
每个字符都去算 md5 ……我觉得这不会比每个关键字都去 like 一遍节约资源
|
8
NeinChn 2016-08-26 13:22:04 +08:00
有 TRIE 还是用 TRIE 吧,比 BloomFilter 靠谱
|
9
mayokaze 2016-08-26 13:38:30 +08:00
ac 自动机
|
10
dbfox OP |