1
xsseroot 2016-06-24 11:47:10 +08:00
将商圈的 url 和 name 做个 hash ,写到 redis 中每次判断下不就行了。
|
2
jatesun 2016-06-24 14:27:58 +08:00 via iPhone
可以放到线程安全的 hash 表里
|
3
chendajun 2016-06-24 14:31:15 +08:00
把抓过的 URL md5 一下,写到 redis , mongo 等。每来一个 URL 就与库里比较一下
|
4
hwsdien 2016-06-24 17:49:41 +08:00
把采集过的 url 放进 redis, 每次采集判断一下。
|
6
practicer 2016-06-29 14:23:29 +08:00
尽管让重复的 item 插进数据库,活干完后 SELECT DUMPS 掉
|