1
airyland 2011-04-11 16:10:46 +08:00
原理是什么呢?是模拟登录后抓取么?
|
2
cracker999999 2011-04-11 16:16:11 +08:00
好东西
|
3
cracker999999 2011-04-11 16:19:49 +08:00
刚试了一下 能加上答题者的名字吗
|
4
icarian 2011-04-11 16:21:08 +08:00
将此地址复制保存到标签栏,在知乎问题页面点击标签,就可以看到了,非常方便。
|
5
xiaovfight 2011-04-11 16:45:51 +08:00
用JAVA的URLConnection可以实现抓取吧,但是怎么绕过身份验证呢?
|
6
chanue 2011-04-11 19:15:54 +08:00
关键是要知道问题的id,人家登陆不了怎么知道问题的id
|
8
amyhyde 2011-04-11 19:45:51 +08:00
要是能把一些问题列出来就好了。
|
9
summic 2011-04-11 21:08:07 +08:00
应该是作者在server上用自己的帐号登录的
|
10
Kangqiao 2011-04-12 15:01:53 +08:00
刚才试了下,能看到问题和回复。
|
11
Jet 2011-04-28 03:07:04 +08:00
pyquery + httplib + cookies 就能搞定~
|
12
leogray 2011-04-28 03:08:00 +08:00
酷,就是要这种工具.
|
13
li3212848 2011-05-02 22:35:15 +08:00
没号 啥也搞不了啊 求个号去观光~ O(∩_∩)O
|
14
roymax 2011-05-08 23:04:30 +08:00
这个不错
|