1
OhmyCaptain 2014 年 2 月 13 日
selenium?
|
2
iloahz 2014 年 2 月 13 日
貌似现在能模拟浏览器渲染的就只有1L说这个吧
|
3
txlty 2014 年 2 月 13 日
phantomjs
http://phantomjs.org/ |
4
est 2014 年 2 月 13 日
IE可以。win32com
|
5
otakustay 2014 年 2 月 13 日
phantomjs和真chrome的差距还是有点的,真要抓就用selenium吧,除了效率低下外没啥缺点
|
6
manhere 2014 年 2 月 13 日
如果是win平台的话,有个命令行版网页截图工具,很好用
|
7
zhouzm 2014 年 2 月 13 日
cefpython
|
8
simapple 2014 年 2 月 13 日
python Qt webkit
|
9
ksc010 2014 年 2 月 13 日
phantomjs + casperjs
|
10
PurpleSun 2014 年 2 月 13 日
*nix平台:whhtmltopdf + pdfkit
|
11
josephshen 2014 年 2 月 13 日
http://cutycapt.sourceforge.net/
然后自己再包装一个python接口就行 |
12
gonjay 2014 年 2 月 13 日
用Chrome插件直接用js来抓取,再通过ajax给自己的数据库存起来?
|
14
keven 2014 年 3 月 26 日
python应该有相关的库或者可以直接利用的东西吧,我也在抓数据,八爪鱼采集器就是内置了一个浏览器,然后通过浏览器来进行采集的。所以ajax这些肯定是支持的。
|