1
kslr 2015-07-24 01:11:26 +08:00 via Android
太白,没法讲,去看基础吧。
|
2
Tink 2015-07-24 01:28:26 +08:00 via iPhone 1
登陆就模拟登陆呗,表格里取值xpath不行?
|
3
em70 2015-07-24 01:30:32 +08:00 1
1. 登录的原理无非就是GET或者POST一个数据给服务器,成功后返回一个值保存cookie,我们知道这个原理后,模拟登录就行了,网上这种代码和资料一大把.基础的不能再基础的东西.
2.无论如何, 返回总是一个网页,去分析这个网页的HTML代码就能拿到需要的东西. @kslr 说得对. 应该先去看基础,知道网页是怎么制作的,网络协议是什么东西,还没学会走就开始飞,人都没法跟你交流. |
4
zencoding 2015-07-24 08:46:59 +08:00 1
curl + xpath
|
5
xzem 2015-07-24 09:29:24 +08:00 via Android
如楼上几位所言,但我觉得楼主还是直接用火车头这类的采集软件吧,绝对比你研究php来的快,可定制性肯定受限就是了
|