1
sophie2805 OP |
2
irgil 2015-06-26 19:58:53 +08:00 via Android
这跟你是不是妹子有什么关系
|
3
hansnow 2015-06-26 20:00:54 +08:00 1
用requests.Session()试试
|
4
hahasong 2015-06-26 20:19:25 +08:00
不爆照然并卵
|
6
cc7756789 2015-06-26 20:37:03 +08:00 1
论坛是否有验证码?另外用request要简单很多,也容易判断哪里可能出错。
|
7
sophie2805 OP |
8
sophie2805 OP |
9
sophie2805 OP @cc7756789 没有验证码,问题解决了,多谢
|
10
mystryl 2015-06-26 21:49:42 +08:00
@sophie2805 http://wuchong.me/blog/2014/04/24/easy-web-scraping-with-python/ 我看这个帖子,研究两天写了第一个爬虫,无python基础。。就学过大学的C
这两天停不下来写到第三个了,还整合了TelegramBot做推送,python真好玩! |
11
sophie2805 OP @hansnow 试过了,登陆成功了,但是后面post回帖的时候,还是提示未登陆 = =#
|
12
sophie2805 OP @sophie2805 试过了,登陆成功了,但是后面post回帖的时候,还是提示未登陆 = =#
|
13
sophie2805 OP @hansnow requests.Session( )不是可以保持连接的吗
https://gist.github.com/sophie2805/c2e77d61eed2bfdd7f3a 8d41cd5f <?xml version="1.0" encoding="utf-8"?> <root><![CDATA[抱歉,您尚未登录,没有权限在该版块回帖<script type="text/javascript" reload="1">if(typeof errorhandle_fastpost=='function') {errorhandle_fastpost('抱歉,您尚未登录,没有权限在该版块回帖', {});}</script>]]></root> |
14
hansnow 2015-06-26 23:57:30 +08:00 1
@sophie2805 把header增加一些呢?尽量做到和浏览器发出的请求完全一样
|
15
sophie2805 OP @hansnow 试过了,还是提示未登陆,难道挖财这个bbs登陆后,在页面间跳转,sessionid会变?!
|
16
crab 2015-06-27 00:47:10 +08:00 1
登录后成功后返回的数据<script type="text/javascript" src="。应该是JS没跳转导致,这边的路径你取出来,再去请求一次,就可以了。
|
17
sophie2805 OP @crab 原来如此,已经OK了!谢谢螃蟹兄。之前一直都没有在意登陆post之后的这两个get~~~
|