1
yasea OP 补充一下,写爬虫的主要目的是对物流单号的 DHL 跟踪数据批量截图保存,因为官方只支持查询近 3 个月的数据。
|
2
dicc 2021-12-03 11:57:40 +08:00
add_argument data-dir 这个目录指向你 chrome 真实的数据目录
|
3
yasea OP @dicc 谢谢,中午测试了下, 依然被反爬了,有时候返回 Access Denied , 有时候返回这个:
Your tracking attempt has been blocked Please note that the tracking status information on this website is intended for human consumption via the website only. It is not intended to be used for integration with your systems. Automated extraction of information by bots, website scraping etc. is prohibited. |
4
dicc 2021-12-13 09:36:00 +08:00
兄弟,试试这个思路,我用这个思路绕过了一个网站.
https://www[.]cnblogs.com/lovealways/p/9813059.html 相当于它在启动的时候,是以用户的方式启动.但是后续可以用程序控制 |
6
janda 2021-12-15 15:29:27 +08:00
这个可以试试看
# 禁止网站识别自动化 chrome_options.add_argument('disable-blink-features=AutomationControlled') 自己可以在浏览器 console 打印下:window.navigator.webdriver 正常浏览器返回的 false 、chromedrive 的浏览器会是 true |