目标网站: http://ccgp-gansu.gov.cn
无头版本 Chrome 浏览仅返回<html><head></head><body></body></html>
,和真实浏览器返回的内容完全不一样,请问大神问题出在什么地方?
1
pelloz 2022-01-08 22:40:30 +08:00
问题出在你不应该爬网站,更不应该爬 zf 网站。你这个问题或许监狱有狱友可以教你。
|
2
ClericPy 2022-01-08 22:41:45 +08:00
好大一坨 JS... 还老是跳 dns 找不到 ip... 这是反爬还是别的
|
3
ALTER2333 2022-01-08 22:41:59 +08:00 via Android
假如无头是指无 User-Agent 头,那可能是服务器端做了防爬虫?对于非正常请求(无 UA )做特定的返回
|
4
also24 2022-01-08 22:43:21 +08:00
|
6
herozzm OP 找到原因了,网站封禁了 Headless Chrome 固定的 user-agent
|
7
chinemds 2022-01-08 23:03:48 +08:00 1
真刑啊
|