1
264768502 2016-10-14 21:23:19 +08:00 via iPad
获取网页跟 bs 一点关系都没有
网页的渲染和 python 里的 print 不是一回事 |
2
leavic 2016-10-15 16:22:09 +08:00
请把浏览器的 js 禁用
|
3
vtoexsir OP 如果要获得网页源码渲染之后的网页文本,恐怕要使用类似 selenium 之类真的加载到浏览器,然后获取到.
这样相当耗资源,速度也慢. 我想使用 bs 来获得网页文本,而且要求格式与从网页上看到的一样.相对于使用 selenium,这样做可能快点吧. |
4
Arthur2e5 2016-10-19 00:44:50 +08:00
https://stackoverflow.com/questions/16121001 ,直接插空格。
当然想模仿一下 br 处理的话还得再费点事。 strip 那玩意本来就是拿来吃空格的,别指望它…… |