1
liangmishi 2016-06-20 11:02:43 +08:00
soup = BeautifulSoup(html,"lxml") 试试
|
2
coolloves OP |
3
coolloves OP 在线等.
|
4
zjb861107 2016-06-20 11:39:55 +08:00
是因为 html 不完整吗, body 和 html 都没闭合标签
|
5
xyx119 2016-06-20 12:12:15 +08:00
直接 re 模块嘛,简单直接。。。
|
6
coolloves OP 我接触 python 时间不长,刚想卸载了重新弄,bs 是 setup.py 装的,不知道怎么卸载,看了下 pip install bs 有,pip install lxml 也有,就都 uninstall 了,结果,发现可以了.
我安装 bs 是下载了源码,python setup.py install 安装的,然后 yum install python-lxml,这样使用没问题 后来出问题后,我 pip uninstall bs ,pip uninstall lxml, 然后 pip install bs,成功,但是 pip install lxml 失败,此时,我发现可以正常工作了. 再次,请教下各位,这几种安装方式,有什么区别? yum pip python setup.py install |
7
coolloves OP @zjb861107 我也是在网上随手复制了个例子,还没仔细看,是没闭合,不过不是这个问题,应该是我 yum 装了 python-lxml,又 pip install lxml 造成的,pip uninstall lxml 后可以了.
|
8
dingyaguang117 2016-06-20 16:18:06 +08:00 via iPhone
推荐 xpath ,别用 bs 了
|
9
Delbert 2016-06-20 20:17:30 +08:00 via Android
@dingyaguang117 xquery 语法真心不好用,那个是针对 xml 的, HTML 这种不严格的不太好弄啊
|