1
cy97cool 2017-11-03 23:54:36 +08:00
python 直接 replace("<span>","").replace("</span>","")可好?
![]( https://d.py3.io/img/bzszSrs2ZBhBiJ5E.png) |
2
cy97cool 2017-11-03 23:57:30 +08:00
|
3
cy97cool 2017-11-03 23:58:09 +08:00
|
4
cy97cool 2017-11-03 23:59:07 +08:00
你也许可以看看的做汤(误)教程 → https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/
|
5
isundust 2017-11-04 00:01:59 +08:00 via Android
文本编辑器或者代码编辑器查找替换成 空(空格)
|
6
autoxbc 2017-11-04 00:21:34 +08:00
如果就是例子代码那么简单,那正则就可以了
如果结构稍微复杂一点,那写出的正则像天书一样。可以试试先把 html 解析成 dom,然后用标准的 dom 方法对其操作。虽然性能不佳,但是写出的东西简单易维护 |
7
xfspace 2017-11-04 00:30:22 +08:00 via Android
Python HTMLParser
|
8
vtoexsir OP 感谢各位回复!
看来我没有说清楚,我举的例子,只是个例子,其实代码的各种情况都会有,修改的规则不是简单的替换 span 标签一种。 修改 span 标签,是目测看出来的。还有其他许多情况,目视才能发现。 我想使用软件,软件可以依据 html 的规则,自动发现这些需要修改的地方,自动修改。 |
9
hugee 2017-11-04 08:12:21 +08:00 via Android
我猜 lz 是要采集
|
10
zangbob 2017-11-04 11:29:00 +08:00 1
|