1
yangqi 2013 年 9 月 25 日
php正则还是最方便了,这个放在前段用jquery很容易就提取了
|
3
emric 2013 年 9 月 25 日
Don't try to parse HTML using regex. Find an HTML parser please.
|
4
kojp 2013 年 9 月 25 日 via Android
A class named snopy
Have a try. |
6
PrideChung 2013 年 9 月 26 日
对于HTML这么复杂的文本正则处理不来的,找个HTML parser才是正道。
|
7
pantaovay 2013 年 9 月 26 日
正则处理不来,用DOM操作吧
|
8
jacy OP 谢谢,我试试simplehtml。
|
9
mescoda 2013 年 9 月 26 日 PHP 用 simplehtmldom
Python 用 [pywebquery](https://github.com/NStal/pywebquery) Node 用 [jwebquery](https://github.com/NStal/jwebquery) |
11
foru17 2013 年 9 月 26 日
我记得正则好像是行的。你搜一下 google 搜索结果 正则,参考一下,之前弄过一个类似的。
|
12
faceair 2013 年 9 月 26 日
<div class=\"content\">([\s\S]+?(<div[\s\S]+?<\/div>)+?[\s\S]+?)<\/div>
手机写的,你测试下,主要是确定中间的div是一对一对就可以了 |
13
liuyao729 2013 年 9 月 26 日
试试phpQuery
|
14
faceair 2013 年 9 月 26 日
修改了下,测试貌似通过了
<div class=\"content\">([\s\S]+?(<div[\s\S]+?<\/div>)*?[\s\S]+?)*?<\/div> |
15
alexrezit 2013 年 9 月 26 日
不 要 用 正 则.
找 个 parser 用 XPath 很 难 么? |
16
cxshun 2013 年 9 月 26 日
其实xpath不是更方便么,直接//div[class='content']/*这个就OK啦。正则解析HTML是没办法的选择。
|
17
jiych 2013 年 9 月 26 日
可以用flex
|
18
junp 2013 年 9 月 26 日
前端方便
|
19
marchtea 2013 年 9 月 26 日
用simple_html_dom来读取,再处理吧.直接弄貌似不是很好弄
|