V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
spencerqiu
V2EX  ›  正则表达式

请问匹配全文中所有两个 HTML 标签之间内容的 grep 正则表达式 怎么写?

  •  
  •   spencerqiu · 2018-06-14 09:43:16 +08:00 · 2441 次点击
    这是一个创建于 2345 天前的主题,其中的信息可能已经有所发展或是发生改变。
    >cat sample.txt
    </span>
                                    <span _content="">
    那种写书不好好解释
    动不动就留作习题
    
    <div content="" class="sample" style="sample: 5px;">
    
    </span>
                                    <span _content="">
    课后习题的答案除了最终结果什么都没有的作者
    我真的很想踢爆你的头了……​​​
    
    <div content="" class="sample" style="sample: 5px;">
    
    期望匹配出:
    那种写书不好好解释
    动不动就留作习题
    
    课后习题的答案除了最终结果什么都没有的作者
    我真的很想踢爆你的头了……
    
    */即起始标签为带换行的两个标签</span>
                                    <span _content="">
    结束为 <div content="" class="sample" style="sample: 5px;">
    */
    

    网上搜了一大堆都不管用,要么根本不行,要么换行不行 = =

    9 条回复    2018-06-14 11:30:24 +08:00
    grewer
        1
    grewer  
       2018-06-14 09:53:19 +08:00
    var str = '</span> <span _content="">那种写书不好好解释动不动就留作习题<div content="" class="sample" style="sample: 5px;"></span> <span _content="">课后习题的答案除了最终结果什么都没有的作者我真的很想踢爆你的头了……​​​<div content="" class="sample" style="sample: 5px;">'
    str.match(/>.*?</g)
    spencerqiu
        2
    spencerqiu  
    OP
       2018-06-14 10:13:02 +08:00
    @grewer
    是一整个 HTML,所以还有很多其他标签 = =
    grewer
        3
    grewer  
       2018-06-14 10:19:25 +08:00
    @spencerqiu 组件了解一下正则,然后写一个,不然想要契合你的需求是很难的
    BOYPT
        4
    BOYPT  
       2018-06-14 10:26:18 +08:00
    收费定制正则表达式
    feibinyang
        5
    feibinyang  
       2018-06-14 10:35:09 +08:00
    需求是获取所有文本节点吧,这用 DOM 操作遍历更方便吧
    wplct
        6
    wplct  
       2018-06-14 10:50:59 +08:00
    bs4 了解一下
    rabbbit
        7
    rabbbit  
       2018-06-14 10:59:28 +08:00
    另一种思路,不去匹配文字,把 html 符号全替换掉
    https://imgur.com/a/sgT5mIJ
    rabbbit
        8
    rabbbit  
       2018-06-14 10:59:39 +08:00
    Alife
        9
    Alife  
       2018-06-14 11:30:24 +08:00 via iPhone
    正则前将其变成一行
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5842 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 02:54 · PVG 10:54 · LAX 18:54 · JFK 21:54
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.