V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
dicc
V2EX  ›  问与答

求大佬帮忙看看一个正则表达式

  •  
  •   dicc · 2021-12-24 11:30:50 +08:00 · 1311 次点击
    这是一个创建于 1066 天前的主题,其中的信息可能已经有所发展或是发生改变。

    想要匹配: <这个是 js 的标签>xxx</这个是 js 的标签>

    不想匹配: <这个是 js 的标签>xxx</这个是 js 的标签> 这里还有其他数据 <这个是 js 的标签>aaa</这个是 js 的标签>

    感谢。

    8 条回复    2021-12-24 21:11:06 +08:00
    mainjzb
        1
    mainjzb  
       2021-12-24 11:33:41 +08:00   ❤️ 1
    关键词: 正则 非贪婪
    通常加个?
    dicc
        2
    dicc  
    OP
       2021-12-24 11:45:40 +08:00
    算了,估计只有用 split 解决了
    pendulum
        3
    pendulum  
       2021-12-24 13:58:07 +08:00
    <tag>.*?<\/tag>
    balabalaguguji
        4
    balabalaguguji  
       2021-12-24 14:29:13 +08:00
    Telegram
        5
    Telegram  
       2021-12-24 14:34:29 +08:00
    3 楼这种可以,加?,可以尽量少的匹配。

    或者这样:
    <tag>[^<]*</tag>
    dicc
        6
    dicc  
    OP
       2021-12-24 14:59:53 +08:00
    @pendulum 内容中有换行就不行,我之前用的是 [^\s\S] 代替 . 但是这样做就会匹配到我说的第二种情况
    dicc
        7
    dicc  
    OP
       2021-12-24 15:04:44 +08:00
    re.findall('<tag>[\s\S]*?<\/tag>', s) 可以了。。
    @pendulum
    jiejiss
        8
    jiejiss  
       2021-12-24 21:11:06 +08:00 via Android
    <js 标签>
    console.log("</js 标签>");
    console.log("<js 标签>");
    </js 标签>

    用正则来解析 html ,就需要小心 corner case 。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2712 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 03:42 · PVG 11:42 · LAX 19:42 · JFK 22:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.