正则表达式关于“非”的问题请教

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 2259 天前的主题，其中的信息可能已经有所发展或是发生改变。

测试文本：helloItsmeaabbhereddeeend

使用正则“(\w)\1(\w)\2”可以轻易提取“aabb、ddee”这种指定类型的叠词出来

问题：
想删除除了“(\w)\1(\w)\2”匹配值以外的任意字符（包括换行符等），正则应如何修改?

注意：以上只是举例子，目的不是要提取叠字，只是想学习一下“非 xxx”的正则表达

正则

叠词

换行符

提取

6 条回复 • 2019-11-09 10:47:52 +08:00

mainjzb

2019 年 11 月 6 日

(?!(\w)\1(\w)\2)(\w\w\w\w)

ClericPy

2019 年 11 月 6 日

想学习就看看零宽断言吧
前后缀都有非的用法

以前回答过, 直接复制过来看看效果, python

import re

# 都存在
print(re.search(r'^(?=.*中文)(?=.*英语).*$', '英语不如中文不'))
print(re.search(r'^(?=.*中文)(?=.*英语).*$', '英语不如不'))
print(re.search(r'^(?=.*中文)(?=.*英语).*$', '不如不'))
# <re.Match object; span=(0, 7), match='英语不如中文不'>
# None
# None
# 都不存在
print(re.search(r'^(?!.*中文)(?!.*英语).*$', '英语不如中文不'))
print(re.search(r'^(?!.*中文)(?!.*英语).*$', '英语不如不'))
print(re.search(r'^(?!.*中文)(?!.*英语).*$', '不如不'))
# None
# None
# <re.Match object; span=(0, 3), match='不如不'>

faketemp

2019 年 11 月 7 日

@mainjzb 这样表达是不正确的哦
(?!(\w)\1(\w)\2)(\w\w\w\w)会得出六组匹配结果
hell、oIts、meaa、bbhe、redd、eeen

可以看到既没有跳过 aabb、ddee 叠字，又没有匹配到最后一个字母 d

faketemp

2019 年 11 月 7 日

@ClericPy 零宽断言基本用法我会
你写的两断代码分别为“包含”、“不包含”也能懂

但是就还是想不出上面那个问题怎么描述和表达
烦请指教

faketemp

2019 年 11 月 7 日

@ClericPy

这个练习的要求就是
测试文本：helloItsmeaabbhereddeeend
结果：aabbddee

要求不是用正则直接提取 aabbddee，而是要用正则去删除除了四字叠词以外的其他所有字符

faketemp

2019 年 11 月 9 日

是否有 V 友关注指教下

正则表达式 关于“非”的问题请教

正则表达式关于“非”的问题请教