测试文本:helloItsmeaabbhereddeeend
使用正则“(\w)\1(\w)\2”可以轻易提取“aabb、ddee”这种指定类型的叠词出来
问题:
想删除除了“(\w)\1(\w)\2”匹配值以外的任意字符(包括换行符等),正则应如何修改?
注意: 以上只是举例子,目的不是要提取叠字,只是想学习一下“非 xxx”的正则表达
1
mainjzb 2019-11-06 17:26:11 +08:00
(?!(\w)\1(\w)\2)(\w\w\w\w)
|
2
ClericPy 2019-11-06 17:30:58 +08:00 1
想学习就看看零宽断言吧
前后缀都有 非 的用法 以前回答过, 直接复制过来看看效果, python import re # 都存在 print(re.search(r'^(?=.*中文)(?=.*英语).*$', '英语不如中文不')) print(re.search(r'^(?=.*中文)(?=.*英语).*$', '英语不如不')) print(re.search(r'^(?=.*中文)(?=.*英语).*$', '不如不')) # <re.Match object; span=(0, 7), match='英语不如中文不'> # None # None # 都不存在 print(re.search(r'^(?!.*中文)(?!.*英语).*$', '英语不如中文不')) print(re.search(r'^(?!.*中文)(?!.*英语).*$', '英语不如不')) print(re.search(r'^(?!.*中文)(?!.*英语).*$', '不如不')) # None # None # <re.Match object; span=(0, 3), match='不如不'> |
3
faketemp OP @mainjzb 这样表达是不正确的哦
(?!(\w)\1(\w)\2)(\w\w\w\w)会得出六组匹配结果 hell、oIts、meaa、bbhe、redd、eeen 可以看到既没有跳过 aabb、ddee 叠字,又没有匹配到最后一个字母 d |
4
faketemp OP |
5
faketemp OP @ClericPy
这个练习的要求就是 测试文本:helloItsmeaabbhereddeeend 结果:aabbddee 要求不是用正则直接提取 aabbddee,而是要用正则去删除除了四字叠词以外的其他所有字符 |
6
faketemp OP 是否有 V 友关注指教下
|