Python 菜鸟求助正则(?:...)

在 python 核心编程中看到这样一个例子: ''' print re.findall('http://(?:\w+.)(\w+.com)', 'http://code.google.com') ''' 最后的结果是输出['google.com']. 请问为什么前面的 http://没有掉了,求助...

Python

正则

nda

12 条回复 • 2018-05-31 19:38:01 +08:00

liuxu

2018 年 5 月 31 日

正则的()是捕获匹配，会返回的，其他的不会返回给你

malaohu

2018 年 5 月 31 日

建议楼主查询一下 ?: 的意思

summerwar

2018 年 5 月 31 日

因为没有在括号里

summerwar

2018 年 5 月 31 日

(?:pattern)

匹配 pattern，但不捕获匹配结果。

顺手学了个新东西，感谢

mikefy

2018 年 5 月 31 日

原来这就是子组...另外这里有写错没有给.加上反斜杠没人看见吗...嘎嘎

F1024

2018 年 5 月 31 日

（）= 分组匹配 = 捕获组

即只会返回括号内的内容

(?:)只匹配不显示

(?:\w+.) 这句匹配到了" code. "只匹配不显示
(\w+.com)' 这句匹配 google.com 并显示出来

hahastudio

2018 年 5 月 31 日

1. help('re.findall') Return a list of all non-overlapping matches in the string
2. https://deerchao.net/tutorials/regex/regex.htm 匹配 exp,不捕获匹配的文本，也不给此分组分配组号

hahastudio

2018 年 5 月 31 日

@mikefy 反正 . 也匹配 .

0x400

2018 年 5 月 31 日 via Android

所以要怎么才能返回全部呢。比如我想要以 a 或者 b 开头加后面五个任意字符(a|b).{5}这样肯定不行，只能(a.{5}|b.{5})，但是。。。如果有 abcdefg 等等很多情况开头呢，又或者后面相同的条件也很长。。。

liuxu

2018 年 5 月 31 日

@0x400
([a-z].{5})

xml123

2018 年 5 月 31 日

@0x400 把你想返回的部分加个括号就行了，返回整个匹配就加到最外面，另外表达式里没出现括号好像也是返回整个匹配。

F1024

2018 年 5 月 31 日

@0x400

import re
print(re.findall('\w+\d+', 'abcdefg12345')) 这样岂不美哉