比如我现在要判断用户输入的搜索词,如果输入的是 IP 我就直接返回 IP 归属地,输入运单号就直接显示物流信息,大概代码如下
if(isIP()){
return 'IP 归属地';
}else if(isNum()){
return '返回物流信息';
}else if(isDomain()){
return '返回域名相关信息';
}
像这样的正则判断可能有几百上千条,并且逐渐增多,总之我想用户输入关键字搜索就直接响应对应的自定义内容。
但是一直 if else 判断感觉性能不行,如果正则越来越多肯定会更慢。 想请教各位大佬是否有更好的办法能更快速的判断呢?我主要使用 PHP 。
1
0ZXYDDu796nVCFxq 2022-11-12 23:37:54 +08:00 via Android
正则必须匹配过才知道是否符合
技术上还是有一些方法的,比如 JIT 还有一个就是统计用户搜索频次,按数量调整正则顺序 |
2
learningman 2022-11-13 00:08:58 +08:00 via Android
你这等于是实现搜索引擎了,建议看看信息检索导论
|
3
wudicgi 2022-11-13 00:11:14 +08:00
正则有一个多模匹配就是做这个的,但不确定 PHP 里能不能用到
|
4
q1angch0u 2022-11-13 00:13:17 +08:00 via iPhone
策略模式可以实现开闭原则
|
5
sighforever 2022-11-13 00:15:57 +08:00
比较困难,这种估计没有普适的方案,只能自己研究一下现在的这些条件还有那些简单的特征可以分一下类,把复杂度变为 logn
另外话说回来,几千条正则匹配,没有那种极端情况,也不会很慢的,而且正则匹配是纯 CPU 操作,扩展性还是很好的 |
6
wudicgi 2022-11-13 00:27:39 +08:00 1
|
7
eason1874 2022-11-13 00:33:41 +08:00
PHP 正则匹配可以传入数组的, 一组匹配规则,对应一组处理函数,代码管理比 if 方便很多,效率有没提高就不知道了
|
8
skys215 2022-11-13 09:48:38 +08:00
运行一下正则,能匹配上的就是符合的正则
|
9
totoro52 2022-11-13 10:19:28 +08:00
你这个策略模式就能解决啊, 去看下策略模式就知道了 ,还有不判断怎么知道用户输入的是啥呢
|
10
silverwzw 2022-11-13 13:53:17 +08:00
Google 的 C++库实现了这个功能(具体是 RE2::Set ),PHP 里有没有对应的实现就不知道了。具体原理是把多个正则表达式编译成一整个大的 DFA 或者 NFA ,然后输入在这个 DFA/NFA 上跑一边,看看最后自动机停在哪里就知道对应匹配了哪一个 /哪几个表达式。如果你正则表达式多,而且重复的部分多,可以大大提升效率。
|
11
lietxia 2022-11-13 16:48:14 +08:00
判断交给前端 JS 。后端不做辨别。压力给到访问者就行了
|
12
cokar OP 感谢各位大佬的指导
|