45楼#
发布于:2004-11-30 00:19
问一下.正则表达式里通配符是什么?好象不是*吧.还有[]括号是什么含义?
|
|
|
46楼#
发布于:2004-11-30 00:19
最近正则在 maxthon 论坛很火,有人转了这个帖子。看了看,感觉大家对正则或过滤似乎还是不太掌握,在 maxthon 论坛提了些意见,顺便在这里分享一下。
首先过滤速度主要视乎过滤规则的复杂性,或匹配条件的多少,而非过滤规则多少。所以不要把匹配条件都免勉强跻进同一规则。一条效率低的规则可以比十条规则慢。 像顶楼例子: 3.三段体 这里本来只有 4 个匹配条件: adimg.163.com unstat.baidu.com ulinkjs.tom.com union.sogou.com 有效的写法为 (adimg.163|unstat.baidu|ulinkjs.tom|union.sogou)\.com 红色部份更加可省略,减低处理量。 但用上面写法 (union|adimg|unstat|ulinkjs)\.(baidu|tom|163|sogou)\.(com) 便产生 16 个匹配条件: union.baidu.com adimg.baidu.com unstat.baidu.com ulinkjs.baidu.com union.tom.com adimg.tom.com unstat.tom.com ulinkjs.tom.com union.163.com adimg.163.com unstat.163.com ulinkjs.163.com union.sogou.com adimg.sogou.com unstat.sogou.com ulinkjs.sogou.com 不用说效率及准确度都差得多了。 另外大家都知道 adblock 是用 javascript 编写的,而 javascript 是 interpret 语言,速度一般只有 c++,vs,dephani 等 compiled language/machine code 的 10 到 20 分之一,不适宜作大量运算,否则会做成像某版主说的用 css 下载隐藏感觉上比用 adblock 直接过滤还更快。 |
|
|
47楼#
发布于:2004-11-30 00:19
|
|
48楼#
发布于:2004-11-30 00:19
应该是 vb 和 dephi,打错字。 -__-!!
|
|
|
49楼#
发布于:2004-11-30 00:19
貌似很正确的 ad\d+\.(gif|jpg) 岂不是产生无数个匹配条件,永远算不完 |
|
50楼#
发布于:2004-11-30 00:19
|
|
|
51楼#
发布于:2004-11-30 00:19
我也来学习了!!
|
|
上一页
下一页