阅读:9006回复:32
给大家一个很牛的去广告规则
这条是最牛的了,,,它以经帮我去了 50多万个广告
/\D\d{2,3}x\d{2,3}(\.|_)/ |
|
1楼#
发布于:2009-04-26 00:13
才50万条而已,我的都100多万了
|
|
2楼#
发布于:2009-04-26 00:13
这...杀伤力太大了吧
|
|
|
3楼#
发布于:2009-04-26 00:13
误杀党自重。。。。。。
|
|
4楼#
发布于:2009-04-26 00:13
厄,那岂不是把论坛头像也会被杀?!
|
|
5楼#
发布于:2009-04-26 00:13
规则怎么编写的啊,完全看不懂的玩意
|
|
6楼#
发布于:2009-04-26 00:13
/\D\d{2,3}x\d{2,3}(\.|_)/
终于知道为什么会过滤哪么多广告了。。它真的有误杀。。 这一页差不多全杀了,,一页就杀了105个 http://poster.taobao.com/lady/p-1.htm |
|
7楼#
发布于:2009-04-26 00:13
这个直接把淘宝上的预览图全咔嚓了
|
|
8楼#
发布于:2009-04-26 00:13
easylist和chinalist确实不应该有很多正则,事实上不太喜欢里面的那条很长的ad规则,跟我自己写的重复了
我现在还是普通规则和正则并重,首选普通规则。 普通规则效率高,正则描述力强,都是革命的螺丝钉^_^ 针对特定网站的规则一般都交给chinalist了,自己写的一般都是些比较通用的规则,感谢巨人chinalist,呵呵 为了让写的规则比较通用,不可避免的引入了正则利用其描述力。 同样是为了让引入的正则尽量少误杀同时能覆盖一类广告,有的正则被我写得极其复杂,自己修改都要仔细分析原来的结构,为此没少死脑细胞。 不过规则出炉后适应性还好,一般网站不需要进行适应性的修改。 广告洁癖也难啊 ![]() 功能优先,效率第二。 广告过滤,适可而止。 第一句是现实,第二句应该是日后的追求。 |
|
9楼#
发布于:2009-04-26 00:13
|
|
|
10楼#
发布于:2009-04-26 00:13
为了写通用好用的正则表达式费了很多脑细胞的路过^_^
|
|
11楼#
发布于:2009-04-26 00:13
别迷信!
奉上chinalist 的 FAQ 根据 ABP 的算法,正则式(以及一些别的情况)的匹配会很慢
http://code.google.com/p/adblock-chinalist/wiki/FAQ 事实证明了 对于抄袭者来说(加必要限定,避免误伤老狼 ![]() 不懂正则的才迷信正则,不想走脑子的才追求通用 |
|
|
12楼#
发布于:2009-04-26 00:13
呵呵,这个规则不是我写的,,我很菜的。。
我只是在网上收集到就拿来用。。。。 我只能做到对自己经常上的网站的广告写简单的过滤特征,, 大家不要再叫我解释了。。 ![]() |
|
13楼#
发布于:2009-04-26 00:13
http://img2.126.net/xoimages/126/200904 ... 35x100.jpg
这个是163上一个广告 /\D\d{2,3}x\d{2,3}(\.|_)/ \D 任意非数字字符 \d{2,3} 2-3位的数字 X 匹配 X \. I_ 匹配 . 或者 _ 就是字符开头然后2-3位数的一个乘积(表示图片的长宽)尾随.或者_ 的都会匹配! 感觉会误杀... |
|
14楼#
发布于:2009-04-26 00:13
能解释下其意思吗
|
|
上一页
下一页