15楼#
发布于:2009-04-26 00:13
收藏一下哈,我平生最恨广告,也许用得上!
|
|
|
16楼#
发布于:2009-04-26 00:13
一上午到现在,经过好多新闻网站之后,只过滤了6次,也没看出过滤了什么
|
|
|
17楼#
发布于:2009-04-26 00:13
看不懂正则表达式,大牛们解释一下?
|
|
18楼#
发布于:2009-04-26 00:13
|
|
19楼#
发布于:2009-04-26 00:13
能解释下其意思吗
|
|
20楼#
发布于:2009-04-26 00:13
http://img2.126.net/xoimages/126/200904 ... 35x100.jpg
这个是163上一个广告 /\D\d{2,3}x\d{2,3}(\.|_)/ \D 任意非数字字符 \d{2,3} 2-3位的数字 X 匹配 X \. I_ 匹配 . 或者 _ 就是字符开头然后2-3位数的一个乘积(表示图片的长宽)尾随.或者_ 的都会匹配! 感觉会误杀... |
|
21楼#
发布于:2009-04-26 00:13
呵呵,这个规则不是我写的,,我很菜的。。
我只是在网上收集到就拿来用。。。。 我只能做到对自己经常上的网站的广告写简单的过滤特征,, 大家不要再叫我解释了。。 |
|
22楼#
发布于:2009-04-26 00:13
别迷信!
奉上chinalist 的 FAQ 根据 ABP 的算法,正则式(以及一些别的情况)的匹配会很慢
http://code.google.com/p/adblock-chinalist/wiki/FAQ 事实证明了 对于抄袭者来说(加必要限定,避免误伤老狼 ) 不懂正则的才迷信正则,不想走脑子的才追求通用 |
|
|
23楼#
发布于:2009-04-26 00:13
为了写通用好用的正则表达式费了很多脑细胞的路过^_^
|
|
24楼#
发布于:2009-04-26 00:13
|
|
|
25楼#
发布于:2009-04-26 00:13
easylist和chinalist确实不应该有很多正则,事实上不太喜欢里面的那条很长的ad规则,跟我自己写的重复了
我现在还是普通规则和正则并重,首选普通规则。 普通规则效率高,正则描述力强,都是革命的螺丝钉^_^ 针对特定网站的规则一般都交给chinalist了,自己写的一般都是些比较通用的规则,感谢巨人chinalist,呵呵 为了让写的规则比较通用,不可避免的引入了正则利用其描述力。 同样是为了让引入的正则尽量少误杀同时能覆盖一类广告,有的正则被我写得极其复杂,自己修改都要仔细分析原来的结构,为此没少死脑细胞。 不过规则出炉后适应性还好,一般网站不需要进行适应性的修改。 广告洁癖也难啊 功能优先,效率第二。 广告过滤,适可而止。 第一句是现实,第二句应该是日后的追求。 |
|
26楼#
发布于:2009-04-26 00:13
这个直接把淘宝上的预览图全咔嚓了
|
|
27楼#
发布于:2009-04-26 00:13
/\D\d{2,3}x\d{2,3}(\.|_)/
终于知道为什么会过滤哪么多广告了。。它真的有误杀。。 这一页差不多全杀了,,一页就杀了105个 http://poster.taobao.com/lady/p-1.htm |
|
28楼#
发布于:2009-04-26 00:13
规则怎么编写的啊,完全看不懂的玩意
|
|
29楼#
发布于:2009-04-26 00:13
厄,那岂不是把论坛头像也会被杀?!
|
|