阅读:22361回复:39
AdBlock (plus)国内网站广告过滤正则表达式专贴
Adblock正则表达式广告过滤规则
Adblock (plus)是FireFox超越其他网页浏览器的利器之一,想必大家都已经用上了。可惜由于绝大多数人对正则表达式不熟悉,就算是勉强去学也是很难迅速上手。有能力自己实践的不少,但是都是单兵作战,贴出来的过滤表达式很难达到全面、高效的程度。在下深感此种情况大不利于FireFox在国内的普及,特开辟专贴长期跟踪讨论对国内网站广告过滤的问题。各位网友如果实践出来了什么好的过滤表达式,不妨跟贴(最好说明是过滤哪个网站的)。 ![]() 本贴暂定表达式处理原则如下: 1. 过滤表达式划分为通用和专用两种:所谓通用是指对任何网站的广告字串都具备过滤作用;专用则是仅对某一个网站甚至是其中某些个链接具备过滤作用。在一个表达式中仅包含几个|的组合不算通用过滤,建议拆分为几个专用过滤(如/(guanggao|\.3721\.|\.allyes\.|/pop/|googlesyndication)/)。 2. 各个过滤表达式不仅包含表达式本身,还要包括详细的文字以说明过滤了那些字串、网站或链接以供理解。 3. 不建议大量使用可能导致重复或误过滤的通用表达式,而尽可能使用精确程度高的专用表达式以方便根据需要随意组合使用。 4. 主要针对经常上的大型网站的过滤,并且以国内网站为主。 5. 周期性整理过滤表达式并发布相应日期的表达式列表,以方便网友测试和反馈。 以下为[2005/06/04]发布的正则表达式列表: -------------------------------------- G1 /[\W\d_]ad(s|v)?[\W\d_]/ 过滤:以/ad、.ad、#ad、_ad、bbsad开始跟着s、v或数字的字符串。 适用:新浪、搜狐、中华等各种网站 G2 /[\W_]3721[\W_]/ 过滤:所有包含3721的广告链接。 适用:各种网站 -------------------------------------- S1 .allyes. 适用:绝大部分新浪、TOM网的广告都可以过滤掉。 S2 /pfp.sina.com. 或 .sina.com.cn/pfp/ 适用:新浪娱乐,补漏。前一条会去掉一栏,显示可能不太完美,后条仅过滤图片没有过滤掉文字。 S3 .sina.com.cn/cj/zsyz/*.swf 适用:新浪新闻,补漏。 S4 .sina.com.cn/dy/sina_net/ 适用:新浪娱乐,补漏。 S5 images.sohu.com/chat_online/ 适用:搜狐,补漏。 S6 sohu.com/cs/ 适用:搜狐,补漏。 S7 /newhuagg\/((?!news\d\.js)|(\d+\.(gif|jpg|png)))/ 适用:搜狐,补漏。 -------------------------------------- 各大网站过滤条件总结 新浪网 : G1, S1, S2, S3, S4 搜狐网 : G1, S5, S6 中华网 : G1 TOM网: G1, S1 华军软件: S7 -------------------------------------- [Adblock] .allyes. .sina.com.cn/cj/zsyz/*.swf .sina.com.cn/dy/sina_net/ /[\W\d_]ad(s|v)?[\W\d_]/ /[\W_]3721[\W_]/ /newhuagg\/((?!news\d\.js)|(\d+\.(gif|jpg|png)))/ /pfp.sina.com. images.sohu.com/chat_online/ sohu.com/cs/ -------------------------------------- 网友跟贴表达式精华
本人网页为spaces.msn.com/members/paperytiger,欢迎访问。 |
|
1楼#
发布于:2005-06-03 17:40
非常好……大家都来人多力量大。
我也希望每条规则都是专门针对某一类型的,这样组合在一起才不容易出现几条规则都包含有相同的过滤的情况 |
|
2楼#
发布于:2005-06-03 17:40
强~~~~~~~~~~
将表达式添加后怀着激动的心情试了新浪和天空,有效~~~~~~~~~
N aaaaaaaaaaaaaaaa 此贴长期关注中~~~~~~~~~~~~ 谢谢啊~~~~~~~~~~~~~ ![]() |
|
3楼#
发布于:2005-06-03 17:40
这个帖子不能沉下去,我顶起来。
|
|
4楼#
发布于:2005-06-03 17:40
/[\W\d_]ad(s|v)?[\W\d_]/
这个也不行,将hotmail的退出按钮灭了。 |
|
5楼#
发布于:2005-06-03 17:40
|
|
6楼#
发布于:2005-06-03 17:40
/(\D)(\d){2,3}((\*)|x|-)(\d){2,3}\.(swf|gif|jpg)/
这个不好,把新浪漫画的暴笑擂台里面的漫画也灭了。 |
|
7楼#
发布于:2005-06-03 17:40
是可以还是我没有启用adblock,,,,,,,,,谢谢提供!!!!!!!!!
|
|
|
8楼#
发布于:2005-06-03 17:40
好像还是不可以啊! 部分正则表达式加入后,不会自动更新页面,必须刷新才能起作用。 刷新了没有? 我测试通过了。 |
|
9楼#
发布于:2005-06-03 17:40
/images\.chinaz\.com\/(index|down)_images/
|
|
|
10楼#
发布于:2005-06-03 17:40
|
|
|
11楼#
发布于:2005-06-03 17:40
newpowersky:http://www.chinaz.com/ 试用这一条规则 /(\.)chinaz(\.).* (\/)index_images(\/)/ 不过好像连里面的flash也过滤掉了。希望别介意。 |
|
12楼#
发布于:2005-06-03 17:40
|
|
|
13楼#
发布于:2005-06-03 17:40
支持,最好有大大能总结一下
|
|
14楼#
发布于:2005-06-03 17:40
强烈支持中……
|
|
|
上一页
下一页