levin
小狐狸
小狐狸
  • UID6514
  • 注册日期2005-06-03
  • 最后登录2005-06-05
  • 发帖数6
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
阅读:20794回复:39

AdBlock (plus)国内网站广告过滤正则表达式专贴

楼主#
更多 发布于:2005-06-03 17:40
Adblock正则表达式广告过滤规则

Adblock (plus)是FireFox超越其他网页浏览器的利器之一,想必大家都已经用上了。可惜由于绝大多数人对正则表达式不熟悉,就算是勉强去学也是很难迅速上手。有能力自己实践的不少,但是都是单兵作战,贴出来的过滤表达式很难达到全面、高效的程度。在下深感此种情况大不利于FireFox在国内的普及,特开辟专贴长期跟踪讨论对国内网站广告过滤的问题。各位网友如果实践出来了什么好的过滤表达式,不妨跟贴(最好说明是过滤哪个网站的)。

本贴暂定表达式处理原则如下:
1. 过滤表达式划分为通用和专用两种:所谓通用是指对任何网站的广告字串都具备过滤作用;专用则是仅对某一个网站甚至是其中某些个链接具备过滤作用。在一个表达式中仅包含几个|的组合不算通用过滤,建议拆分为几个专用过滤(如/(guanggao|\.3721\.|\.allyes\.|/pop/|googlesyndication)/)。
2. 各个过滤表达式不仅包含表达式本身,还要包括详细的文字以说明过滤了那些字串、网站或链接以供理解。
3. 不建议大量使用可能导致重复或误过滤的通用表达式,而尽可能使用精确程度高的专用表达式以方便根据需要随意组合使用。
4. 主要针对经常上的大型网站的过滤,并且以国内网站为主。
5. 周期性整理过滤表达式并发布相应日期的表达式列表,以方便网友测试和反馈。


以下为[2005/06/04]发布的正则表达式列表:
--------------------------------------
G1   /[\W\d_]ad(s|v)?[\W\d_]/
    过滤:以/ad、.ad、#ad、_ad、bbsad开始跟着s、v或数字的字符串。
    适用:新浪、搜狐、中华等各种网站
G2   /[\W_]3721[\W_]/
    过滤:所有包含3721的广告链接。
    适用:各种网站

--------------------------------------
S1   .allyes.
    适用:绝大部分新浪、TOM网的广告都可以过滤掉。
S2   /pfp.sina.com.   或  .sina.com.cn/pfp/
    适用:新浪娱乐,补漏。前一条会去掉一栏,显示可能不太完美,后条仅过滤图片没有过滤掉文字。
S3   .sina.com.cn/cj/zsyz/*.swf
    适用:新浪新闻,补漏。
S4   .sina.com.cn/dy/sina_net/
    适用:新浪娱乐,补漏。
S5   images.sohu.com/chat_online/
    适用:搜狐,补漏。
S6   sohu.com/cs/
    适用:搜狐,补漏。
S7   /newhuagg\/((?!news\d\.js)|(\d+\.(gif|jpg|png)))/
    适用:搜狐,补漏。

--------------------------------------
              各大网站过滤条件总结           
新浪网 : G1, S1, S2, S3, S4
搜狐网 : G1, S5, S6
中华网 : G1
TOM网: G1, S1
华军软件: S7

--------------------------------------
[Adblock]
.allyes.
.sina.com.cn/cj/zsyz/*.swf
.sina.com.cn/dy/sina_net/
/[\W\d_]ad(s|v)?[\W\d_]/
/[\W_]3721[\W_]/
/newhuagg\/((?!news\d\.js)|(\d+\.(gif|jpg|png)))/
/pfp.sina.com.
images.sohu.com/chat_online/
sohu.com/cs/

--------------------------------------
                                          网友跟贴表达式精华

/(\D)(\d){2,3}((\*)|x|-)(\d){2,3}\.(swf|gif|jpg)/
拦截如以128x128 128x64 100x100之类命名的图片、flash广告。


本人网页为spaces.msn.com/members/paperytiger,欢迎访问。
daheyan
狐狸大王
狐狸大王
  • UID6067
  • 注册日期2005-05-16
  • 最后登录2009-01-08
  • 发帖数516
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
1楼#
发布于:2005-06-03 17:40
很好,此帖本人会长期关注。
EricXP
千年狐狸
千年狐狸
  • UID5182
  • 注册日期2005-04-17
  • 最后登录2010-12-27
  • 发帖数1027
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
2楼#
发布于:2005-06-03 17:40
不错,有空我也贴几条上来.
╮( ̄▽ ̄")╭

- Adblock Plus 1.1.3
- Adblock Plus: Element Hiding Helper 1.0.6
- Add to Search Bar 2.0
- All-In-One Gestures 0.20.1
- All-In-One Sidebar 0.7.11
- Easy DragToGo 1.1.2.2
- AutoProxy 0.3b4.0+.2009110800
- Coral IE Tab 1.83.20100316
- Easy DragToGo 1.1.2.4
- Favicon Picker 3 0.5
- FlashGot 1.2.1.17
- Gmail Notifier 0.6.4.1
- Greasemonkey 0.8.20100211.5
- IDM CC 6.9.1
- Menu Editor 1.2.6
- Organize Status Bar 0.6.4
- ScrapBook 1.3.6
- Tab Mix Plus 0.3.8.2
- TinEye Reverse Image Search 0.7.1
- WangWang Protocol Handler 3.6

欢迎访问我的Blogger
http://ericxp1984.spaces.live.com/
zephyr
火狐狸
火狐狸
  • UID877
  • 注册日期2004-12-14
  • 最后登录2008-01-18
  • 发帖数207
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
3楼#
发布于:2005-06-03 17:40
建议加上 ad(manager)?
arcthelad
火狐狸
火狐狸
  • UID5940
  • 注册日期2005-05-13
  • 最后登录2009-02-21
  • 发帖数157
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
4楼#
发布于:2005-06-03 17:40
小弟的:
/(\.|\/|_|-)(?!adv-search)((page|narrow|pchome|index|active)?ad(banner|ver(t|tise)?|sen(s|c)e|sina|img|sp|eastday|client)?|(st)?banner|(newhua)?gg|guangao|tuijianimg|3721|9988|sms|mms|allyes|union|adjs)(s|v)?(\d)*(\.|\/|_|-)/
lococo
火狐狸
火狐狸
  • UID2458
  • 注册日期2005-01-23
  • 最后登录2016-04-07
  • 发帖数100
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
5楼#
发布于:2005-06-03 17:40
/(\D)(\d){2,3}((\*)|x|-)(\d){2,3}\.(swf|gif|jpg)/
拦截如以128x128 128x64 100x100之类命名的图片、flash广告。
其中飘浮广告的确很多是100x100.gif这样的命名Di~
blackdire
火狐狸
火狐狸
  • UID2211
  • 注册日期2005-01-15
  • 最后登录2006-11-03
  • 发帖数165
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
6楼#
发布于:2005-06-03 17:40
好帖
CPU:Intel CeleronD 325 D0制程(2.53G) 主板:七彩虹刀锋战士 C.848P Ver2.3 (Intel 848P+ICH5) 内存:威刚(V-DATA) 万紫千红 DDR400 256MB × 2 硬盘:WDC WD1200JB-22GVA0 (120G 8MB缓存) 声卡:板载ALC655 显卡:七彩虹镭风9550-GD2 CT冰封骑士3 [ATI RADEON 9550(RV350) 显存256MB(450/700MHz)] 网卡:Realtek RTL8139/810x Family Fast Ethernet NIC 1394网络适配器:VIA OHCI Compliant IEEE 1394 Host Controller 电源:鑫谷核动力300V 机箱:LG纳蓝先锋2002 显示器:BenQ FP71G+S 光驱:台电女神 52xCOMBO 52×24×52×16(Secondary, Master)+BenQ 1650T 白色(Secondary, Slave) 软驱:Sony 键盘:双飞燕KBS-5 鼠标:Microsoft IntelliMouse PS/2 音箱:杂牌 打印机:Lexmark Z11 Color Jetprinter 操作系统:RedFlag Linux Workstation 5 Microsoft Windows XP Professional Service Pack 2(5.1.2600) Microsoft Windows 98 SE(4.10.2222)
levin
小狐狸
小狐狸
  • UID6514
  • 注册日期2005-06-03
  • 最后登录2005-06-05
  • 发帖数6
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
7楼#
发布于:2005-06-03 17:40
zephyr:建议加上 ad(manager)?回到原帖

是哪个网站上的?最好给出网址。
coolstar14
小狐狸
小狐狸
  • UID2584
  • 注册日期2005-01-28
  • 最后登录2006-04-14
  • 发帖数33
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
8楼#
发布于:2005-06-03 17:40
惨, 还以为有资源可以直接下载了用呢.
levin
小狐狸
小狐狸
  • UID6514
  • 注册日期2005-06-03
  • 最后登录2005-06-05
  • 发帖数6
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
9楼#
发布于:2005-06-03 17:40
arcthelad:小弟的:
/(\.|\/|_|-)(?!adv-search)((page|narrow|pchome|index|active)?ad(banner|ver(t|tise)?|sen(s|c)e|sina|img|sp|eastday|client)?|(st)?banner|(newhua)?gg|guangao|tuijianimg|3721|9988|sms|mms|allyes|union|adjs)(s|v)?(\d)*(\.|\/|_|-)/
回到原帖

呵呵,这个搜索效率不仅比较低,而且很难一眼看明白,尤其是组合的时候会很伤脑筋的,建议还是分成几条吧。个人不赞成这么长的过滤表达式。
yjj132
小狐狸
小狐狸
  • UID4821
  • 注册日期2005-04-06
  • 最后登录2005-08-03
  • 发帖数11
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
10楼#
发布于:2005-06-03 17:40
本人菜鸟一个,不太明白正则表达式怎么用
是不是在“Adblock首选项”里添加就行了呢?
人生如戏,我在后台等待
levin
小狐狸
小狐狸
  • UID6514
  • 注册日期2005-06-03
  • 最后登录2005-06-05
  • 发帖数6
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
11楼#
发布于:2005-06-03 17:40
yjj132:本人菜鸟一个,不太明白正则表达式怎么用
是不是在“Adblock首选项”里添加就行了呢?
回到原帖

是啊,你只要将过滤字符串复制过去再点击“Add”就会加上去了。如果要修改,双击就可以了。
levin
小狐狸
小狐狸
  • UID6514
  • 注册日期2005-06-03
  • 最后登录2005-06-05
  • 发帖数6
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
12楼#
发布于:2005-06-03 17:40
coolstar14:惨, 还以为有资源可以直接下载了用呢.回到原帖

原来为了方便大家组合使用,所以没有制作全部表达式的综合。现在我会在帖子底部加上的。
daheyan
狐狸大王
狐狸大王
  • UID6067
  • 注册日期2005-05-16
  • 最后登录2009-01-08
  • 发帖数516
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
13楼#
发布于:2005-06-03 17:40
levin
呵呵,这个搜索效率不仅比较低,而且很难一眼看明白,尤其是组合的时候会很伤脑筋的,建议还是分成几条吧。个人不赞成这么长的过滤表达式。
回到原帖

应该加入精华,最后评选出一个最长、而且有效的表达式。
asdfvv
小狐狸
小狐狸
  • UID253
  • 注册日期2004-11-27
  • 最后登录2006-06-05
  • 发帖数29
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
14楼#
发布于:2005-06-03 17:40
这个帖很好啊,
支持,
虽然我不会
上一页
游客

返回顶部