阅读:1396回复:0
请教:想不出这个xpath该怎么写
前几天用了下rip,过滤新浪新闻中间的那个桔黄色广告,发现rip生成的过滤信息都是“table width=360 border=0 cellpadding=0 cellspacing=0”这之类,结果width一变就不行了,在页面源文件里有这样一句 <!-- 画中画下文字链广告(从上至下顺序为01,02,03,04文字,需加class=a01)--> 找到方向,然后找到:<a href='+ link1 +' class=a01 target=_blank>'+ ad1 +'</a> 可是我实在是想不出怎样才能用xpath表示出这个//a标签所在的离它最近的//table标签,不好写过滤规则,向大家请教。
ps:这个过滤其实可以用background=http://image2.sina.com.cn/dy/images/xfrd_02.gif 来实现,不过感觉上不是很好,万一哪天新浪把背景盖了呢,呵呵 |
|