beast
火狐狸
火狐狸
  • UID48534
  • 注册日期2015-01-10
  • 最后登录2017-09-17
  • 发帖数166
  • 经验150枚
  • 威望0点
  • 贡献值90点
  • 好评度1点
  • 社区居民
阅读:5155回复:18

以图搜图问题

楼主#
更多 发布于:2015-10-27 23:24

脚本search by image调用bing搜索网页图片时,有时没有任何结果,比如搜这幅图http://img6.cache.netease.com/photo/0001/2015-01-16/AG2OS3FE4T8E0001.jpg
会提示
对不起,我们无法按以下项的图像进行搜索 [url]http://img6.cache.netease.com/p……

但是,将这幅图保存至本地后,再上传至bing反查,就能返回一些结果。这是怎么回事?

另外,这个脚本中的yandex不稳定,有时反查同一幅网页图片,无结果,但刷新几次后,又返回了一些结果。
文科
千年狐狸
千年狐狸
  • UID39959
  • 注册日期2013-10-17
  • 最后登录2019-07-27
  • 发帖数2069
  • 经验1328枚
  • 威望4点
  • 贡献值340点
  • 好评度256点
  • 最爱沙发
  • 社区居民
  • 忠实会员
1楼#
发布于:2015-10-27 23:32
垃圾bing,用谷歌
beast
火狐狸
火狐狸
  • UID48534
  • 注册日期2015-01-10
  • 最后登录2017-09-17
  • 发帖数166
  • 经验150枚
  • 威望0点
  • 贡献值90点
  • 好评度1点
  • 社区居民
2楼#
发布于:2015-10-27 23:43
文科:垃圾bing,用谷歌回到原帖
其实我刚才就打算等你回复。没想到你这么快!似乎你还为扩展image search option添加了一组搜索引擎。
文科
千年狐狸
千年狐狸
  • UID39959
  • 注册日期2013-10-17
  • 最后登录2019-07-27
  • 发帖数2069
  • 经验1328枚
  • 威望4点
  • 贡献值340点
  • 好评度256点
  • 最爱沙发
  • 社区居民
  • 忠实会员
3楼#
发布于:2015-10-28 18:51
beast:其实我刚才就打算等你回复。没想到你这么快!似乎你还为扩展image search option添加了一组搜索引擎。回到原帖
现在改用uc脚本了
yfdyh000
千年狐狸
千年狐狸
  • UID29079
  • 注册日期2009-06-07
  • 最后登录2022-05-18
  • 发帖数2262
  • 经验1390枚
  • 威望0点
  • 贡献值52点
  • 好评度139点
  • 社区居民
  • 最爱沙发
  • 忠实会员
4楼#
发布于:2015-10-28 19:02
Bing取不到图片,可能服务器拒绝了。
beast
火狐狸
火狐狸
  • UID48534
  • 注册日期2015-01-10
  • 最后登录2017-09-17
  • 发帖数166
  • 经验150枚
  • 威望0点
  • 贡献值90点
  • 好评度1点
  • 社区居民
5楼#
发布于:2015-10-29 00:04
yfdyh000:Bing取不到图片,可能服务器拒绝了。回到原帖
是bing的服务器拒绝,还是普通网站的服务器拒绝?为什么搜狗的服务器没有拒绝?难道普通网站对搜索引擎的爬虫区别对待?
yfdyh000
千年狐狸
千年狐狸
  • UID29079
  • 注册日期2009-06-07
  • 最后登录2022-05-18
  • 发帖数2262
  • 经验1390枚
  • 威望0点
  • 贡献值52点
  • 好评度139点
  • 社区居民
  • 最爱沙发
  • 忠实会员
6楼#
发布于:2015-10-29 00:10
beast:是bing的服务器拒绝,还是普通网站的服务器拒绝?为什么搜狗的服务器没有拒绝?难道普通网站对搜索引擎的爬虫区别对待?回到原帖
理论上是对方。Bing不会给出原因(Google等也不会),很难说。没证据,但存在可能性,包括潜在的,如对方认为频率过高。

另外,我有尝试该域名的其他图片,错误提示是相同的。但是,Bing的图片搜索中也有对该域名的图片缓存。所以,不明原因。
beast
火狐狸
火狐狸
  • UID48534
  • 注册日期2015-01-10
  • 最后登录2017-09-17
  • 发帖数166
  • 经验150枚
  • 威望0点
  • 贡献值90点
  • 好评度1点
  • 社区居民
7楼#
发布于:2015-10-29 00:14
yfdyh000:理论上是对方。Bing不会给出原因(Google等也不会),很难说。没证据,但存在可能性,包括潜在的,如对方认为频率过高。

另外,我有尝试该域名的其他图片,错误提示是相同的。但是,Bing的图片搜索中也有对该域名的图片缓存。所以,不明...
回到原帖
我也同意你的猜想。据说有些网站嫌三流搜索引擎的爬虫浪费流量,干脆限制它们索引。
beast
火狐狸
火狐狸
  • UID48534
  • 注册日期2015-01-10
  • 最后登录2017-09-17
  • 发帖数166
  • 经验150枚
  • 威望0点
  • 贡献值90点
  • 好评度1点
  • 社区居民
8楼#
发布于:2015-10-29 00:21
yfdyh000:理论上是对方。Bing不会给出原因(Google等也不会),很难说。没证据,但存在可能性,包括潜在的,如对方认为频率过高。

另外,我有尝试该域名的其他图片,错误提示是相同的。但是,Bing的图片搜索中也有对该域名的图片缓存。所以,不明...
回到原帖
一直有疑问:为什么这些图片搜索引擎,不把部分以图搜图的部分计算量放在用户的计算机上完成,比如将手头的那副图片编码,然后将这个码输入搜索引擎的服务器?这能大大减少搜索引擎的服务器负担。
yfdyh000
千年狐狸
千年狐狸
  • UID29079
  • 注册日期2009-06-07
  • 最后登录2022-05-18
  • 发帖数2262
  • 经验1390枚
  • 威望0点
  • 贡献值52点
  • 好评度139点
  • 社区居民
  • 最爱沙发
  • 忠实会员
9楼#
发布于:2015-10-29 00:54
beast:一直有疑问:为什么这些图片搜索引擎,不把部分以图搜图的部分计算量放在用户的计算机上完成,比如将手头的那副图片编码,然后将这个码输入搜索引擎的服务器?这能大大减少搜索引擎的服务器负担。回到原帖
那跟你上传图片文件不是一样的吗,还多了一步下载步骤。会造成:下载和上传的耗时明显增加;流量计费的网络;无法保证按网址的真实性,它还得再下载一份来证明。允许按网址本就是为了方便的。
meat
火狐狸
火狐狸
  • UID35020
  • 注册日期2011-01-06
  • 最后登录2024-02-19
  • 发帖数267
  • 经验200枚
  • 威望0点
  • 贡献值106点
  • 好评度16点
10楼#
发布于:2015-10-29 00:54
beast:一直有疑问:为什么这些图片搜索引擎,不把部分以图搜图的部分计算量放在用户的计算机上完成,比如将手头的那副图片编码,然后将这个码输入搜索引擎的服务器?这能大大减少搜索引擎的服务器负担。回到原帖
二进制操作,本身(html5以前)浏览器对文件读取操作有极大的困难,这还是其次的。图片--》提取关键资料,这个过程算法是图片搜索的核心技术……

公开的算法那就不一样,比如ed2k,magnet之类p2p的hash搜索
yfdyh000
千年狐狸
千年狐狸
  • UID29079
  • 注册日期2009-06-07
  • 最后登录2022-05-18
  • 发帖数2262
  • 经验1390枚
  • 威望0点
  • 贡献值52点
  • 好评度139点
  • 社区居民
  • 最爱沙发
  • 忠实会员
11楼#
发布于:2015-10-29 01:04
meat:二进制操作,本身(html5以前)浏览器对文件读取操作有极大的困难,这还是其次的。图片--》提取关键资料,这个过程算法是图片搜索的核心技术……

公开的算法那就不一样,比如ed2k,magnet之类p2p的hash搜索
回到原帖
他不是那个意思。其实就是XMLHttpRequest得到文件,转成base64编码,把这个编码传送过去。
除了跨域问题和耗时耗流量问题,没什么难度,好像用不上HTML5。跨域问题可能不好解决。其实还是信任问题,网站可以选择信任用户,就像某些网页存档网站,允许这样存档用户端呈现的网页效果(如已登录效果,语言识别效果)。
beast
火狐狸
火狐狸
  • UID48534
  • 注册日期2015-01-10
  • 最后登录2017-09-17
  • 发帖数166
  • 经验150枚
  • 威望0点
  • 贡献值90点
  • 好评度1点
  • 社区居民
12楼#
发布于:2015-10-29 11:12
单幅图片调用火狐脚本,很容易实现以图找图。但是,我手头几百幅图,批量找,就太繁琐了。而且,爬虫在不停改进算法,以前没找到的,一段时间后,可能找到。这时如何让搜索引擎提醒用户呢?

据说,最初,以图找图是这种算法:将图片分割成几十个方格,每个方格计算敏感对比度,然后汇总成唯一的识别码。但这种算法,无法识别出已经剪切掉一半的图片。

然而,好几次,我都用残缺了一半的图片找到了原始图片。我猜想新算法中可能加入了脸部识别技术。可以想象,如果脸部越清晰,残缺再多的图片也能找到原始图,或者一副图中,有多个人脸,也容易找。


搜索本地硬盘相似图片的软件vistanita duplicate finder,你们都没用过?
yfdyh000
千年狐狸
千年狐狸
  • UID29079
  • 注册日期2009-06-07
  • 最后登录2022-05-18
  • 发帖数2262
  • 经验1390枚
  • 威望0点
  • 贡献值52点
  • 好评度139点
  • 社区居民
  • 最爱沙发
  • 忠实会员
13楼#
发布于:2015-10-29 18:00
beast:单幅图片调用火狐脚本,很容易实现以图找图。但是,我手头几百幅图,批量找,就太繁琐了。而且,爬虫在不停改进算法,以前没找到的,一段时间后,可能找到。这时如何让搜索引擎提醒用户呢?

据说,最初,以图找图是这种算法:将图片分割成几十个方格,每个...
回到原帖
不存在这样的服务,用户缺少需求,计算量也太大。除非有专业的付费服务。

算法很多的,不是那么简单。脸部识别有局限性,专业服务中更常见。

用过,没留下印象。我常用的是VisiPics。
烈之斩
火狐狸
火狐狸
  • UID35302
  • 注册日期2011-02-19
  • 最后登录2021-09-19
  • 发帖数236
  • 经验222枚
  • 威望0点
  • 贡献值118点
  • 好评度23点
  • 社区居民
  • 忠实会员
14楼#
发布于:2015-10-30 05:13
beast:一直有疑问:为什么这些图片搜索引擎,不把部分以图搜图的部分计算量放在用户的计算机上完成,比如将手头的那副图片编码,然后将这个码输入搜索引擎的服务器?这能大大减少搜索引擎的服务器负担。回到原帖
这和图像引擎有什么关系,你不是可以自行上传本地图片搜索吗?
只是你这个脚本做不到而已。

我用的Image search options就可以做到用本地图片搜索(而不是fetch 网络图片)
上一页
游客

返回顶部