beast
火狐狸
火狐狸
  • UID48534
  • 注册日期2015-01-10
  • 最后登录2017-09-17
  • 发帖数166
  • 经验150枚
  • 威望0点
  • 贡献值90点
  • 好评度0点
  • 社区居民
阅读:2934回复:18

以图搜图问题

楼主#
更多 发布于:2015-10-27 23:24

脚本search by image调用bing搜索网页图片时,有时没有任何结果,比如搜这幅图http://img6.cache.netease.com/photo/0001/2015-01-16/AG2OS3FE4T8E0001.jpg
会提示
对不起,我们无法按以下项的图像进行搜索 [url]http://img6.cache.netease.com/p……

但是,将这幅图保存至本地后,再上传至bing反查,就能返回一些结果。这是怎么回事?

另外,这个脚本中的yandex不稳定,有时反查同一幅网页图片,无结果,但刷新几次后,又返回了一些结果。
烈之斩
火狐狸
火狐狸
  • UID35302
  • 注册日期2011-02-19
  • 最后登录2019-05-04
  • 发帖数236
  • 经验222枚
  • 威望0点
  • 贡献值118点
  • 好评度23点
  • 社区居民
  • 忠实会员
1楼#
发布于:2015-11-01 17:21
beast:我刚改用这个扩展。你是怎么做到用本地图片搜索(而不是fetch 网络图片) ?能否贴出这个扩展的配置文件?回到原帖
默认参数的话,右键点击(指在图片的右键菜单上,右键点击“Google search)就是了。
yfdyh000
千年狐狸
千年狐狸
  • UID29079
  • 注册日期2009-06-07
  • 最后登录2019-11-15
  • 发帖数2225
  • 经验1357枚
  • 威望0点
  • 贡献值52点
  • 好评度135点
  • 社区居民
  • 最爱沙发
  • 忠实会员
2楼#
发布于:2015-10-30 22:30
beast:试过了,VisiPics确实好用。能否再推荐一些你喜欢的软件?回到原帖
用过并留有记录的软件大概过千了,范围过广不好统计,而且近几年也不折腾了。

http://www.zhihu.com/question/36546814 可以参考看看。还有各种软件博客,可阅读和收集。
beast
火狐狸
火狐狸
  • UID48534
  • 注册日期2015-01-10
  • 最后登录2017-09-17
  • 发帖数166
  • 经验150枚
  • 威望0点
  • 贡献值90点
  • 好评度0点
  • 社区居民
3楼#
发布于:2015-10-30 14:50
yfdyh000:不存在这样的服务,用户缺少需求,计算量也太大。除非有专业的付费服务。

算法很多的,不是那么简单。脸部识别有局限性,专业服务中更常见。

用过,没留下印象。我常用的是VisiPics。
回到原帖
试过了,VisiPics确实好用。能否再推荐一些你喜欢的软件?
beast
火狐狸
火狐狸
  • UID48534
  • 注册日期2015-01-10
  • 最后登录2017-09-17
  • 发帖数166
  • 经验150枚
  • 威望0点
  • 贡献值90点
  • 好评度0点
  • 社区居民
4楼#
发布于:2015-10-30 14:49
烈之斩:这和图像引擎有什么关系,你不是可以自行上传本地图片搜索吗?
只是你这个脚本做不到而已。

我用的Image search options就可以做到用本地图片搜索(而不是fetch 网络图片)
回到原帖
我刚改用这个扩展。你是怎么做到用本地图片搜索(而不是fetch 网络图片) ?能否贴出这个扩展的配置文件?
烈之斩
火狐狸
火狐狸
  • UID35302
  • 注册日期2011-02-19
  • 最后登录2019-05-04
  • 发帖数236
  • 经验222枚
  • 威望0点
  • 贡献值118点
  • 好评度23点
  • 社区居民
  • 忠实会员
5楼#
发布于:2015-10-30 05:13
beast:一直有疑问:为什么这些图片搜索引擎,不把部分以图搜图的部分计算量放在用户的计算机上完成,比如将手头的那副图片编码,然后将这个码输入搜索引擎的服务器?这能大大减少搜索引擎的服务器负担。回到原帖
这和图像引擎有什么关系,你不是可以自行上传本地图片搜索吗?
只是你这个脚本做不到而已。

我用的Image search options就可以做到用本地图片搜索(而不是fetch 网络图片)
yfdyh000
千年狐狸
千年狐狸
  • UID29079
  • 注册日期2009-06-07
  • 最后登录2019-11-15
  • 发帖数2225
  • 经验1357枚
  • 威望0点
  • 贡献值52点
  • 好评度135点
  • 社区居民
  • 最爱沙发
  • 忠实会员
6楼#
发布于:2015-10-29 18:00
beast:单幅图片调用火狐脚本,很容易实现以图找图。但是,我手头几百幅图,批量找,就太繁琐了。而且,爬虫在不停改进算法,以前没找到的,一段时间后,可能找到。这时如何让搜索引擎提醒用户呢?

据说,最初,以图找图是这种算法:将图片分割成几十个方格,每个...
回到原帖
不存在这样的服务,用户缺少需求,计算量也太大。除非有专业的付费服务。

算法很多的,不是那么简单。脸部识别有局限性,专业服务中更常见。

用过,没留下印象。我常用的是VisiPics。
beast
火狐狸
火狐狸
  • UID48534
  • 注册日期2015-01-10
  • 最后登录2017-09-17
  • 发帖数166
  • 经验150枚
  • 威望0点
  • 贡献值90点
  • 好评度0点
  • 社区居民
7楼#
发布于:2015-10-29 11:12
单幅图片调用火狐脚本,很容易实现以图找图。但是,我手头几百幅图,批量找,就太繁琐了。而且,爬虫在不停改进算法,以前没找到的,一段时间后,可能找到。这时如何让搜索引擎提醒用户呢?

据说,最初,以图找图是这种算法:将图片分割成几十个方格,每个方格计算敏感对比度,然后汇总成唯一的识别码。但这种算法,无法识别出已经剪切掉一半的图片。

然而,好几次,我都用残缺了一半的图片找到了原始图片。我猜想新算法中可能加入了脸部识别技术。可以想象,如果脸部越清晰,残缺再多的图片也能找到原始图,或者一副图中,有多个人脸,也容易找。


搜索本地硬盘相似图片的软件vistanita duplicate finder,你们都没用过?
yfdyh000
千年狐狸
千年狐狸
  • UID29079
  • 注册日期2009-06-07
  • 最后登录2019-11-15
  • 发帖数2225
  • 经验1357枚
  • 威望0点
  • 贡献值52点
  • 好评度135点
  • 社区居民
  • 最爱沙发
  • 忠实会员
8楼#
发布于:2015-10-29 01:04
meat:二进制操作,本身(html5以前)浏览器对文件读取操作有极大的困难,这还是其次的。图片--》提取关键资料,这个过程算法是图片搜索的核心技术……

公开的算法那就不一样,比如ed2k,magnet之类p2p的hash搜索
回到原帖
他不是那个意思。其实就是XMLHttpRequest得到文件,转成base64编码,把这个编码传送过去。
除了跨域问题和耗时耗流量问题,没什么难度,好像用不上HTML5。跨域问题可能不好解决。其实还是信任问题,网站可以选择信任用户,就像某些网页存档网站,允许这样存档用户端呈现的网页效果(如已登录效果,语言识别效果)。
meat
火狐狸
火狐狸
  • UID35020
  • 注册日期2011-01-06
  • 最后登录2018-12-08
  • 发帖数266
  • 经验199枚
  • 威望0点
  • 贡献值106点
  • 好评度14点
9楼#
发布于:2015-10-29 00:54
beast:一直有疑问:为什么这些图片搜索引擎,不把部分以图搜图的部分计算量放在用户的计算机上完成,比如将手头的那副图片编码,然后将这个码输入搜索引擎的服务器?这能大大减少搜索引擎的服务器负担。回到原帖
二进制操作,本身(html5以前)浏览器对文件读取操作有极大的困难,这还是其次的。图片--》提取关键资料,这个过程算法是图片搜索的核心技术……

公开的算法那就不一样,比如ed2k,magnet之类p2p的hash搜索
yfdyh000
千年狐狸
千年狐狸
  • UID29079
  • 注册日期2009-06-07
  • 最后登录2019-11-15
  • 发帖数2225
  • 经验1357枚
  • 威望0点
  • 贡献值52点
  • 好评度135点
  • 社区居民
  • 最爱沙发
  • 忠实会员
10楼#
发布于:2015-10-29 00:54
beast:一直有疑问:为什么这些图片搜索引擎,不把部分以图搜图的部分计算量放在用户的计算机上完成,比如将手头的那副图片编码,然后将这个码输入搜索引擎的服务器?这能大大减少搜索引擎的服务器负担。回到原帖
那跟你上传图片文件不是一样的吗,还多了一步下载步骤。会造成:下载和上传的耗时明显增加;流量计费的网络;无法保证按网址的真实性,它还得再下载一份来证明。允许按网址本就是为了方便的。
beast
火狐狸
火狐狸
  • UID48534
  • 注册日期2015-01-10
  • 最后登录2017-09-17
  • 发帖数166
  • 经验150枚
  • 威望0点
  • 贡献值90点
  • 好评度0点
  • 社区居民
11楼#
发布于:2015-10-29 00:21
yfdyh000:理论上是对方。Bing不会给出原因(Google等也不会),很难说。没证据,但存在可能性,包括潜在的,如对方认为频率过高。

另外,我有尝试该域名的其他图片,错误提示是相同的。但是,Bing的图片搜索中也有对该域名的图片缓存。所以,不明...
回到原帖
一直有疑问:为什么这些图片搜索引擎,不把部分以图搜图的部分计算量放在用户的计算机上完成,比如将手头的那副图片编码,然后将这个码输入搜索引擎的服务器?这能大大减少搜索引擎的服务器负担。
beast
火狐狸
火狐狸
  • UID48534
  • 注册日期2015-01-10
  • 最后登录2017-09-17
  • 发帖数166
  • 经验150枚
  • 威望0点
  • 贡献值90点
  • 好评度0点
  • 社区居民
12楼#
发布于:2015-10-29 00:14
yfdyh000:理论上是对方。Bing不会给出原因(Google等也不会),很难说。没证据,但存在可能性,包括潜在的,如对方认为频率过高。

另外,我有尝试该域名的其他图片,错误提示是相同的。但是,Bing的图片搜索中也有对该域名的图片缓存。所以,不明...
回到原帖
我也同意你的猜想。据说有些网站嫌三流搜索引擎的爬虫浪费流量,干脆限制它们索引。
yfdyh000
千年狐狸
千年狐狸
  • UID29079
  • 注册日期2009-06-07
  • 最后登录2019-11-15
  • 发帖数2225
  • 经验1357枚
  • 威望0点
  • 贡献值52点
  • 好评度135点
  • 社区居民
  • 最爱沙发
  • 忠实会员
13楼#
发布于:2015-10-29 00:10
beast:是bing的服务器拒绝,还是普通网站的服务器拒绝?为什么搜狗的服务器没有拒绝?难道普通网站对搜索引擎的爬虫区别对待?回到原帖
理论上是对方。Bing不会给出原因(Google等也不会),很难说。没证据,但存在可能性,包括潜在的,如对方认为频率过高。

另外,我有尝试该域名的其他图片,错误提示是相同的。但是,Bing的图片搜索中也有对该域名的图片缓存。所以,不明原因。
beast
火狐狸
火狐狸
  • UID48534
  • 注册日期2015-01-10
  • 最后登录2017-09-17
  • 发帖数166
  • 经验150枚
  • 威望0点
  • 贡献值90点
  • 好评度0点
  • 社区居民
14楼#
发布于:2015-10-29 00:04
yfdyh000:Bing取不到图片,可能服务器拒绝了。回到原帖
是bing的服务器拒绝,还是普通网站的服务器拒绝?为什么搜狗的服务器没有拒绝?难道普通网站对搜索引擎的爬虫区别对待?
上一页
游客

返回顶部