搜索引擎9238 2001.6
图象搜索引擎diggit!
图象搜索引擎diggit!不但可以用关键字搜索图象,
还可以让你用图象来搜索图象;
当然还可以同时使用图象和关键字搜索;
尤其有意思的是,你可以用画笔来描述自己想要的图象,边画边搜索,怪好玩的。
diggit!的首页界面还算简单,号称能搜索12606779幅图。
在搜索框里输入关键字,就可以和其它图象搜索引擎一样搜索。
如果选择高级搜索,还能设置以下限制条件:
********************************
图象大小范围:图象格式:GIF、JPEG、PNG
图象属性:
灰度/色彩
动画/静态
透明/不透明
前景/背景
多超链/单超链关键字类别:
Nearby web page text
Title of web page
Meta keywords in page
Alternate text captions
File name of image
Text within image fileMiscellaneous:
Low-res thumbnails Ignore color
*********************************
在众多图象搜索引擎中,单是关键字搜索的高级选项就已无出其右了。
再来看看用图象搜索图象的功能。
在首页左栏有Diggit! FX(ActivX)和Diggit! Graffiti(Java 2) 两个选项,用IE内核浏览器的就要装Diddit! FX(ActivX),只要点击几下就完成了。
安装完成后,回给出一个左右桢的界面,左桢类似windouws的画图工具,但多了很多有用的选项,右桢是检索结果页,你可以设置每页最多显示100幅结果小图。
你想搜索任何一幅图象,只要把那幅图象往画图板里一扔,过几秒(时间也可以自己设置)后右桢就出现类似的图象。
在画图板上随便画点儿什么,右桢也会出现类似图象。
还有更方便的做法。这个窗口平时可以关掉。
在网上浏览时看中任意图象,只要点击鼠标右键,选中右键中的“diggit”,就会弹出这个左右桢的标准窗口,自动搜索跟你右击的那幅图相似的图象。
对于粘贴或右击得来的图象,在搜索过程中会弹出对话框让你填写图象大小,一般不用理它,按确定就是了。如果嫌空间太小,它还会再弹出对话框给你选的,再按一次确定就是。
好了,现在说说偶的使用感受,
偶扔了张梦露照片给它搜,
看结果,哇噻!!
简直是猩猩与丑男齐飞,还有两个活蹦乱跳的烂苹果。
偶又拿起画笔,画了个红日(偶用鼠标画的,说实话,你说它象土豆象甜椒象三角疙瘩都对,象红太阳吗,那是绝对没有的,连鸭蛋都不象),结果还算满意,
但当我在红日下加了兰色的海水后,这结果就莫名奇妙了,不过,这全怪我画得不好,在搜索结果中选了一幅海上日出的图象后,搜索结果稍微好了点,但还是不够好,看起来,diggit对图象的形状和颜色还算掌握得可以,但其它方面就不怎么样了。
如果要加强准确性,那么同时使用关键字和图象搜索是个好主意。
在画图板的下方右“use canvas”和“use keywords”的选项,
在填入合适的关键字后再用图象搜索,结果质量要好得多。
普通搜索界面的搜索框也支持关键字和图象的同时检索,
比如你搜索“bird”,觉得检索结果中某鸟的样子不错,
还可以把搜索框中的关键字改成“fish”,
再点击某鸟图象下的“similar”,就能得到一堆样子不错的鱼。
**********************************************************
图象内容检索历史悠久,虽谈不上完美,但国外已有不少成熟的应用,包括图象搜索引擎,对付侵权的商标搜索,找人的网上人脸搜索等等。
图象内容检索主要依据这几个要素:
颜色特征
=========
图像的颜色特征一般用直方图(color histogram)描述。
直方图的横轴表示颜色等级,纵轴表示在某一个颜色等级上具有该颜色的象索在整幅图像中所占的比例。
图像的颜色特征还有用color moments 、color sets 和color layout来描述的。
纹理特征
=========
从像素分布的方向性和位置可以得到有意义的统计数据。
习惯上把图像中那些局部不规则而整体有规律的特性称之为纹理。
纹理特征主要有coarseness,contrast(对比度),directionality(方向性),
linelikeness(线性),regularity(规律性),roughness,等性能指标,90年代初出现了结合小波转换(wavelet transform)的方法。
专用于寻找某类图片的软件可以预先准备比较数据,自动进行学习,如人体肌肤的纹理、毛发、天空、水、织物、树木的纹理等等。
形状特征
=========
形状特征是图像目标的一个显著特征,很多查询可能并不针对图像的颜色,因为同一物体可能有各种不同的颜色,但其形状总是相似的。如检索汽车的图像,汽车可以是红的、绿的等,但形状是汽车的外形。另外,对于图形来说,形状是它唯一重要的特征。图像中某目标的边缘称为轮廓,而基于形状或轮廓的检索是图像内容检索的一个重要方面,它能从用户勾勒的图像的形状或轮廓入手,在图像库中检索出形状相似的图像。
常见的描述方法有两种,
the entire shape region(基于区域形状),
以及the outer boundary(基于图象内的线条特征)。
形状特征的描述方法还有finite element method,turning function,wavelet description等。
区域特征
===============
人脸,指纹。。。等等等等
这个可以有无穷变化,不细说了。
***********************************************************
改天有空,再仔细点评各图象搜索引擎和技术
“我们若能更妥善地搜寻资料,实在已经改变世界。”