搜索引擎9238 2002.5
一、检索串定义
检索串:你输入搜索引擎搜索框中的文字和符号。
二、检索串的3种成分
检索串的3种成分:主题词、辅助词、外部特征限制
___________________________________________________________
| |
主题词 | ――辅助词 | ――外部特征限制
______________|________________|_____________________________
1. 输入搜索框的检索串,千变万化,但都是由这3种成分组合而成。
2. 有意识的用这3种成分去分析搜索需求,去设计检索串,
可以获得极高的效率,可以避免漏搜、避免手足无措。
三、3种成分定义
A.主题词
-----------------
主题词:表达某种明确概念的词。
1. 主题词可以表达任何主题,表达某种概念但不限于名词。
如行业、理论、地区、人物、时间、产品、企业、网站、事件、行为……
2. 一个主题词通常有很多等同的表达方式。
如缩写和全称、学名和俗名、简繁体、不同语言说法、
不同地区说法(美语英语,港台大陆)、不同时代说法(古今、代差)、
别称、全角半角、大写小写、错别字、网络通假字、敏感词通假……
B.辅助词
-----------------
辅助词:除主题词以外,跟主题相关的网页中可能存在的任何文字。
1. 辅助词通常是没有单独意义、随主题各异的动词、数词、量词、代词、形容词……
2. 如下载、试听、万、年、元、免费……
C.外部特征限制
-----------------
外部特征限制有两种。
1. 对词的外部特征限制。如位置(标题、url),关系(near:),变化(通配符)……
2. 对网页的外部特征限制。如site:,url层数,网页大小,域名,语言,时间,文件格式……
四、检索串设计实例
检索串成分 检索串实例
_____________________________________________________________
主题词 中国人
_____________________________________________________________
辅助词 亿
_____________________________________________________________
主题词+辅助词 中国人 亿
_____________________________________________________________
主题词+外部特征限制 中国人 site:www.cpirc.org.cn
_____________________________________________________________
主题词+辅助词+外部特征限制 中国人 亿 site:www.cpirc.org.cn
_____________________________________________________________
说明:
1. 主题词可以单独成为检索串。
2. 1个检索串中至少有1个主题词。
3. 1个检索串中可以有多个主题词。
“我们若能更妥善地搜寻资料,实在已经改变世界。”