搜索研究院

 

每日搜索评论16--检索串的3种成分

搜索引擎9238 2002.5

一、检索串定义

  检索串:你输入搜索引擎搜索框中的文字和符号。


二、检索串的3种成分

  检索串的3种成分:主题词、辅助词、外部特征限制
___________________________________________________________
       |        |
  主题词  |  ――辅助词 |   ――外部特征限制
______________|________________|_____________________________

  1. 输入搜索框的检索串,千变万化,但都是由这3种成分组合而成。
  2. 有意识的用这3种成分去分析搜索需求,去设计检索串,
    可以获得极高的效率,可以避免漏搜、避免手足无措。


三、3种成分定义


 A.主题词

-----------------
主题词:表达某种明确概念的词。
   1. 主题词可以表达任何主题,表达某种概念但不限于名词。
     如行业、理论、地区、人物、时间、产品、企业、网站、事件、行为……
   2. 一个主题词通常有很多等同的表达方式。
     如缩写和全称、学名和俗名、简繁体、不同语言说法、
     不同地区说法(美语英语,港台大陆)、不同时代说法(古今、代差)、
     别称、全角半角、大写小写、错别字、网络通假字、敏感词通假……


 B.辅助词

-----------------
辅助词:除主题词以外,跟主题相关的网页中可能存在的任何文字。
   1. 辅助词通常是没有单独意义、随主题各异的动词、数词、量词、代词、形容词……
   2. 如下载、试听、万、年、元、免费……


 C.外部特征限制
-----------------
外部特征限制有两种。
   1. 对词的外部特征限制。如位置(标题、url),关系(near:),变化(通配符)……
   2. 对网页的外部特征限制。如site:,url层数,网页大小,域名,语言,时间,文件格式……


四、检索串设计实例



    检索串成分          检索串实例
_____________________________________________________________
    主题词             中国人
_____________________________________________________________
    辅助词             亿
_____________________________________________________________
  主题词+辅助词          中国人 亿
_____________________________________________________________
主题词+外部特征限制        中国人 site:www.cpirc.org.cn
_____________________________________________________________
主题词+辅助词+外部特征限制    中国人 亿 site:www.cpirc.org.cn
_____________________________________________________________

说明:
  1. 主题词可以单独成为检索串。
  2. 1个检索串中至少有1个主题词。
  3. 1个检索串中可以有多个主题词。


“我们若能更妥善地搜寻资料,实在已经改变世界。”

返回首页