搜索研究院

 

Google要收费啦?胡扯些什么,那是ZDnet哗众取宠

搜索引擎9238 2001.8

·Google要收费啦! <160 byte > blue_blue_boy <08-26 10:25:21> [点数:76]

·Google要收费啦?胡扯些什么,那是ZDnet哗众取宠 <6717 byte > 搜索引擎9238 <08-26 15:19:33> [点数:83]

·没人对掐,难出火花,难出精品。寂寞、寂寞! <0 byte > 搜索引擎9238 <08-26 15:21:35> [点数:26]

·没办法,使你老太高了 <0 byte > 高十八 <08-26 20:03:16> [点数:12]

·再问一句,兄台是不是就是做搜索引擎呢? <26 byte > 高十八 <08-26 20:04:43> [点数:24]

·谁想超过他? <348 byte > 信息经纪人 <08-26 10:29:31> [点数:25]

·咦,前辈在暗讽我不懂搜索么? <6 byte > 搜索引擎9238 <08-26 10:37:15> [点数:15]

·不敢,你的文章我看过,佩服 <307 byte > 信息经纪人 <08-26 17:20:34> [点数:20]

·媒体写搜索,错误多过正确,不能纠正之。痛苦、痛苦! <0 byte > 搜索引擎9238 <08-26 15:24:43> [点数:12]

·你真的很厉害!不能怪别人不能和你对掐,是你太厉害了。... <0 byte > 舒歆桐 <08-26 21:16:41> [点数:15]

·谢谢老师的指点,我想你也该收费了?! <0 byte > blue_blue_boy <08-26 08:35:42> [点数:13]


主题:Google要收费啦?胡扯些什么,那是ZDnet哗众取宠
版权所有:搜索引擎9238 原作 提交时间:15:19:33 08月26日

  我总结过,搜索引擎的收费方式从大的方面来讲有12种。

  其中有一种叫做paid inclusion 或 pay for inclusion,是全文检索技术公司的专有收费方式。

paid inclusion仔细分一下,又可以分3种内容:

一是收费以后,提高对某些网页的抓取频率,如inktomi对普通收费网页每48小时抓一次,对大网站的收费网页(1000页以上)允许自由设定抓取频率及时间,又如fast对付费网页提供24小时一次的抓取频率,而inktomi和fast对普通未交费网页的抓取分别在一个月和10天左右。

二是收费以后,保证收录网页,正常的spider总有没抓的网页,交了钱就保证收录了,虽然也要审查,满足一定的要求。这是很基本的东西,现有的paid inclusion包括inktomi,fast,altavista都包含这功能。

三是收费以后,对某些正常spider抓不了的特殊网页,允许网站自己填写摘要,然后也能被搜了,这对某些动态网页、图片网页、特殊文件格式的网页都是福音,inktomi支持这么做。

各家的paid inclusion不一样,不一定包含所有内容,但共同特征是不影响搜索结果排名,并且因为提高了更新速度,反而提高了搜索结果的质量,这是搜索引擎、用户、客户三赢的收费方式。

  当然,如果为了收费而明里暗里限制免费网页收录,那就另当别论了。inktomi是干这事的,但fast和Google不会——以我对搜索引擎们的理解判断。

  zdnet的原文是《Google working on paid-crawl service》(http://news.zdnet.co.uk/story/0,,t269-s2093675,00.html),可是这标题所指的内容是它自己推测的。zdnet原文中明明写了Google的发言人只承认“Google engineers are working on improving the freshness of the search engine index”,而且拒绝“add any details of potential uses of the technology”,可是到了zdnet的嘴里,连标题都成了
《Google working on paid-crawl service》,其哗众取宠的心态可见一斑。

  大约10天以前,我发现在Google能检索到24小时以前的新浪新闻和论坛内容,很是吃了一惊,而且第二天那些内容消失了,又变回一个月以前的。当时,有资深人士推测Google在做试验,到了21日的researchbuzz(http://www.researchbuzz.com/news/index.html)出版,果然证实了推测。

  zdnet有searchiq.com这样的优秀网站,我想它不是没人懂搜索引擎,它的标题推论也不算太错,事实上我看到researchbuzz的消息后的推论之一也是Google会用它做paid inclusion服务。但是zdnet没弄明白这个试验的真正意义,做出的推测本来可能是对的,但它急于哗众取宠,从容易炒作但是错误的方向看,使得整个文章出错,并反过来使得它的推测也成了错的。

  并且zdnet文章里引用的资料也是含混不清,不知道是Google轻视它敷衍它还是作者自己瞎体会瞎理解?
看看专业搜索媒体researchbuzz的引用资料“We've begun to test some new technology that indexes certain pages on a daily basis, rather than once a month.”、“At this point, we're still in the early phases of testing, and are evaluating a variety of different types of web pages that change on a regular basis - such as news sites like CNN.com”。

  再看看researchbuzz的评论“Because it's a critical feature”、“I can think of a half-dozen things off the top of my head that they could be doing, but they're not doing them. ”这才是正确的理解正确的评论。
zdnet在这篇文章上的表现,活脱脱一个强加价值观、哗众取宠的三流媒体,就象国内大多数媒体。

  哦,想起来了,还有一个地方应该是zdnet文章的问题,文章在引用Google发言的时候说“rather than the standard 30 days it takes Google to index the rest of the Web”,它说的是30天;而researchbuzz作者说的是“rather than once a month”,它说的是一个月。我相信Google发言人说的是一个月,这个zdnet的作者就想当然写成30天了。
各位可能觉得我吹毛求疵了,一个月和30天有多大区别?就算有的月大,有的月小,也是可以理解的吗。
但是,据我所知,说Google索引周期一个月是对的,说Google索引周期28天也是对的,但是说Google索引周期30天就是错的。

  因为,Google索引周期的一个月,不是公历的一个月,是天上月球循环的一个月。
对,就是嫦娥MM和小兔宝宝呆的那个地方,就是李白举头望的那个东东,月亮。
每当新月开始,就是Google更新索引库的时候,前后会延续或参差几天,但大的更新周期不会错,月圆月缺,28天。
第一次知道这个的时候,我感到背上阵阵寒意,不禁去想Google的创始人跟吸血鬼或是狼人有没有血缘关系?

  再说说这位“blue_blue_boy”的发言“最新消息,一向坚持免费政策的Google实在忍不住诱惑,准备推出收费索引服务,好在似乎仅限于更新频繁的网站,如新闻网站等。交费后Google会每天或每星期检索一次你的网站。”,不知道是自己翻译的还是哪个网站上看的,似乎比zdnet还要过分。说说你发言中的错误吧:

1、“最新消息”是什么时候,好像是好几天以前的旧闻了。
2、“一向坚持免费政策的Google实在忍不住诱惑”,哇噻,你钻到Google肚子里去了?你怎么知道它忍不住诱惑?
3、根本没有这个消息,“Google准备推出收费索引服务”没有消息来源,只是大家推测。
4、“好在似乎仅限于更新频繁的网站,如新闻网站等”,错啦错啦,Google目前的试验是“仅限于更新频繁的网站,如新闻网站等”,但这句话跟前面的收费索引服务连起来,简直错得一塌糊涂。一错在如果Google开收费索引服务,绝不会“仅限于更新频繁的网站”,二错在“更新频繁的网站,如新闻网站等”根本不是收费的对象,快速索引这些网站是为了提高搜索引擎的即时性。
5、“交费后Google会每天或每星期检索一次你的网站”,象这种服务,即使真的开通,也只会提供一种时间,就是一天,不会是每天或每星期。

综上所述,这位网友的发言每一句都是错的。

有破有立,搜索引擎9238的看法是:

1、Google的快速索引试验至少8月14日以前就开始了,现在仍在试验阶段,可能持续一、两个月的时间,结果会是成功。
2、快速抓回来索引部分网页很容易的,是搜索引擎公司都能做,难点是怎样排序,是怎样计算这些网页和其它网页的关系和排序权值。
3、著名新闻网站如CNN.COM,NEWS.SINA.COM,以及其它有必要每天更新的网页,会被免费每天索引。
4、这是一个革命性的搜索引擎进步。网页快照解决了搜索引擎的死链接问题,而快速索引部分解决了搜索引擎信息的滞后性。
5、一天以前的新闻仍然有滞后性。目前,对于搜索引擎信息滞后性,正常网页检索结果前增加实时新闻检索仍是完美解决方案。Google即使发布快速索引服务,仍然需要一天内的实时新闻检索,也许象Google英文版,或者象tom大陆版做的那样。
6、Google推出该功能后,某些搜索引擎会跟上,开始对部分新闻网站免费快速索引,英文圈fast是最有可能的,中文圈百度是最有可能的。
7、Google很可能利用该技术发布paid inclusion,提供高频率索引,提供保证索引,但不提供自由填写摘要,不提供影响排序的服务。

这两天我快被Google逼疯了。

  上回因为有求于人,所以针对某个关键字指点了某人几招,以提升他的网站在Google上的排名,算是比较保守的指点了,没想到昨天上Google一看,他的网站从58位爆升至第6位,而且因为前面有两个网站是凭更多结果占了两个位置的,所以实际上他的网站已升到第4了。

  我很害怕,想想还好留了几手,这样破坏自然规律是很不好的,非常不好,以后不能再教人干什么了,最多教人别干什么。 因为没想到玩转Google这么容易,觉得很奇怪,于是我开始仔细研究Google对那个关键字的搜索,包括Google的主力和3个替补:www.google.com;www1.google.com;www2.google.com;www3.google.com

  然后发现这4个Google有点颠来倒去的,其先后性和作用不象以前想的那样简单。

  而最大的发现是我用同一个关键字搜索,在一天之中居然得到5种搜索结果,居然有5个截然不同的网页曾排名第一。
于是我开始仔细研究那5个第一的网页在不同搜索结果中的区别,研究它们的超链分析质量和数量,果然收获不小,特别是发现主力www那个第一简直是个笑话,如果那样也能成第一,那我简直什么网页都能做到第一,那Google的相关性从何而来?

想破脑袋,也只能勉强解释为测试。


“我们若能更妥善地搜寻资料,实在已经改变世界。”

返回首页