搜索引擎只能搜索到百分之十几的互联网
页面
美国新泽西州NEC研究所的SteveLawrence博士和C.Le
eGiles博士对互联网搜索引擎的一份调查研究表明,现在
的搜索引擎,性能并不如想象中那么优秀,它们最多只能
搜索到百分之十几的互联网页面。
调查结果指出,在全球11个主要的搜索引擎中,搜索
引擎仅能搜索到国际互联网上全部页面的16%,或者更低。
11个大型搜索引擎调查评测结果是:
NorthernLight:16%、Snap:15.5%、Altavista:15.
5 %、HotBot:11.3%、Microsoft:8.5%、Infoseek:8.0%、
Goo gle:7.8%、Yahoo:7.4%、Excite:5.6%、Lycos:2.5%、
Euro seek:2.2%)
据科学家们估计,在国际互联网上大约有8亿个页面。
这些页面,大约有15太字节的数据,其中有6太字节的文本
数据,剩下的空间大多是Html、标签、注解,和空白的页
面。另外还有1.8亿张图片,大约有3太字节。在这些个页
面中,有83%的页面内容包含了商业内容,6%的内容是关于
科学、教育的页面,还有1.5%的页面包含着色情内容。
造成这种情况的原因,主要是因为这些搜索引擎没有
及时更新他们的数据。另外,这些搜索引擎似乎存在着一
点" 偏见",这也是搜索引擎的搜索范围下降的原因。流行
站点、美国站点以及商业站点的索引要比科技、教育等内
容的站点要多得多。
选自《计算机世界》
|