自从上世纪末Google搜索技术的发迹,搜索引擎这个新事物逐渐被人们所热切讨论。现在越来越多的人使用搜索引擎了,甚至有的人上网就离不开搜索引擎!
那么哪个搜索引擎的中文搜得最准确?哪个最快?哪个搜索引擎的网站最适合您呢?笔者根据试验,记录相关数据并给予评价,希望能给大家一个参考。
注:因为搜索引擎的算法非常复杂,我们只取其用户看得见摸得着的项目进行评测。
参评的六个搜索引擎介绍
Google搜索拥有全球最领先的搜索引擎技术,其用户数量庞大,在全球搜索引擎市场中占有最大份额。其信息量大、更新及时深受许多用户欢迎。 | 中国市场份额最大的搜索引擎。领先的中文搜索引擎。每分每秒,接受来自全球各个国家的中文搜索请求。其专业的中文搜索技术使其深受中国用户喜欢。 | 互联网最早的网页分类提供网站,随着搜索引擎技术普及,Yahoo搜索技术也从第一代目录式搜索发展到如今第三代搜索引擎技术。 |
微软去年新推出的MSN搜索,主要在英文上使用,在中文上使用还在完善阶段。 |
诞生于04年8月,由门户网站搜狐推出的全球首家第三代中文互动式搜索引擎服务。以电脑与用户在互动提示下进行搜索为主要特征。 | 原是慧聪搜索,是国内领先的搜索引擎公司。先后为新浪、搜狐、网易、TOM等知名门户网站,及中国搜索联盟上千家各地区、各行业等优秀中文网站提供搜索引擎技术。 |
项目1:页面速度评测
人们使用搜索引擎的目的就是为了检索信息,所以成功的搜索引擎站点在设计上都是为了让用户以最快速度的“离开自己的页面”。这样就意味着该搜索引擎站点有着较高的搜索效率。为此,笔者评测了以下两个参数:
主页文件大小:笔者对六大搜索引擎的访问页文件大小(即访问该页面产生的数据传输流量)进行了统计比较。
图表一 主页文件数据大小
百度的搜索页面最为简洁,访问速度也是最快的。由于MSN搜索引擎访问时,会下载一些运行程度代码,所以导致数据量特别大,一定程度
生成搜索页面时间 当搜索关键词后,生成的结果列表需时更是一个重要的速度参数。于是笔者通过秒表以精确度为0.1秒的原始方法进行测量,并使用了四个关键字:“软件下载”、“软件资讯”、“pconline”、“ectend”。 *注:各搜索引擎结果生成页上方都有页面生成时间,但这并不代表用户所等待的时间,为此评测以用户使用为出发点,记录点击“搜索”按钮后,至结果列表页生成所需要的时间。数据记录如下表(单位:秒):
关键字/搜索引擎 | 雅虎 | MSN |
百度 |
搜狗 |
中搜 | |
“软件下载” | 0.7 | 0.4 | 1.2 | 0.4 | 0.6 | 0.5 |
“pconline” | 0.6 | 0.5 | 0.7 | 0.5 | 0.6 | 0.6 |
“软件资讯” | 0.8 | 0.9 | 1.6 | 0.5 | 1.2 | 0.8 |
“ectend” | 0.6 | 0.5 | 1.4 | 0.8 | 0.7 | 0.9 |
所有关键字需时平均 | 0.675 | 0.575 | 1.225 | 0.55 | 0.775 | 0.7 |
*注:为了使数据尽可能精确,笔者对各关键字进行了三次测试,然后将其平均值填入上表。
图表二 搜索结果页面生成平均需时
不容置疑,在这个速度评测环节中MSN搜索引擎的表现差强人意,两个测试项目MSN都明显落后于其它的搜索引擎。而百度稍有优势,但是并不是太大。总体上来讲其它五个搜索引擎在速度上基本上是相近的。
项目2:搜索内容评测
搜索引擎搜索出来的内容,也是评价一个搜索引擎好坏的重要标准。下面笔者对搜索结果的数量、搜索内容的相关性、搜索内容的死链率、提供搜索服务的种类进行了评测。
搜索结果数量对比 为了体现数量上的差异,笔者使用了五个热门且性质不同的关键词:“四六级考试”、“电子商务趋势”、“馒头血案”、“徐静蕾”、“神舟六号”。另外,为了一定程度上反映各搜索引擎的更新速度,笔者还搜索了五个时效性较强的关键词:“馒头饭”、“奥斯卡之梦”、“盛大亏损”、“K娃”、“百度财报”。并根据各引擎搜索的结果数量进行了记录:
关键词/搜索引擎 | 雅虎 | MSN |
百度 |
搜狗 |
中搜 | |
四六级考试 | 7,330,000 | 2,700,000 | 0 | 1,690,000 | 1,152,289 | 485,000 |
电子商务趋势 | 1,460,000 | 3,750,000 | 0 | 542,000 | 1,332,714 | 13,200,000 |
馒头血案 | 800,000 | 5,640,000 | 23 | 3,490,000 | 416,604 | 54,100 |
徐静蕾 | 1,270,000 | 5,260,000 | 494,991 | 1,680,000 | 599,387 | 1,610,000 |
神舟六号 | 2,660,000 | 2,520,000 | 59 | 1,530,000 | 855,858 | 666,000 |
馒头饭 | 4,030 | 7,000 | 4 | 10,000 | 349,918 | 1,181 |
奥斯卡之梦 | 736,000 | 1,330,000 | 1 | 87,800 | 27,350 | 5,299 |
盛大亏损 | 736,000 | 13 | 0 | 261,000 | 106,043 | 5,890,000 |
K娃 | 495,000 | 17 | 0 | 49,900 | 61,034 | 7,570 |
百度财报 | 390,000 | 1,390 | 0 | 212,000 | 67,980 | 687,000 |
图表三 五个热门关键词搜索结果对比
图表四 五个时效性强的关键词搜索结果对比
搜索结果分析:根据众多数据整体分析:雅虎、google、百度对于网页的抓取数量较多,由此说明这三个搜索引擎索引的互联网网页数多。对于时效性强的关键词,Google反应最快,抓取的页面数量也是最多的。另外MSN搜索引擎在测评中表现极其不佳,笔者认为这是因为暂时来说MSN搜索引擎对中文的页面抓取不够。而中搜网对于个别的关键词列表数量多,但并不能影响其整体数据。
值得说明的是,在搜索关键词“馒头饭”时,搜狗的结果数量十分的多。通过进一步分析,笔者发现事实上与该关键词相关的不足100条,之后的结果毫无相关性。这说明仅仅考查一个搜索引擎的结果数量是不够的,还需要人工地对结果的相关性进行分析,于是笔者进行了下一个评测项目:
相关性评价与死链率:分别搜索两个关键字,对前四十个结果进行评分。相符的记2分,结果不相符、结果重复或者页面无法打开的记0分,基本相符的记1分。并对无法打开页面进行统计,得出死链率。
项目/搜索引擎 | 雅虎 | MSN |
百度 |
搜狗 |
中搜 | ||
“搜索引擎” | 相关性 | 56 | 58 | 43 | 59 | 51 | 48 |
死链率 | 12.5% | 0% | 7.5% | 5% | 2.5% | 2.5% | |
“电子商务” | 相关性 | 55 | 42 | 47 | 53 | 52 | 50 |
死链率 | 5% | 10% | 5% | 5% | 2.5% | 7.5% |
图表五 两个关键词搜索结果相关性评分比较
根据结果,总体上来说:Google和百度在结果的相关性上稍胜一筹,说明在技术上还是有所领先。对于Google存在死链接率较高,在一定程度上是根据我国法律法规和政策的所限定的,而其它搜索引擎在相关性与死链率上相差不大。MSN搜索中文的功能亟待加强。另外搜狗与中搜的搜索结果重复率偏高。
因为针对不同的关键字有不同的结果,所以得出的数据能否完全判定一个搜索引擎搜索相关程度还待商榷。
搜索服务的种类 在一些基本的搜索服务上,Google、百度做得比较齐全的。不过在Google的搜索使用上比较复杂,需要认真参看搜索帮助才可以搜索到你特定的内容。各搜索的情况如下表: (○代表有,×代表没有)
项目/搜索引擎 | 雅虎 | MSN |
百度 |
搜狗 |
中搜 | |
网页 | ○ | ○ | ○ | ○ | ○ | ○ |
资讯 | ○ | ○ | ○ | ○ | ○ | ○ |
图片 | ○ | ○ | ○ | ○ | ○ | ○ |
音乐 | × | ○ | ○ | ○ | ○ | ○ |
地图 | ○ | × | × | ○ | ○ | ○ |
学术(国学、Encarta) | ○ | × | ○ | ○ | × | × |
论坛(贴吧、说吧) | ○ | × | × | ○ | ○ | ○ |
各种常用生活搜索 | ○ | × | × | ○ | ○ | ○ |
项目3:其它杂项测试
搜索内容广告:广告是搜索引擎重要的收入来源之一。参加评测的六大搜索引擎除了MSN外,都有广告。笔者搜索了“电脑”这个做广告最热门的关键词发现,五家(除MSN外)都在搜索结果右边都有相关文字广告。另外,百度、雅虎的搜索结果排名是按照竞价排的,而非自然机器选择。令用户遗憾的是,百度的前十个搜索结果都是赞助的广告商。
网页快照:十分欣喜地看到六大搜索引擎都具有网页快照的功能,十分的方便。不过对于中国用户来说Google的网页快照有时显示却不太正常,或者无法显示,的确给用户带来一定的不便。
搜索扩展工具:所有的搜索引擎都希望可以把搜索本机化,主导用户的搜索方式。于是它们都积极地开发了各类搜索扩展工具。有兴趣的网友可以下载一款使用试试,或许可以给你更快的搜索感觉。
Google |
雅虎 |
MSN |
百度 |
搜狗 |
中搜 |
|
|
项目4:特色功能一览
以下特色功能并不是各搜索引擎所有辅助功能,笔者只是不完全地挑选一些比较实用的功能与网友们分享:
Google 、、、、、、、、和翻译网页功能。
雅虎 、、
MSN 、(全是英文版)
百度 、、
搜狗 、
中搜 、
总结:
笔者为评测设计合理的评测方式与记录最客观的评测数据尽了最大的努力:通过点击访问一千多个网页,反复修改,完成此文。由于技术上的局限和不完善。但是基于这样一个相同的测评平台,我们可以看到Google、百度、雅虎表现不失大家风范。
如百度有着优势的中文搜索结果,Google有着迅速的抓取网页速度,其它搜索引擎也有着各种特色的搜索功能。
不过在评测中,各搜索引擎存在一些问题都暴露出来:如Google搜索时的出现提示的“相关搜索”关联性不强,用中搜索时,会出现无搜索结果的不稳定情况,百度、搜狗搜索结果在后面的条数与关键词无关联性。而MSN由于还在Beta阶段,希望在未来的日子里,MSN搜索也将被更多中国人使用。
大家在搜索信息的时候,笔者的建议是针对时效性的“新”信息,采用Google搜索;针对本地程度化强的采用百度搜索;如果有一些特定的搜索目标,可以参考各搜索引擎的特色功能;对于重要的搜索内容,建议用多几个搜索引擎,一定能找到您满意的结果!