返回上一页  首页 | cnbeta报时: 20:19:06
网友测试报告:大量搜索引擎普遍存在的识别字段Bug
发布日期:2006-09-18 15:43:16  稿源:
也许是搜索引擎对关键词考虑得过于周到,于是我们会遇到如下问题:
首先我们尝试在www.baidu.com中搜索一下“ASP.NET”或者“ADO.NET”,有.NET编程基础的人都知道这是微软.NET下的几个专业术语,在.NET程序员的生活中可以说是最常见的了,我们的搜索结果是什么?对于“ASP.NET”来说,有用10个手指都数得清的结果,而“ADO.NET”就只有1个搜索结果~~~
这是不是太奇怪了?

我们继续尝试搜索“ASP.NET 教程”,这次返回的结果就有很多了,正常!

这样的问题对于搜索引擎来说并不小啊~(已经给Baidu的WebMaster去了一封电子邮件,貌似还没有回应的样子~).我们分析一下这个问题之前,来检查一下我们的查询输入~

我继续尝试了一下形如“xxx.yyy”的搜索串,得到一个结论:凡是形如“xxx.yyy”的搜索字符串,并且“yyy”是某个互联网的域(例如 net/com/cn/org等),baidu的搜索引擎会将其认为是网址,而不是理解为用户理解的普通搜索字符串,于是baidu就会返回包含了 xxx.yyy的网址集合,当然少啊~~

我又在Google进行了类似的实验,搜索结果没有问题,成功的将网页中包含“asp.net”之流的页面搜索出来,而不仅仅只有网址符合的结果集,可见在该问题上,Google的算法和规则制定的比较完善,Baidu的工作的精细度还不够,也许是由于时间不长的关系吧.

初步整理一下思路,认为Baidu现在应该适当的修改对搜索字符串的理解的那部分代码,要么将“网页内容”和“网址”的搜索规则进行合并,那么设定特殊搜索字符集来适应这种比较特殊的(也不是很特殊嘛)搜索情况.

希望Baidu能够早日修复该问题,不要邮件系统自动把我的邮件给当垃圾邮件删除了就好~~

P.S.其他的搜索引擎没有尝试过,大家可以尝试一下哈.

Updated:
www.sogou.com 也存在类似问题,将“ASP.NET”认为是用户要搜索网址,而不是网页内容.

cha.iask.com 也存在该问题,将ASP.NET站点的内容搜索出来,而不是网页内容包含ASP.NET的~

search.cn.yahoo.com 也存在该问题,症状和上面新浪爱问搜索的相同.

search.yahoo.com 和雅虎中国的症状一样,果然是原版技术啊~

search.online.sh.cn 出现了和Baidu一样的搜索结果,还是错啊~~

search.tom.com 一样的症状~~搜索结果还是那么域名符合的站点,而不是使用页面内容匹配~

search.21cn.com 同样的问题,不说了~

投稿人:ComputeBank
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-
我的Blog,创业、思考与探讨下一代计算技术:
http://computebank.spaces.live.com/

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 20:19:06

文字版  标准版  电脑端

© 2003-2025