无所不及的搜索引擎

时间:2023-12-12 10:49:01

无论是工作还是生活中,当我们遇到不明白的总会去百度一下,打开百度的页面,然后输入你要查找的关键词。几秒钟后,你所需要的信息就呈现在你面前了,然后我们从中找出自己所需要的信息。那么你知道这是什么技术吗?这就是搜索引擎技术。

无所不及的搜索引擎

互联网发展早期,网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自己想找的网站。虽然这种方式也能找到自己想要的网站,但从严格意义上讲,它并不是搜索引擎。

1990年,加拿大麦吉尔大学计算机学院的师生开发出Archie。当时,万维网还没有出现,人们通过FTP来共享交流资源。Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件。用户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件。虽然Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,Archie被公认为现代搜索引擎的开山鼻祖。

搜索引擎是一个系统,能从大量信息中找到所需的信息,提供给用户。互联网出现以后,信息量浩如烟海,在这么多的信息中怎样检索自己需要的信息呢?搜索引擎就像一只神奇的手,可以从杂乱的信息中抽出一条清晰的检索路径。

搜索引擎从最初的Archie可以用文件名查找整个互联网中FTP文件的系统,发展到Yahoo早期一种手工录入的分行业的目录检索。随着搜索技术的发展,元标记搜索、全文搜索重新又把整个互联网的信息整合起来提供给用户,目前的Baidu、Google提供的就是一种整个互联网的全文搜索,这种整合信息的搜索也称为水平搜索。但这种搜索也是有局限的,因为它虽然把网络中的所有相关信息提供给用户,但这种“所有”不代表着是用户所需的“所有”,往往夹杂着许多垃圾信息。但这也不是不能解决的,目前Baidu、Goolge都有了“更多”的选项,多了新闻搜索、图书搜索、图片搜索等等这些专业化、行业化的搜索,也称为垂直搜索。这样便帮助用户避免了很多不必要的麻烦。

随着互联网的发展,网上可以搜寻的网页变得愈来愈多,而网页内容的质量亦变得良莠不齐,没有保证。所以,未来的搜索引擎将会朝着知识型搜索引擎的方向发展,期待为搜寻者提供更准确、更适用的资料。