了解搜索引擎（转）-白红宇

了解搜索引擎（转）

阅读量：2501 次

发布时间：2019-05-11

本文共 1425 字，大约阅读时间需要 4 分钟。

在所有网络推广的方法中，搜索引擎是大家谈论最多的，我们的推广之旅也将从这里开始。

确实，搜索引擎是网络推广的一个非常强大的武器，而且免费——但是我们首先必须了解它们。

我们要了解它们是如何工作、如何分类、如何查询……的，而且搜索引擎就像人一样各不相同，所以对于特别重要的引擎，我们还需要了解它们的个性。

1、两个最基本的词汇：

搜索引擎（SearchEngine）:通过运行一个软件，该软件在网络上通过各种链接，自动获得大量站点页面的信息，并按照一定规则进行归类整理，从而形成数据库，以备查询。这样的站点（获得信息==>整理建立数据库==>提供查询）我们就称之为“搜索引擎”。而所使用的软件一般叫做“Spider”、“crawlers”等。

分类目录（Directory）：通过“人工方式”将站点进行分类而建立数据库，以提供查询，这样的站点叫着“分类目录”。典型的搜索引擎如AltaVista、Excite、HotBot、Inktomi等，而最重要的分类目录就是Yahoo。

实际上无论“搜索引擎”还是“分类目录”，目标都一样：获得网站资料，建立数据库提供查询。只不过使用的方法不同。

“搜索引擎”因为依靠软件自动进行，因此，其数据库的容量非常庞大，但是伴随着查询结果往往不够精确；而“分类目录”由于依靠人工分类，查询得到的信息要准确些，但收集的内容非常有限。

我们平时把这两类统称为“搜索引擎”，在下面的讨论中我们将以“自动”的搜索引擎为主，至于“人工”的如Yahoo，我将会在“中文Yahoo”中单独讨论。

2、主要的搜索引擎：

七个最主要的搜索引擎及各自包括的页面数：引擎Alta Vista Northern Light Inktomi Excite Lycos Infoseek Web Crawler页面数（百万页）1501251105550452（以上数据为1999年2月1日统计值）

3、搜索引擎工作的三步：

第一步是“Spider”软件访问一个站点，并通过其中的链接阅读该站点的页面，而且“Spider”会不时的自动回访该站点以检查变化情况；该“Spider”获得的站点信息形成一个巨大的网络信息库，如同整个网络上已经访问站点的备份，当然记录的不是所有的内容。这也就是我们所说的数据库。第三步是查询服务。这是通过查询软件实现的，当你输入查询内容，该软件就会在其数据库中找到相关内容，然后按照“它的”规则进行排序。

4、搜索引擎在查询时是如何排名的：最主要是根据一个站点的内容与查询词的关联程度，但是一个站点的内容搜索引擎又是如何确定的呢？——标题（Title）、关键词（Keywords）、描述（Description）、页面开始部分的内容以及这些内容本身之间的关联程度。而且现在绝大部分搜索引擎都支持MetaTag。

另一个主要因素是一个站点在整个网络上的关联程度，也就是说一个站点在网络中其他站点出现的次数（LinkPopularity）。

虽然不同的搜索引擎有各自的“游戏规则”，但是请记住“关联程度”这个词，包括站内和站外的（整个网络）。

来自 “ ITPUB博客 ” ，链接：http://blog.itpub.net/10294527/viewspace-126865/，如需转载，请注明出处，否则将追究法律责任。

转载于:http://blog.itpub.net/10294527/viewspace-126865/

你可能感兴趣的文章