网站推广
 
 
网站推广主页
 
 
  首页 | 网站优化 | 全球推广 | 国内推广 | 网站建设 | 基础服务 | 关于我们  
 
咨询热线:
020-85893371
 
85661859
客服热线:
020-85661859
在线服务:
点击这里给我发消息 
点击这里给我发消息 
MSN在线客服 
MSN在线客服 
  首页 >> 推广建议 >> 搜索引擎是如何工作的
 
 

真正意义上的搜索引擎,通常指的是收集了因特网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列。

现在的搜索引擎已普遍使用超链分析技术,除了分析索引网页本身的内容,还分析索引所有指向该网页的链接的URL、AnchorText、甚至链接周围的文字。所以,有时候,即使某个网页A中并没有某个词比如“恶魔撒旦”,但如果有别的网页B用链接“恶魔撒旦”指向这个网页A,那么用户搜索“恶魔撒旦” 时也能找到网页A。而且,如果有越多网页(C、D、E、F……)用名为“恶魔撒旦”的链接指向这个网页A,或者给出这个链接的源网页(B、C、D、E、 F……)越优秀,那么网页A在用户搜索“恶魔撒旦”时也会被认为更相关,排序也会越靠前。

搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。

从互联网上抓取网页
利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。

建立索引数据库
由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大些与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。

在索引数据库中搜索排序
当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。
最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。
搜索引擎的Spider一般要定期重新访问所有网页(各搜索引擎的周期不同,可能是几天、几周或几月,也可能对不同重要性的网页有不同的更新频率),更新网页索引数据库,以反映出网页内容的更新情况,增加新的网页信息,去除死链接,并根据网页内容和链接关系的变化重新排序。这样,网页的具体内容和变化情况就会反映到用户查询的结果中。

互联网虽然只有一个,但各搜索引擎的能力和偏好不同,所以抓取的网页各不相同,排序算法也各不相同。大型搜索引擎的数据库储存了互联网上几亿至几十亿的网页索引,数据量达到几千G甚至几万G。但即使最大的搜索引擎建立超过二十亿网页的索引数据库,也只能占到互联网上普通网页的不到30%,不同搜索引擎之间的网页数据重叠率一般在70%以下。我们使用不同搜索引擎的重要原因,就是因为它们能分别搜索到不同的内容。而互联网上有更大量的内容,是搜索引擎无法抓取索引的,也是我们无法用搜索引擎搜索到的。


搜索常识
为什么登录搜索引擎 为什么登录搜索引擎
搜索引擎发展史 搜索引擎发展史
搜索引擎分类 搜索引擎分类
搜索引擎提交技巧 搜索引擎提交技巧
网站排名基本原则 网站排名基本原则
关键词选择技巧 关键词选择技巧
搜索引擎登录技巧 搜索引擎登录技巧
搜索引擎营销参考 搜索引擎营销参考
 
推广建议
Google网站收录的常问题 Google网站收录的常问题
网站推广的几点建议 网站推广的几点建议
增加“有意义”的访问量 增加“有意义”的访问量
搜索引擎作弊是什么? 搜索引擎作弊是什么?
搜索引擎是如何工作的 搜索引擎是如何工作的
走出网络营销理念的误区 走出网络营销理念的误区
 
关于我们 | 联系我们 | 公司新闻 | 支付方式 | 代理合作 | 诚聘英才 | 常见问题 | 留 言 | 交换链接
 
 

版权所有 © 广州雄讯信息科技有限公司

地 址:广州市天河区天府路东晖西街6号905室
电 话:020-85893371 85661859
传 真:020-85661859 E-mail:sales@xnew.com.cn