搜索引擎工作原理

一个合格的谷歌SEOer必须了解搜索引擎基本工作原理。很多看似令人迷惑的SEO原理及技巧,其实从搜索引擎原理出发,都是自然而然的事情。就像我们在数学中求导一样,只要理解公式,那你学起来就简单很多。
 
搜索引擎基本工作原理
 
搜索引擎工作过程非常复杂,接下来我们就简单的介绍一下搜索引擎是怎样实现网页排名的。这里大概可分为四个步骤:
 
1.爬行/抓取
首先搜寻引擎会先通过一个叫做「蜘蛛」,也有人称「爬虫」的工具,抓取全球各个地方的网站,看看有那些新增的网站,接着将他们全部下载下来。下载下来之后,就会进入到分析和处理的部分。

备注:搜索引擎蜘蛛又称网页爬虫。目的:抓取高质量的网页内容。下面讲几个常见的搜索引擎蜘蛛分类:
 
1.1Baiduspider(百度蜘蛛)
百度公司还有其它几个蜘蛛:Baiduspider-news(新闻)、Baiduspider-mobile(wap)、Baiduspider-image(图片)、Baiduspider-video(视频),站长经常见到的是Baiduspider和Baiduspider-image。
 
1.2Googlebot(谷歌蜘蛛)
还发现一个Googlebot-Mobile,看名字应该是抓取wap内容的。
 
1.3360Spider(360蜘蛛)
它是一个很“勤奋抓爬”的蜘蛛。
 
1.4Sogou News Spider(搜狗蜘蛛)
还包括如下这些:Sogou web spider、Sogou inst spider、Sogou spider2、Sogou blog、Sogou News Spider、Sogou Orion spider,看最权威的百度的robots.txt http://www.baidu.com/robots.txt 就为Sogou搜狗蜘蛛费了不少字节,占了一大块领地。
 
2.分析/处理
搜索引擎将网页抓取回来后,会开始分析网站的内容,包含title、description、keywords……等一些重要的信息。然后来了解我们的网站是什么主题。
 
3.收录/索引
搜索引擎在抓取、分析处理我们的网页后,会将获得的信息建档、收录到搜索引擎。并且定期的检查这些网页的内容是否有做更新及变动。这个过程就被称为“索引”,目的是当使用者搜寻时,搜寻引擎能迅速找到相关资讯,并将信息推荐给用户。
 
4.搜索和排名
用户输入关键词后,排名程序调用索引库数据,程序自动匹配关键词,然后按一定规则生成搜索结果展示页面,这是因为前面的预处理,搜索引擎才能够在很短的时间内返回输出结果,这里特别要提醒一下,自然搜索排名和竞价推广排名有区别的。

怎么吸引更多的蜘蛛来抓取网站页面??
 
有频率的更新网站内容,最好是高质量的原创内容。手动提交URL给搜索引擎新页面,让蜘蛛更快的发现。建立外部链接,能够和相关的网站做友情链接交流,能够去其他渠道发布高质量的文章指向自己的页面,内容要相关。制造网站地图,每个网站都应该有一个sitemap,网站一切的页面都在sitemap中,便利蜘蛛抓取。


本文标签: 搜索引擎

标题:搜索引擎工作原理

转载注明出处:https://www.198ai.cn/seojiaocheng/5.html