首页 SEO答疑搜索引擎的原理是如何？

搜索引擎的原理是如何？

2021.04.26

爬行和抓取
蜘蛛：搜索引擎用来爬行和访问页面的程序被称为蜘蛛（spider），也称为机器人（bot）。

跟踪链接
为了抓取网上尽量多的页面，搜索引擎蜘蛛会跟踪页面上的链接，从一个页面爬到下一个页面，就好像蜘蛛在蜘蛛网上爬行那样，最简单的爬行策略分为两种，一种是深度优先，另一种是广度优先。

地址库
为了避免重复爬行和抓取，搜索引擎建立记录已经被发现还抓取或未被抓取页面的地址库。

文件存储
搜索引擎蜘蛛抓取的数据存入原始页面数据库。其中的页面数据与用户浏览器得到的HTML是完全一样的。每个URL都有一个独特的文件编号。

预处理（提取文字、中文分词、去停止词、消除噪声、去重、正向索引）

提取文字：搜索引擎预处理首先要做的就是从HTML文件中去除标签、程序，提取出可以用于排名处理的网页面文字内容。

去重：搜索引擎不喜欢重复性的内容。对来自不同网站的同一篇文章，搜索引擎希望只返回其中的一篇，所以搜索引擎进行了识别和删除重复内容，去重解释了为什么收录量增加后又减少的原因，也告诫我们原创的重要性。这里的原创不是一味的原创，而是创造对用户有价值的东西，也是谷歌判定排名的重要基础。

SEO应该如何做好
1.关键词的分析布局，用户的体验
2.有效的计划和定期高质量内容的更新
3.把握竞争对手和搜索引擎的趋势
4.实际操作，执行力，坚持
5.多样化的技能，程序，编辑，推广，口碑，负面监控等都要懂一些

上一页 : 专题页面设计，如何做更符合网站SEO？
下一页 : 为什么要做SEO？