小禾呈科技干货 | SEO 小白必读的文章!你真的了解搜索引擎吗?

2019-10-29

干货 | SEO 小白必读的文章!你真的了解搜索引擎吗?


做一个合格的 SEOer,怎么能不了解搜索引擎呢?知道它的工作原理,对于搜索引擎优化是非常有帮助的。

SEO 人员必须知道搜索引擎要解决什么问题、有哪些技术上的困难、有什么限制、搜索引擎怎样取舍。

干货 | SEO 小白必读的文章!你真的了解搜索引擎吗?


搜索引擎的工作过程

搜索引擎的工作过程大体上可以分成三个阶段。

(1)爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问网页,获得页面 HTML 代码存入数据库。

(2)预处理:索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理,以备排名程序调用。

(3)排名:用户输入关键词后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。

  • 爬行和抓取

搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),蜘蛛程序发出页面访问请求后,服务器返回 HTML 代码,蜘蛛程序把收到的代码存入原始页面数据库。

SEO 人员要想让自己的更多页面被收录,就要想方设法吸引蜘蛛来抓取。蜘蛛会尽量抓取重要页面。

哪些页面被认为比较重要呢?有几方面影响因素。

● 网站和页面权重;

● 页面更新度;

● 导入链接;

● 与首页点击距离。

  • 预处理

预处理的步骤如下:

1. 提取文字;

2. 中文分词;

3. 去停止词;

4. 消除噪声;

5. 去重;

6. 正向索引;

7. 倒排索引;

8. 链接关系计算;

9. 特殊文件处理。

  • 排名

经过搜索引擎蜘蛛抓取页面,索引程序计算得到倒排索引后,搜索引擎就准备好可以随时处理用户搜索了。用户在搜索框填入关键词后,排名程序调用索引库数据,计算排名显示给用户。

首先,搜索引擎会进行搜索词处理,进行中文分词、去停止词、指令处理、拼写错误矫正、整合搜索触发的步骤;

第二步,搜索引擎开始文件匹配并选择初始子集;

下一步,搜索引擎会进行相关性计算,影响相关性的因素很多,包括关键词常用程度、词频、密度、关键词位置、页面权重等。

通过排名过滤后,搜索引擎会显示排名。

干货 | SEO 小白必读的文章!你真的了解搜索引擎吗?


高级搜索指令

作为 SEOer,有一些高级搜索指令,可以帮助你在日常的工作中进行竞争对手研究和寻找外链。

双引号

把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。

使用双引号搜索可以更准确地找到特定关键词的竞争对手。

inurl:

inurl: 指令用于搜索查询词出现在 URL 中的页面。

比如搜索「inurl: 搜索引擎优化」,返回的结果都是网址 url 中包含「搜索引擎优化」的页面。由于关键词出现在 URL 中对排名有一定影响,因此使用 inurl: 搜索可以更准确地找到竞争对手。

Intitle:

intitle: 指令返回的是页面 title 中包含关键词的页面。

title是目前页面优化的最重要因素。做 SEO 的人无论要做哪个词的排名,都会把关键词放进 title 中。使用 intitle 指令找到的文件才是更准确的竞争页面。如果关键词只出现在页面可见文字中,而没有出现在 title 中,大部分情况是并没有针对关键词进行优化,也不是有力的竞争对手。

site:

site: 是 SEOer 最熟悉的高级搜索指令,用来搜索某个域名下的所有文件。比如搜索:

site:suki.xiaohecheng.com,返回的就是 suki.xiaohecheng.com 这个域名下的所有页面。

这个指令是查询网站收录页面数的最直接方法。

干货 | SEO 小白必读的文章!你真的了解搜索引擎吗?

本文首发于:无锡小禾呈科技-互联网营销专家 suki.xiaohecheng.com,系本人原创,如需转载请联系。

无锡小禾呈科技有限公司为您提供无锡软件开发无锡App 开发无锡互联网营销等服务。我们有专业的团队,开发经验丰富,欢迎联系15358002238

微信图片_20191115144656.jpg