或者

SEO搜索引擎基本工作原理:抓取、索引、排序

作者:山里的苦丁 浏览:157 发布时间:2018-02-28
分享 评论 0

  SEO搜索引擎基本工作原理:抓取、索引、排序


  作为SEOer都应该知道,SEO搜索引擎的工作原理过程是非常复杂的,但是,我们有必要认识一下,基本工作原理,SEO搜索引擎基本工作原理大体分为三个阶段: 抓取、索引、排序。有的教材上是:爬行和抓取、预处理、排名这三个阶段,其实大致讲的是一样的。下面,就针对性的说一下:


  SEO搜索引擎基本工作原理:


  一、抓取


  搜索引擎首先会派出一种被称作“蜘蛛”或者是“机器人”的软件,根据一定规则扫描存在于互联网上的网站,并沿着网页上的链接从一个网页到另一个网页,从一个网站到另一个网站,获得页面HTML代码,并存入数据库。为保证采集的资料最新,它还会回访已抓取过的网页。


  SEO搜索引擎基本工作原理:抓取、索引、排序


  二、索引


  由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。


  三、排序


  当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。最后,由检索器将搜索结果的链接地址和页面内容摘要等内容组织起来,返回给用户。


  搜索引擎(SEO)的工作原理大体分为3步:爬行、抓取——索引——排序。


  1.抓取:主要是数据收集。


  2.索引/预处理:提取文字——中文分词——去除停止词——消除噪声——去重——索引。


  3.排序:搜索词处理——匹配文件——初始子集选择——相关性计算——过滤、调整——排名显示。


  以上便是SEO搜索引擎基本工作原理,很基础的知识,但掌握的人也不是很多,所以,我们有必要温习一下,补补脑子。