搜索引擎发展史:分类目录、文本检索、链接分析、用户中心
分类目录
典型代表雅虎和hao123的分类目录,由人工收集,质量比较高,可扩展性差,随着网站的不断增多,已经没有办法满足广大用户的需求,被成为搜索引擎的史前时代;
文本检索
文本检索采用经典的信息检索模型,如布尔模型、向量空间模型、概率模型,来计算用户查询的关键词和网页文本内容的相关程度。目前这种文本检索在现代的se当中仍然有应用,最早的时候可以通过在内容当中堆积关键词来作弊;文本检索重点是相关性
链接分析
网页之间的链接关系,并深入挖掘了网页和利用了网页链接所代表的含义。也就是现在seo当中我们所做锚文本,以内链和外链的形式展现,不过随着搜索引擎的发展,se在检索链接的时候还会对页面和链接的过往历史进行一定的分析;
即推荐,被推荐多的网页其实代表了其具有流行度的程度,se通过结合网页流行度和内容相似性来改善搜索质量;链接分析,融合了相关性和可信度,即文本检索和链接分析的结合体;
用户中心
理解用户需求,不同用户输入同一查询关键词,但是它的目的是不同的,如输入小米,有可是是搜索手机的,有可能是搜索我们吃的小米的,如何理解用户的需求,目前的se正在解决这一需求。相对来说谷歌做的好一些,百度比较垃圾。用户中心兼顾了链接分析、文本检索,同时加入了三个核心问题
评论(0人参与,0条评论)
发布评论
最新评论