在实际中,常用关键字密度来衡量页面中关键字的词频是否合理。关键字的密度主要由”关键字词频“及”网页总词汇量“两个因素来决定,三者关系如下:
关键字密度=关键字词频/网页总词汇量
式中,总词汇量是指网页程序标签(如HTML标签及ASP、Jsp、PHP等)以外的所有词汇的数量。
而以下对关键字密度的理解是不正确的:关键字密度=关键字总字节数/网页总字节数。
要了解关键字密度,我们先认识搜索引擎对网页的粉刺方法。
中文关键字密度
1、 中文分词
在中文里,字或词之间并不存在自然分隔符,而且中文里的词语通常由两个或两个以上的中文字符组成。因此,搜索引擎不能借助分隔符对网页正文内容进行分切,而是按照某种算法把网页正文内容划分为若干个中文词汇。
2、中文关键字密度
为了让大家更容易理解中文关键字密度,下面举一个简单的例子进行说明。
例如网页内容为”我的笔记本“,搜索引擎将其分切为”我“、”的“、”笔记本“,则关键字”笔记本“在这个文档中的密度就是”1/3“。
对于短语关键字,通常通过计算组成短语里的每个词的密度去衡量该短语的密度。例如,”智能手机走进大众市场“可以且分为”智能“、”手机“、”走进“、”大众“、”市场“。其中的”智能“及”手机“各出现了一次,则它们的关键字密度都是"1/5"。
关键字密度范围
通过以上内容,我们知道了搜索引擎对页面的分词方法,以及如何计算中文关键字密度。但是,页面中关键字密度在什么范围才算合理呢?这个在不同的搜索引擎中会有所差别。一般认为,关键字密度在6%~8%是比较合理的。
为什么关键字密度在6%~8%的范围较为合理呢?搜索引擎会吧对传统食物的分析、统计结果作为制定算法的一个参考指标。例如,对N个网页进行分析、统计后确定这个范围。加强对传统事物的观察,对开展搜索引擎优化也是有一定帮助的。
关键字密度与页面相关性
关键字密度是衡量网页相关性的重要指标之一。搜索引擎会根据页面中的每个关键字密度对网页的主题进行定位。也就是说,如果我们的网页要出现在某个关键字K的搜索结果中,最基本的是网页中K的关键字密度要在某个特定的范围内(如6%~8%)。
例如,要想让你的网站中的某个页面出现在”手机“的搜索结果中,则首要的条件就是该页面上”手机“这个词的密度要在某一个特定的范围内。否则,就会被排除在搜索结果外。
对于短语关键字,除了评估组成短语的每个次的密度是否合理外,还要对统计该短语出现的频率。例如,要评估页面与”搜索引擎优化“的相关性,搜索引擎首先会计算页面中的”搜索引擎“和”优化"这两个词的密度,在统计该短语出现的频率,最后用这两个数据进行综合衡量。
评论(0人参与,0条评论)
发布评论
最新评论