发布时间:2020-4-10 分类: 行业资讯
中充分利用加权方法搜索引擎会为每个页面提供一定的权重值,这也会随着页面更新和时间的推移而变化。
今天,小班SEO自学网络带给你《SEOer应善用索引创建过程中的加权方法》。我希望能有所帮助。
一、索引创建中的权值
搜索引擎蜘蛛爬行和爬网,页面索引和索引是用户搜索关键字时页面可以显示的几个基本步骤。索引创建包括页面内容本身的加权因子。
1索引项目权重概念
索引项的权重在一定程度上反映了文档中单词的相对重要性。此值通常用于计算索引排序过程中的分数,这是影响搜索引擎排序的重要因素之一。
2索引项目权重是如何产生的?
索引项目权重由检索模式中的加权组件使用文档统计结果计算。
3指标项加权方法
传统检索模式中最常用的加权方法:TF-IDF算法。
二、TF-IDF算法
1 TF-IDF算法定义
TF-IDF算法,基于文档中索引条目的出现次数或频率,以及索引条目在整个文档集合中出现的频率,两者的组合(或两者的乘积) 。
2 TF-IDF算法中的单词分析
1)TF
数字和频率称为词频,英语缩写为tf。
2)IDF
索引项在整个文档集中出现的频率称为扇形文档频率,在英语中缩写为idf。
3 TF-IDF算法的简单描述
TFIDF的核心思想是在文档中经常出现单词或短语,并且在索引库中的其他文档中出现较少的单词或短语。认为这个词或短语具有良好的阶级区分能力。可以用来分类。
简而言之,单词或短语是一个索引术语,对于本文,该术语将被赋予更高的权重。
例如,短语“TWNM-SEO”完全基于小型教室网络。在《全网营销SEO【TWNM-SEO】这就是属于我的代购源码网站优化》中,该短语非常频繁出现。与此同时,没有其他人提到这一点。短语,然后对于本文档,术语“TWNM-SEO”给予高权重。
三、理解并使用TF-IDF算法
对于SEOer来说,了解上述知识就足够了。没有必要知道使用哪个函数以及计算哪个公式。
事实上,通过学习TF-IDF算法,我们可以更好地理解一些常识SEO知识。
1品牌词语易于优化
品牌词通常由他们自己创建,满足大TF值,大IDF值,高页面权重,自然排名很容易。
2行业核心词难以优化
许多代购源码网站正在优化这个相同的单词,但主页的位置是有限的。每个人都对TF感到满意,但IDF越小,优化这个词的难度就越大。
这就是为什么在判断关键词优化难度时,百度搜索相关结果的数量是优化难度之一。
3个没有百度指数的更多关键词 - 降低优化难度
行业中有百度指数词。每个人都在做优化和排名。这样的话不仅是竞争压力,也可能不会带来很多点击。由于百度指数可能为100,可能只有2个真实用户,其他98个是企业的竞争对手。
我们应该挖掘出一些没有百度指数的词,但这次我们需要保持一定的搜索量,这样可以确保优化难度降低,带来更多实际流量。
4 TF不是灵丹妙药!过度积累是有害的!
根据TF-IDF算法,许多人会考虑增加关键字密度或频率来增加TF值以获得更好的排名。但是,这种方法可以正确完成,但是如果它超过一定程度,则没有任何好处,但是由于过度积累,搜索引擎可能会减少它!
所谓的关键字密度为2%到8%只是一个近似范围。许多排名很高的网页大多数是2%,当然还有超过8%。只要密度不是太小,就不要太在意这个。
例如,它已经是5%的密度,故意积累到8%甚至20%是没有意义的。这是对TF的误解。
也就是说,我们可以根据TF-IDF算法激发关键字的密度或频率(TF)不应该太低。但是,对于IDF,我们只能通过查找IDF值较高的关键字进行优化。优化关键字的IDF值固有地低,我们无法改变现状。 IDF值越低,优化单词越难。
因此,在代购源码网站优化过程中,除了做好工作外,还需要注意内链和外链的优化。
四、TF-IDF算法公式
1 TF公式
TF(i,j):文档i中关键字j的出现频率。
n(i,j):关键字j出现在文档i中的次数。
例如:
在单篇文章中共有100个单词,“SEO训练”共有10个单词,那么TF为10/100,结果为0.1。
然而,由于大量的“"”""""""""它是。
2 IDF公式
IDF(i):单词i的反文件频率
| D |:语料库中的文件总数
| j: t(i)所属的d(j)|单词i出现的文件总数
+1是为了防止分母变为0。
IDF可以防止常见词的干扰。
仍然只是一个例子:
在单篇文章中共有100个单词,“SEO训练”共有10个单词,那么TF为10/100,结果为0.1。
另外,“我们”总共有10个单词,他们的TF结果也是0.1。
假设语料库共有1000篇文章,其中“SEO培训”有10篇文章,“我们”,我们有1000篇文章。
“ SEO培训&ID;=IDF=log(1000/10)=2
“我们” IDF=log(1000/1000)=0
3 TF-IDF公式
TF-IDF=TF * IDF
SEO培训” TF * IDF=0.1 * 0=0
“我们”的TF * IDF=0.1 * 2=0.2
很明显,对于这篇文章,“SEO培训”比“我们”更重要。
以上是小班SEO自学网,供大家带来《SEOer应善用索引创建过程中的加权方法》。谢谢你的收看。 SEO培训寻找一个小班!更多搜索小班的seo教程。欢迎原创文章转载并保留版权:https://www.xxkt.org/
« 从新人到大奶牛!可能是最全面的互动设计知识体系? | Breeze 2.0算法即将上线。什么应该准备作为代购源码网站管理员? »