转载自zero大神的博客,是最近几年来非常有质量的一篇干货文章,文中提出了“粗排”及“细排”的看法,以及对索引对后续扩展词的权重计算,和这些词对主词的影响做了详细的分析,为我们做了方向性的指导,具有重要意义,希望每一位seoer都能认证阅读,文章很长,但真的非常值得推敲!以下是原文: 这几年来,我写的东西越来越少,各方面的原因。最主要的就是互联网大势的改变,微信的崛起与百度的没落。 在过去那些年里面,其实一直有些东西没敢分享,哪怕在开过几期的收费培训里面也没有提到过。不仅是藏私的考虑,而是这些东西如果大范围公开,大家都知道了,对行业的变化会是非常难以预期的。 而摆在这个时候,再来写写,可能也就没什么大碍了。 这篇文章想写的,是我当初把「SEO」这个超级热词排名做上去的理论与实际操作。这个词的竞争多大?行业里面,当时有至少数以百计的论坛、博客、培训网站、乙方的官网等等的都在做这个词的排名,竞争者是一线的从业者乃至团队。 但其实另一方面,毫不客气的说,这些竞争者不过是一群连基础概念都不懂的人罢了。 没错,可悲的是,哪怕这个行业的中流砥柱,也大多是连基础概念都缺乏的。 因此本文我必须要从基础概念讲起。 一句话概括搜索引擎的排序规则: 在最短的时间内,让尽高比例的用户找到符合他需求的内容从这一条终极原则出发,可以通过演绎法直接推论出许许多多的可能的操作点。 此处,为了方便理解,让我假设个情境。用户搜索「火影忍者」这个词,互联网上总共就三个相关网页。同时,假设百度总共只展示3条搜索结果,那么这三个网页同时展现了,分别的点击率如下: 火影忍者 动画火影忍者 动画火影忍者 漫画假设总共只展示1条搜索结果呢?上面三个网页之中,无疑会展现1号网页。 但如果总共展现2条搜索结果?有意思的事情发生了,显而易见应该展现的是1、3号网页,这样才能满足不同用户的不同需求,达到整体点击率的最大化。 许多词,背后都有着差异很大的细分需求。 比如「火影忍者」可以有「火影忍者动画」、「火影忍者漫画」、「火影忍者游戏」等等细分需求。 搜索结果首页的10条搜索结果里面,展示的细分需求越全面越好,这应该已经很容易想明白了。但是,百度是怎么确定每个词具体的细分需求是什么呢? 这里涉及到个非关键,但知道了会容易帮助想明白问题的知识点,其实也属于搜索引擎领域的常识——大多数用户,在看了一页搜索结果没有找到想要的内容的时候,不会选择翻到下一页,而是改为搜索另一个(往往更具体的)词。 所以对于百度而言很简单,只要看搜索「火影忍者」之后,有多少比例的用户会转为搜索「火影忍者漫画」,就知道这个细分需求的程度有多大。 我是如何彻底确定上述理论的? 在赶集网负责SEO的时期,因为赶集是百度竞价的大客户,所以我混到了百度司南这个数据工具的使用权限。当初,百度司南提供一项数据叫做「后续搜索词」,明明白白的列出了在每一个词之后,有多少比例的用户转为搜索其它什么词。 比如当初看「招聘」这样一个词,后续搜索词有「招聘网」、「招聘找工作」、「招聘 58同城」等的。拿这些后续搜索词和具体排名去对照来看,发现果不其然,后续搜索词的比例排第几,它对应的网页基本也排在第几。 偶尔稍微存在一两名的偏差,再大些也不奇怪,因为存在「满意点击率」这个特殊的最后置排序调整规则,此处不展开。 不知道读者看到这里有什么思考。问题在于赶集网是百度大客户,所以我有数据,所以我能想明白这些吗? 不是的。 在看到数据之前的很早时间,我就明白了这些。非常值得留意的事情是,到前面第2段为止,所有的都只是基于百度的排序大规则,加上逻辑推演就一步步得到的猜想。 当后续搜索词影响排名的「猜想」已经得到后,随便多看些词的排名,就足够确定这个排序规则了。 在这个过程中,没有借助任何项目经验,或是深奥的技术、繁琐的数据。 单独了解「后续搜索词」这一个概念,还不足以把「SEO」这种超级热词的排名做上去。接下来,需要介绍的一个概念是粗排和精排。我仍然是通过「逻辑」来想明白它的。 不过就算没有深入思考,只要细读几本搜索引擎原理书,或者自己做个简单的全文检索,都一定会知道粗排和细排的问题。然而,哪怕我一向认为搜索引擎原理书籍是入门头一个礼拜就该去看的,却鲜少有人真正去踏实学习这种基础中的基础。 让我们具体来看这事儿吧: 假设百度在搜索结果首页想展示10个后续搜索词的对应网页,那么技术上有以下几种策略: 直接分别搜索10个后续词的结果,然后拼到主词首页上搜索到主词对应的假设1000万个搜索结果,然后在全部1000万个网页里面搜10次搜索到主词对应的假设1000万个搜索结果,然后在比如其中得分最高的前1000个里面搜索10次显然,尽管看上去搜索质量上面1>2>3,但计算的时间成本上1和2都远远大于3。 到这里为止,百度实际采用的哪个方案都可能,如果谁研究Google规则发现它用的是1或者2,毫不奇怪。 继续动用逻辑: 如果,主词的比如1000万的搜索结果里面,必有后续词;比如「火影忍者动画」这种包含了「火影忍者」主词的。但顺带它们并不绝对需要包含。 那么,在这情况下,上述策略1和策略2的最终展示结果是一样的;总有些特殊情况,比如缓存策略等等,所以需要多搜一些词来确定。 反过来,只要直接搜后续词排名第一的结果,有较高的比例没有出现在主词的首页,就能说明百度采用的策略3。 实际百度用的就是策略3。 这东西吧,一个最好的地方就在于,排名结果都是摆在那儿的东西。要验证猜想,多搜些个词看看就行了,成本微乎其微,花上几个小时都算磨叽。 什么实践出真知,一定要试试才敢确定结果,测试一下动辄几周几月。那些不分情况总是固执于「实践」的人,脑子真的是不好使。 虽然逻辑上说清楚了,有个对应的词会更容易记住这样的概念,一般在搜索引擎领域被叫做粗排和精排。 粗排,是搜索引擎从数以亿计的互联网页面去找到主词对应的top n个页面。 精排,是搜索引擎从top n个页面里面,再进一步的计算更复杂的规则,其中就包括了后续搜索需求这个问题(但远不止是)。 粗排精排的概念,我小范围公开分享过。后来有个朋友找认识的百度研发人员直接去问,对方回复是,百度的粗排这轮取的页面数量,就是搜索结果展示的最大数量760,而且粗排的排序规则只有BM25。 如果读者不知道BM25是什么,搜索引擎原理基础就属于一塌糊涂了,我个人建议从《走进搜索引擎》看起。 粗排规则只有BM25肯定是扯,只用BM25的话随便在页面上重复几次关键词就过粗排这轮了,极其不合理,而且也和我收集的大量案例不符合。 但粗排取的页面数量是760,根据我观察下来的粗略分析,有可能确实是这样的。 写了很多了,但我究竟怎么把「SEO」这个词的排名做上去的呢? 介绍下当初网站情况吧,当时我运作了一个小型的SEO行业论坛,每日活跃发帖用户十几二十人。整个网站几百个页面,很少的友情链接(后来的也是排名上去后,随便就能和人换到链接,就保险起见加了些),更没其它外链。 开始动手做排名之后呢?因为排名做上去的流程实在太简单了,所以不把理论说全面,一定被当成扯淡: 把网站首页title进行修改,加了个「SEO学堂」买了两条友情链接,共计50元没了。 真的没了。 肯定有读者会想,这么简单有问题吧?如果直觉上有这样的想法,是应该的。毕竟,错误的归因,是大多数人都会犯的错误。 我看过很多很多次,有谁做了什么SEO操作,过了几个月了都忘了,回来发现流量涨了,就说自己做对事了,瞎对应。 归因,至少在SEO这件事上,正确的归因至少要具备两个条件: 合理的理论解释合理的时间点在我的网站「SEO学堂」这个后续词已经排名前列,而「SEO」在前760名都看不到的时候,我知道最后一步只差进「SEO」这个词的粗排。 而且根据观察,百度的粗排规则主要是类似于PageRank的比较基础的权重,这也是个稍微多搜些词就能发现的问题。因此我买了两条链接,随后一周左右的时间,百度排名更新后排到了首页。 有一个读者肯定已经发现的奇怪的还没解释的问题,为什么后续词是「SEO学堂」这么诡异的词? 答案是,我也不知道谁刷的,一直在那。我那时早没百度司南的数据权限了,但只看到长期有个title里面包含「SEO学堂」,也基本没命中其它后续词的页面排在首页,就能直接确定「SEO学堂」是个有用的后续词。借了个巧。 后来排名稳定了一段时间,我也把自己网站上的论坛运作的还不差,想想网站权重应该不低了,同时觉得「SEO学堂」这个诡异的词放在title不太合适,就去掉了它,改为了「SEO教程」,排名仍是稳定了许久。 如果不是我这种实在没内容没链接的小破论坛,只要稍微好点的网站,当时都完全是可以直接做「SEO教程」或其它类似的后续词排名的。 等等! 「SEO学堂」改成「SEO教程」之后,我网站排名没掉是因为什么?真的是我前面说的理论那样吗?还是本来就可以排在前面了,一切只是巧合? 还是前面提到的,读者在阅读过程中,有怀疑是应该的,没有怀疑才是错误的汲取知识的态度。 但是,回到后续词的理论上,哪怕可能没做过、没观察过,还是可以仅仅通过逻辑想明白。将后续搜索词,结合粗排精排的概念,可以得出猜想: 对于存在后续词效应的主词,其对应搜索结果页面的排名只有两种状态:在第一页、在后面任意位置。并不存在第一页排名下降后顺位挤到第二页的情况。 实际情况会稍微复杂些,比如开放平台占位、点击调权等,但整体还是前面所述。 当初,我的网站通过「SEO学堂」排上去的时候,原来那个「SEO学堂」对应的其它网站排名同时掉到了很后面;同样,「SEO教程」上去的时候,原来的「SEO教程」对应网站排名也同时掉到了很后面。 理论、时间点都完美符合,因此是正确的归因。 后来,一方面是因为焦大他也自己琢磨出了个大概,和我竞争排名;另一方面我那时候创业做外包,业务量大实在顾不过来。最终「SEO」这词的排名在百度首页保持了一年多以后掉了。 另外,时至今日,读者已经没什么必要再去分析「SEO」这个词的排名了,百度首页目前被各种刷点击的网站全面覆盖,倒也是简单粗暴。 总结通篇文章,读者可以再回顾。一切,都是哪怕一个外行人都可以很轻松的快速掌握的常识,通过大量的逻辑推演,再稍微搜些词验证猜想,就最终得到的完备理论。 很多同行都知道我行业经验十分丰富,那么可能多少会想,尽管我通过逻辑说明白了前面的问题,但事实上,是否是我通过「经验」做出了效果,只是通过逻辑来解释,借此把功劳交给了「逻辑」? 第n次强调,有怀疑的态度是应该的。 不是的。 我当初为什么把「SEO」排名做到百度首页?因为我在美团那阵实在太闲了。那年我23岁,从业仅四年。而且,我想明白这些理论,则是更早得多的事情,哪有什么经验可依。 最后实际操作起来,改个title、买两条链接。在绝大多数人看来几乎不可达成的「SEO」这种词的排名,实际做起来不过是吃两顿饭的功夫。 一天到晚换链接、伪原创……看上去高大上些了,一天到晚写代码、爬数据……都在干些什么?(作者:ZERO) 本文由铬元素工作室进行转载,旨在帮助石家庄网络优化的各位共同提高,转载请注明作者!
常见问题
所有的素材与插件都可以用吗?
本站所有的素材与插件(包括免费的),都是本工作室用过的,测试过的,或者二开修改过的,理论上来说没有什么bug,但不保证在所有环境下都可以完美运行。
收费素材与免费素材怎么定义的
本站收费的素材,也是及其便宜的,其实就是收个打赏钱,是工作室对这些插件的测试,整理,修复,优化的辛苦钱,并非开发插件的费用,原创插件或者模版收费稍贵一些。
出现问题了怎么办?
由于收费非常低,大部分都不超10元,所以并不提供售后服务,但您如果需要,可以联系我付费咨询,费用为50元/次/小时。如果是原创模版或者插件,可以免费为您指导。
原文链接:https://www.52gys.cn/2360.html,转载请注明出处。
评论0