前几天,全网的站点基本99%都在降权 、降词,用百度官方的话说,不展现、不召回、不索引,在百度一阵痛打后,百度又给咱们的站长送上了“救命药”——网站数据生产指南,鼓励你如何正确生产优质资源数据。
以下内容从2个方面去讲解:
一、抓取到展现中间发生了什么?
二、数据生产建议
一、抓取到展现中间发生了什么?
抓取到展现其实是个复杂的筛选过程,从网站——链接——网页——索引——搜索,这其中也有链接筛选、网页筛选、索引筛选,刚好我最近看了关于搜索召回的内容,这里就简单举个例子,用户a搜索一个关键词“seo怎么做?”,那么备选资源有1000条,搜索引擎通过多路召回、比如相似度搜索召回等,取出500条进行粗排、细排等,这其中会涉及到向量嵌入、tf-idf等,感兴趣的大伙可以自己找资料学习下,别总是网站被打击了,还整天只会吹水。
二、数据生产建议
数据生产误区
1、链接越多越好
2、内容/关键词越多越好
3、倒流越多越好
4、收录不维护
其中这4条很好理解,我总结一下,一个站点并不是页面越多越好,只要做到精而美就够了,另外用一些作弊手法进行导流,尤其是被惩罚的站点导流也是不允许的。
生产资源建议
链接生产方面:
1、首页链接
建议官网认证,并且网站内容完善后才上线为佳。
2、站内链接
避免动态带变化参数无效链接,比如url=?&1214.html等,避免自动化批量生产内容,换句话说,用ai生产低质内容无效了,尤其是伪原创、同义词替换等。
3、主域内规范建站
避免主域名下站点泛滥,比如顶级域名做娱乐等,二级域名又做其他类型的站。
4、合理使用站平入口
关于资源提交,优先使用api提交工具。(文章附带api自动提交工具,适合所有类型的站)
内容生产
1、首页
网站tdk符合seo规范,内容美观、精美
2、内容建议
聚焦生态类型,精而优,内容逻辑清晰、段落层次分明、用户阅读体验好,同时注重排版、丰富度以及页面整体质量。
3、内容应避免
tdk避免堆砌,不使用采集、避免拼凑、重复内容,另外,同一服务器下或不同服务器不同模版相同内容站点,可以歇菜了。之前一些站长关心的相同模版、不同内容应该没事,但不同模版、相同模版就有问题了,站长们要多注意一下。
4、保障页面功能、避免消费障碍
网站自带功能如查询、播放、购买、下载等交互功能,保证基础用户体验。
资源导流
违规的导流会传递负向特征,如果跟无关、无价值页面,会因为导流关系受到打压,如关联站点降级等,比如a网站被整体降权,站长想用b网站救活a网站,采取了b站301到a站,或b站挂a站广告、链接等,都会受到牵连。
注意事项
我们在做站点都时候,注意配置好301/302,以及https的友好型,另外避免使用第三方没有质量保障的cdn服务商,如果有开发能力的话,建议开通小程序,wise/pc端做好适配,robots规范书写,最后就是定期安检,避免被黑,强烈建议生产长尾资源,依据长尾关键词去生产数据,至于具体怎么做,详细参考我的另外一篇文章。
每次百度直播课,只要是工程师一出面,基本上都是干货满满,总结这次百度出的网站数据生产指南,其实也是在为以后站长指明了一条路,那就是,好好做优质内容,别整天想着走捷径,不然就跟今天一样,站被拔毛了都没人心疼一下。
最后,结合站长常见的问题,整理了一些答案,请各位站长对照:
q:原创内容收录了,过几天又不见了?
a:资源有进场 也就有退场,内容一般因为时效性问题以及内容质量下降导致,个人建议这种情况在原来内容上改一下,然后提交,如果可以,也可以删除。
q:很多站长质疑每次在站长资源平台上得到的反馈都是机器人回复,要么就是丢个白皮书链接,这样有用吗?
a:白皮书内容是产品、运营辛苦总结的经验,看白皮书不是说只看表面,要理解的去看。
q:最近收录异常到底怎么回事?
a:收录存在一定周期才能识别,具体还要看索引和流量情况,如果有异常可提交反馈。我个人的看法就是,百度官方最近更新导致搜索结果异常,当然这些异常官方肯定不认的。
q:采集内容被惩罚怎么处理?
a:删除低质内容,做404,做死链提交