发布时间:2023-8-27 分类: 电商动态
里约奥运会结束了,信息代购源码网站的编辑终于可以放松了,但是一些SEOers并不高兴:编辑们努力制作原创手稿,而百度却没有!接收!记录!在奥运会期间,迪恩收到了四到五个这样的反馈,在追查之后,结果发现该代购源码网站的抓取释放不够友好,导致蜘蛛无法爬行。结论:
1,页面完成后,将其放在蜘蛛可以找到的地方,以达到最佳的爬行效果。
2,在页面未公开之前,不要通过工具将其推送到百度。
在收到代购源码网站管理员的反馈后,院长联系了蜘蛛工程师。工程师在后台查询了这些未收集的链接,发现它们都显示为“死链”,但这些所谓的死链现在已经很好地访问了。根据后台显示的爬行时间,院长反复与代购源码网站沟通,最终找到了根本原因:原来,为了获取新闻,代购源码网站发布了新闻稿,并提前发布了链接并发布了它没有在主页等重要页面上推送给用户。然而,它是由百度蜘蛛发现的。更重要的是,这些链接返回到BaiduSpider的状态代码是404.
例如,在中国女排进入决赛后,一个代购源码网站分别制作了A和B页,以赢得冠军并挑选银牌。为了防止用户在游戏结束前阅读页面内容,该代购源码网站将设置两个链接到404! 404! (当游戏结束时,将其中一个页面的html返回码更改为200)。虽然页面没有被推送给用户,但它是由智能百度蜘蛛发现的。但是,这里的问题是百度蜘蛛发现页面是404,并且无法判断这是一个重要的页面,所以我直接进入冷宫而忽略它。
因此,学院反复强调,确认页面可以真正使用404,当搜索引擎不需要保留时(临时封闭站可以使用百度代购源码网站管理员平台的封闭式终端保护工具),如果你想维护一个与搜索引擎的友好关系,请使用503,以防止页面被删除。虽然百度拥有高价值内容的“删除保护”功能,但毕竟不是每个代购源码网站都能享受这一特权。