2021年12月13日之近期针对搜索引擎收录问题
近段时间一直在探索搜索引擎收录的问题,特此做个小结留文记录一下。

本站近期持续更新了一个星期的原创文章,从开始的天级收录,到后面三到四天都没有被收录,期间做了各种设想性的测试,比如标题对收录的影响测试,标题字符长度与收录之间的关系,以及测试了即时性内容对搜索引擎蜘蛛是否友好,同时还测试了图片和文章内容长度与网站页面被收录可能性的研究。

因为测试周期时间比较短,所以测试的数据暂时不适合整合分析,仍需进一步验证探索。

今天在研究网站日志发现了一个关键点,百度蜘蛛从开始的每半个小时一次到昨天是每五到六分钟一次的频率,今天发现频率到了每三到四分钟一次,所以特此做个记录,用以后期研究蜘蛛抓取频率与各种因素的关系。

聊到蜘蛛频率这个问题不得不说说服务器硬件与网络延迟这块因素对收录的影响,这一块我是分开进行测试的,分别通过服务器本地访问和服务器外网访问测试俩者之间的延迟与延迟时差分别得到不同的延迟数据,一个对搜索引擎友好的网站其数据返回的延迟最好控制在1秒以内的毫秒级别(毕竟百度官方已经说过这方面的影响)。

如果没有一定的服务器运维经验是很难将服务器延迟优化到极致的。