乐学SEO培训

新站如何快速被百度快速收录,sitemap提交主动推送和自动推送有什么区别?

乐乐-乐学首席SEO培训讲师
SEO行业10年,服务人数3万例。
快速排名优质内容已认证10年SEO
乐学SEO
【摘要】 百度收录 永远是SEOer着讨论的关键话题,在网站优化战争中,稳定的收录直接影响了网站的流量、收入。为何网站首页快照更新很快,可就是不收录内页?相信许多朋友与我一样在寻找问

百度收录永远是SEOer们讨论的关键话题,在网站优化排名过程中,稳定的收录直接影响了网站的流量、收入。为何网站首页快照更新很快,可就是不收录内页?相信许多朋友与我一样在寻找问题的答案。本文跟乐学SEO培训网探讨下网站内页百度不收录的原因分析与对策都有哪些?
 

 

原因1:robots设置问题导致内页不受引擎蜘蛛爬行索引

对策:检查是否语法错误屏蔽了蜘蛛爬行,其中包括meta robots与nofollow等标签的的设置。


原因2:百度已经索引了但还未放出来排名。

百度对文章的收录需要审核时间,蜘蛛抓取成功索引内容录入数据库,需要经过二次审查是否为SPAM然后才放出参与排名,放出的时间与网站权重高低有着直接的关系,百度周期更新才放出收录是新站最为常见的现象。

对策:我们要做的就是保证定期定量的更新、观察网站日志,只要蜘蛛正常爬行,就静心等待着,会有惊喜的。

 

原因3:网站内部链接存在问题.

比如有大量错误链接、不良的网站链接,蜘蛛爬行不通畅无法抓取,不良网址链接导致网站降权。

对策:针对首页、频道等各个重要页面做错误链接检查(可以观察谷歌站长工具的抓取错误),检查留言板、评论等网友互动功能的不良链接,避免与不良网站互链。

 

原因4:文章原创度问题.

头部标签的设置导致页面类似重复,或者采集页面太多,因百度数据库中已经存在大量的相似信息而不收录,长期地操作会导致百度降权。

对策:应该保持文章的原创度(伪原创相信朋友们都熟悉),质量比数量更重要,最好是能每天定时更新让百度对你网站抓取也有守时的好习惯。

 

原因5:网站使用了黑帽手段,百度识别了欺骗手段整站降权。

对策:远离关键词堆积、群发,黑链等黑帽行为,网站的长期稳定少走捷径,百度一有动作就很难挽回了!

 

原因6:服务器无法访问,速度缓慢、被挂马等情况。

百度蜘蛛索引内容时,多次识别网站有着大量错乱代码或者遇到服务器无法访问,网站被列入观察名单。

对策:做好网站代码优化提高页面读取速度,选择负责任的安全空间服务商,成熟的网站程序并定期更新补丁,定期对修改文件痕迹做好跟踪,定时做好网站数据备份。

 

新站如何被百度快速收录?


 

那如何通过使用百度链接提交工具快速的收录我们的新站呢?在介绍链接提交工具之前,最先开始做的就是在百度站长平台对新站点进行验证,只有验证成功后我们才能使用百度站长平台的链接提交工具以及其它的更多工具。验证新站点的基本流程如下:

 

1、登录百度站长平台后,选择左侧“我的网站”栏目目下的“站点管理”选项,然后右侧点击“增加网站”如下图:

 

 

2、这时,跳到添加网站的环节中,分为两步,一是输入你新站的域名,再进行对网站的验证工作,如下:

 

 

上图中,重点需要说明一下,如红框中的文字,最好是验证我们的主域名(像www.70seos.com这种)这样后续再添加二级域名的时候直接选择子链添加即可,不用再对网站进行验证。另外如果主域名是vip站点,该子域名也会继承主域名的vip权限。否则就要单独进行验证,也不会有这种vip权限继承的能力。输入主域名之后我们直接点击下一步,选择我们验证网站的方式(文件验证、HTML标签验证、CNAME验证),并按照说明部署到我们的站点,点击验证按钮。

 

当网站通过验证之后,我们就可以使用链接提交工具了,目前链接提交工具分为自动提交和手动提交两大块,手动提交顾名思义自己手动复制粘贴去提交,相对简单,我就不做过多说明。而自动提交中又分为:sitemap、主动推送、自动推送三种方式。三者都是将站点自身的URL自动推送至百度,而后等待百度爬虫进行对页面的抓取。最终的目的是一样的。如果对这三种自动推送的安装方式不熟悉的话,可以参考该链接(http://zhanzhang.baidu.com/college/courseinfo?id=267&page=2)进行配置安装。重点聊一下三者的注意事项和区别:

Sitemap提交:

在配置sitemap文件时,无论是txt格式的文本文档还是还是xml格式的文件。都不建议将其sitemap的文件名命名为sitemap.txt或sitemap.xml这么大众化且谁都能够知道的文件名。如果你这样设置,你的竞争对手或需要你网站内容的人很容易就能拿到你所有的页面url。出于保险起见还是使用一些自己定义的较复杂的文件名。每一个url都必须包含http://,文件中包含的url不得超过5万条,单文件大小不得超过10MB,一个站点最多提交5万个sitemap文件,超出5万个不再处理并会提示“链接数超”。如果是通过子域名的形式验证的站点。那么主域名下的sitemap文件是可以包含该域名下的所有域名的url的。

主动推送:

对比sitemap而言在及时抓取上推送更快、发现更快、抓取更及时。如果是时效性文章不排除其收录速度达到一瞬间的效率,这里特别建议一下,最好是主动推送我们网站第一时间产生的新内容给百度其效果更佳;主动推送是有推送数量的限制,尽可能的不要推送重复的内容给百度。这样会大大浪费自己的可推送资源。

自动推送:

是我们将一段js代码部署到我们的每一个网页中,当有用户进行访问时,触发了这段代码,这段代码自动将当前页面的url推送给了百度。需要注意的是这段代码无论是在PC站还是在移动站均可使用。是一个非常及时、便捷的轻量级链接推送工具。

 

当然,为什么三者建议一起使用呢?

Sitemap、主动推送、自动推送的区别:

sitemap是一个可以容纳大体量、历史数据的容器。它将我们网站所有的url装在了里面。个人觉得快速的抓取并不完全指望sitemap的提交方式,但对于已经产生的文章、现有的列表页、tag标签页等都是最佳的选择,当我们的页面发生变化时,主动推送并不一定会再次推送,因为毕竟主动推送承担更多的是对新产生页面的及时推送,最重要的是有最大推送数量的限制;再说自动推送。如果你对历史页面进行了修改,没有被访问。那么根本不会触发自动推送js代码,当然也就不会推送给百度。所以,归其根本,sitemap是对已经产生的文章页、现有的列表页、tag标签页最大的助推工具。

 

主动推送,虽然有推送数量上的限制,但我们推送后的抓取速度已经通过智联招聘的新站例子很好的诠释了。所以主动推送更多的应该承担对新产生的URL的及时推送作用。

 

自动推送,页面被访问了,就会被推送过去。那么被访问的和没被访问的就是热门页面或冷门页面的概念。冷门没被访问我们有sitemap,以及冷门页面产生时的自动推送。但对于热门页面,用户都喜欢的页面而言。在搜索引擎上也会有很大的需求,这类页面是我们获得流量的重要页面,他们如果没有被收录,除了sitemap、主动推送外,还可以更频繁的利用自动推送进行推送。这样被抓取或者收录的几率又会大多少呢?而且这个相对sitemap和主动推送实现的成本更低些,加段代码就搞定,何乐而不为呢?

 

总结:所以,综合上述的案例也好,三者的区别也罢。强烈建议你将其三个自动推送工具进行安装,并让三者协同工作,将抓取和收录价值最大化。

上一篇:没有了

下一篇:SEO竞争对手分析报告必写的18个要点

在线留言 (已有388条留言)