网站百度不收录,网站不收录的8种解决办法

热度:2062℃ 时间:2019-06-29 来源:佚名


日常上网用到最多的搜索引擎是百度,我们以百度为例对网站不收录的问题进行分析并给出解决方法。

 

先科普下百度的工作机制,在百度搜索内部服务器中运行着一个被称为“Baiduspider(百度蜘蛛)的爬虫程序,将互联网上开放权限的网站内容大量进行采集并存储于百度自身宏大的数据库集群中。当我们使用百度进行关键字搜索时,百度根据关键字在自身数据库中进行巨量查询并通过web页面的方式实时展现给当前搜索用户。

 

网站搭建成功后百度迟迟不肯收录,就要找到问题的所在。文章的上一部分提到,百度蜘蛛会进行大量采集,这一点可以提到结论:百度不会轻易对某一个网站不友好特别是新站,所以还是要从网站自身查找问题。

问题一、robots权限

上文中有提到,百度蜘蛛会对互联网上开放权限的网站内容进行采集并收录。这里是指robots文件的权限设置,此文件通常存在于网站根目录下。搜索引擎抓取网站文件的时候通常都会先访问robots文件,robots文件里边规定了搜索引擎可以访问哪些内容,同时哪些内容则无权访问。

腾讯官网的robots文件访问地址 https://www.qq.com/robots.txt

robots文件中可以看出,腾讯网站对所有搜索引擎的收录是完全开放权限的。

 

解决方法:正确书写robots文件规则和内容显得尤为重,具体的文件规则写法详见本网站 站内页面 

问题二、域名有被惩罚历史

如果你使用的是新域名且该域名没有历史网站记录,可以忽略此部分内容。在爱站网等站长工具可以查询到域名的注册日期等Whois信息,注册日期是域名的首次被注册时间,更新日期是指域名最近一次续费日期。如果网站的域名注册日期和查询到结果中注册日期不同,说明该域名此前有被惩罚过的记录。

 

解决方法:更换新的域名,当前一般是不建议更换域名的。当然如果是网站新上线没有什么权重或一直不被收录,这个方法还是可以使用的。

 

问题三、服务器不稳定

网站在上线初期非常重要,如果选择劣质的服务器,会造成网站迟迟不被收录甚至收录会马上被K站的后果。劣质的服务器通常表现为:连通率低、容易被挂马,经常出现无法访问的情况。搜索引擎在首次抓取网站后,第二次第三次又来抓取时发现网站打不开了,无疑这很严重。

 

解决方法:选择性价比更高,优先选择更优质的服务器提供商。网站早期使用云主机更好一些。

 

问题四、查看同ip上其他网站状态

不论是个人站或是企业站,通常出于对成本的考虑,很多人在网站搭建初期会选择比较廉价的虚拟主机。对于新手而言,虚拟主机不用自己去配置运行环境和各种突发情况,确实是一个不错的选择。

与其同时,就要面对虚拟主机带来的弊端。一个IP上放置100个甚至更多网站都是很常见的事情,一旦同IP中一个或多个网站被惩罚,其他网站就会被无端连累。

 

解决方法:选择独立IP的的虚拟主机或云主机,可有效减少同IP网站给自己带来的风险系数。

 

问题五、网站结构布局差

网站结构布局差通常表现为,单个web页面中图片过多且无alt标签,同时在该web页面中文字内容极少。大量引用JS文件且网页代码混乱。

 

解决方法:web中以图文并茂的方式呈现内容,给图片加注alt标签。如果有大量的图片可以分为多个页面呈现或以专题的方式呈现。对JS代码进行压缩减少单个页面对服务器的请求,合理并规范使用DIV + CSS书写代码。

 

问题六、网站无实质内容,原创度太低

许多企业和个人站在网站搭建早期,会选择从其他同类网站中搬运一些内容发布在自己网站上。更有甚之,网站程序刚刚搭建好,完全就是一个空架子没有任何内容,就急于提交收录,这样只会使得其反。

 

解决方法:在网站上线初期要持续且有规律地发布原创内容,积累到一程度后再主动做网站的收录提交工作。

 

问题七、网站存在大量404403页面未处理

很多站长都是使用第三方公司开发的CMS程序搭建网站,之后又加以代码改动。这中间难免会存在一些404403503等错误页面,这会导致搜索引擎抓取网站很困难。如果不做以处理,搜索引擎会认为该网站死链过多,用于停留在网站的价值不大。从来降低对网站的综合评分,进而对网站内容不收录。

 

解决方法:使用爱站网等工具检查网站中可能存在的死链并加以处理,同时在百度站长平台中提交死链url的链接。

 

问题八、网站内容有敏感词

网站主题和网站中即已发布的内容中,如果出现敏感词汇或整篇内容(如:暴力等),则会被搜索引擎视为不友好。特别是在近几年搜索百度引擎被媒体多次报道,百度在技术层面会做出规则上的调整,这就导致敏感内容不被收录。

 

解决方法:安心做站,选择优质阳光的网站主题和网站内容,做一个有益于自身和大家的好网站。使用敏感词检索工具查找网站中的敏感词并加以处理。