下面小编为大家整理了BD,谷歌以及雅虎对于网站收录的规律浅谈,本文共8篇,欢迎阅读与借鉴!本文原稿由网友“笙利”提供。
篇1:BD,谷歌以及雅虎对于网站收录的规律浅谈
其实说起这个话题我也不好下个定论,我就拿我的网站的发展来做个例子吧,首先介绍我的站汉网天下www.hanwangtx.com ,我的网站主要是打造电脑IT技术的一个学习基地。希望大家常来看看。
网站大概是10月末上线,经过漫长的等待百度收录时间和一段相对漫长的缓慢更新时间,终于熬出了点头。到11底百度对我的站已经边的很友好了,百度快照天天来爬,不光爬每天还有收录。
下面我简单说说收录过程吧,这个网站我期间没有做过什么收录记录的,凭经验来分析下了,主要面对的是新站了。
1 网站收录速度
google>雅虎>百度
google对于网站的收录速度是最快的,我的挖油菜做好了就发了几个外链出去,然后没有去管,没有去搜索引擎提交,主要做内容去了,没有去看收录情况过了几天去看,google已经收录了几十条信息。我说经历过的google收录最快的一个站大概是3、4个小时吧,提交了www.hanwangtx.com结果过了7、8个小时去差,显示已经在4个小时前收录。然后就是雅虎,大概过了7、8才收录的。百度最狠一直等到将近20天才收录!
2 收录数量
前期google>雅虎>百度
一般的网站那搜索引擎收录数量都是googel大于百度的,自始自钟我的站也都是google>百度。
前期的话因为百度遵循的是每周更新一次的机制,更新慢,所以雅虎收录还多些,那时候yahoo过来的流量比google和百度都多。到后面百度收录增加了,就变比雅虎多了。雅虎很奇怪,貌似每天都来扫描我的站,但收录量迟迟上不去,就算到现在也还只有百度收录的三分之一多。
到后期google>百度>雅虎>搜狗>搜搜
3 从搜索来的流量
不的不说,在国内搜索来流量还是靠百度,所以一定要讨好百度,
google收录数量一直比百度多,但我的站从百度来的流量寥寥无几,大概是百度的百分之一左右。百度和google的市场份额大概是3:1吧,但是我的站从百度来的流量楞是比google多了n多,我实在是想不通,或许只能解释到和我的网站性质有关系吧
我的站目前从搜索过来的流量的情况是:百度(远远)>雅虎>搜狗>google
4 搜索引擎更新速度
前期,google>雅虎>百度。
前期让百度更新还是比较痛苦的。gogle和雅虎收录了以后,一般一两天还是会更新一次的,百度就不同了,新站他每个星期才更新一次。
对于站长星期三都是一个值得期待的日子,因为百度每周一次的大更新就是在星期上早上。我就是这么痛苦过来的
大概到了8月13号的那个星期三以后,百度突然对我的站变得很友好了,百度快照天天都来扫描我的网站,终于如释负重啊。不过那时候,也只是扫描网站的首页,内页基本不扫,收录更新还是在每周星期三一直等到了8月27号这个星期天,才终于感觉什么叫网站权重,这次更新之后我的网站发生了几个显著的变化:
(1)百度不仅是每天都来扫描我的首页,而且是每天都有收录,今天30号百度收录量比27大更新是收录量多了很多条
(2)某些关键词排名得到显著提高,以前好多词排在2、3页的提到了第一页,有些词排到前几位,还有就是有时候搜索相关词,第一页有2、3条信息是我的网站的。这样一来使得我的网站流量比27号以前增加了5倍
还有就是搜狗,一直没有怎么去关注过,感觉搜狗更新速度好慢,也是隔一段时间才更新一次,这个周期我的感觉比百度还长,只是每次更新的数量好像比百度多一些。
到这个阶段我的站搜索引擎更新速度是:百度>google>雅虎>搜狗>搜搜
汉网天下现在文章大约4500篇,百度收录3030,Google收录2700,雅虎收录780.所以总体上来说还是不错的,快照更新在近两天。呵呵,大家努力做,会有收获的。
篇2:对于网站BD收录又删除的解决
多数站长都提到了自己网站今天收录了可是第二天又被删了,这样的情况在我身上也是遇到了,然而出现这种情况的原因其实是因为:
1、网站的权重不高,即使是自己原创的但是被人了,搜索引擎会认为文章是那个权重高的网站的而不是原创首发的网站;(这个只有增加高质量的外链,提高网站权重)
2、原创的文章少;(多发原创文章)
3、文章的内容更新不稳定,比如今天更新1篇,明天更新100篇,后天更新10篇,这样搜索引擎会认为网站的内田都是采集过来的;(坚持更新,即使不能每天更新太多,也要给自己一个数量,以后就更新这个数量的文章,比如20篇,当然,我们希望更新时越多越好,但是也要有个数量,反正不要时多时少)
4、友情连接,这个需要我们和好友做连接,同等PR值的好做,但是做pr高的一般只能买或者和好友做,当然如果你pr0换了pr4以上的就看你的运气了。
下面具体分析:大约15天前本站权重开始提升,每天不定时收录文章而且文章是在半小时内收录。但是在第2天更新的时候百度又会把头一天的收录删除掉,恢复到以前的收录数量.这样的情况一直持续下去,接下来我做的事情就是不定时增加内容,增加外连,改变百度对我站的搜索习惯,
在昨天晚上百度更新的时候本站已经稳定收录,没有出现昨天收录的内容今天删除的情况。
小贴士:综合汉网天下(hanwangtx.com)的收录情况分析,我们得出这样一个结果
1、每天坚持更新文章,并且推广一定数量的IP100个左右,这个过程可以让百度蜘蛛觉得你站很有食物吃,而且食物很好那么多人来看,自然蜘蛛也就更喜欢了;文章不一定要更新很多,这里切忌不要采集,新站采集很容易进入百度沙盒。但是一定要保持更新频率,尽量保持每天不定时更新,比如我就是早上起来就去转载几篇文章,然后推广几十个IP让百度觉得这个文章不错还有人看,然后过会又更新一篇或者几篇。(我记得当初有人告诉我每两个小时更新一定数量的文章,那么蜘蛛就会经常光顾你的网站。也就是网站的更新不要一次性更新完一天的)
2、让百度对站的收录习惯有所改变。我们来看百度第2天更新的时候是不是删除头一天收录的内容呢?那么如果在当天也收录是不是就不会删除了呢?既然你站的权重都达到了当天收录第2天删除的权重了,这个时候该变下百度对你站的收录习惯就可以保留住收录了,就是在当天晚上12点以后更新文章内容,我想站长都能做到吧,我们睡觉本来很晚的(辛苦啊),在2点前都有保持更新,那么12点后收录的文章是不是就是当天的了呢,再早上起来百度更新的时候就算删除了头一天的收录,可是你12点后收录的内容就还在的,也就成了当天的内容了,这个时候百度也会改变对你站的收录模式了,这个过程只需要1-3天就可以搞定百度收录又删除的问题。
3、坚持去论坛做点签名外链,或者写点文章到处发点,以次来增加外链。在12点左右再次更新文章,下午也不定时更新文章,这样坚持每天都做好。多吸引蜘蛛来自己的网站,那么我们对我们网站的好处自己试试就知道了。
篇3:百度和谷歌收录规律总结
对于网站的更新和收录,搜索引擎都有它们各自的规律,因此每一次网站的更新收录,都牵动着每一个网站运营者的神经。因为更新收录是百度排名和Google排名的基础,当然每一个网站的自身情况不一样,更新收录也不能一概而论的。根据互联网实战专家我的细心观察与对照,总结出百度、Google的更新收录规律与现象
1 百度更新及收录是根据你网站的质量和更新速度的变化而变化的,你快它也快,你慢它也慢;而Google更新则比较“稳重”,基本上是一周一更新,对于企业网站来说。如果是大门户网上,可能Google更新和收录的情况会不一样。许多网站运营者在进行百度优化和Google优化的时候,就会经常想着,到底是百度更新更快还是Google更新更快?而我觉得这不是一个绝对数。
2 对收录质量也在不断提高,早几年以前都说百度收录的数量很浮夸,而现在,很多大网站的收录数量被砍一半,甚至远远低于Google的收录数量。这一举动也说明百度在改变收录标准和更新标准。
3 令百度优化者经常头疼的事就是自己的网站经常被百度“k”,轻则K过首页,重则K掉其它更多的页面,甚至一毛不留。这是百度对于百度优化作弊者的一种惩罚机制。而且会有一种连带责任。如果某个网站被k,而你的网站有指向它的友情链接,那么你的网站也会被“K”。而且不会事先通知你。出现被“K”是很痛苦的事,如果你不采取补救措施,那么就可能一直“K”之下去。最后你的网站会被踢出百度之门。
百度搜索引擎的特点:
1.基于字词结合的信息处理方式。巧妙解决了中文信息的理解问题,极大地提高了搜索的准确性和查全率。
2.支持主流的中文编码标准。包括GBK(汉字内码扩展规范)、GB2312(简体)、BIG5(繁体),并且能够在不同的编码之间转换。
3.智能相关度算法。采用了基于内容和基于超链分析相结合的方法进行相关度评价,能够客观分析网页所包含的信息,从而最大限度保证了检索结果相关性。
4.检索结果能标示丰富的网页属性(如标题、网址、时间、大小、编码、摘要等),并突出用户的查询串,便于用户判断是否阅读原文。
5.百度搜索支持二次检索(又称渐进检索或逼进检索)。可在上次检索结果中继续检索,逐步缩小查找范围,直至达到最小、最准确的结果集。利于用户更加方便地在海量信息中找到自己真正感兴趣的内容。
6.相关检索词智能推荐技术。在用户第一次检索后,会提示相关的检索词,帮助用户查找更相关的结果,统计表明可以促进检索量提升10-20%.
7.运用多线程技术、高效的搜索算法、稳定的UNIX平台、和本地化的服务器,保证了最快的响应速度。百度搜索引擎在中国境内提供搜索服务,可大大缩短检索的响应时间(一个检索的平均响应时间小于0.5秒)
8.可以提供一周、二周、四周等多种服务方式。可以在7天之内完成网页的更新,是目前更新时间最快、数据量最大的中文搜索引擎。
9.检索结果输出支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式。支持用户选择时间范围,提高用户检索效率。
10.智能性、可扩展的搜索技术保证最快最多的收集互联网信息。拥有目前世界上最大的中文信息库,为用户提供最准确、最广泛、最具时效性的信息提供了坚实基础。
11.分布式结构、精心设计的优化算法、容错设计保证系统在大访问量下的高可用性、高扩展性、高性能和高稳定性。
12.高可配置性使得搜索服务能够满足不同用户的需求。
13.先进的网页动态摘要显示技术。
14.独有百度快照。
15.支持多种高级检索语法,使用户查询效率更高、结果更准。已支持“+”(AND)、“-”(NOT)、“|”(OR)、“site:”、“link:”,还将继续增加其它高效的搜索语法。
如何面对搜索引擎降权
被baidu进行降权,甚至被封杀。这些问题是许许多多网站都曾遇见到过的,有些网站并没有进行恶意作弊,优化也是很正常的,是什么原因造成的这些问题?资深的互联网实战专家我对baidu的这一现象进行了深入地研究和分析认为:站在SEO的角度去想,主要是网站的自身原因。一个网站可能会因为结构的不合理性就会容易出现类似的问题。那么如何提升你的站点对搜索引擎的权重?或者是如何解决降权或封站问题呢?今天笔者我将通过这篇文章与大家讨论研究。
面对降权要冷静分析,主要问题还是在与网站本身。所以要从网站开始,如果站点已经被降权了我们该怎么办?一般降权分为四种:1、站点部份收录内容减少;2、网站首页被屏蔽;3、网站外部链接减少;4、网站全部页面删除。
站点收录内容减少,面对此问题,首先应该考虑网的内部链接是否存在过失,是不是网站内出现过多死链。网站首页被屏蔽,这类问题主要出现在BAIDU.这个问题解决比较简单,直接将服务器的主机头索引修改为其他页面。或将首页的文件名称重新修改。但是做这些的先决条件是这个页面没有进行过度优化。网站外部链接减少,主要是因为你站点的外部连接质量不高,搜索引擎再进行调整的时候将你的外部那些“垃圾”链接删除,
所以一定要注重高质量外部资源。网站全部页面删除,这个问题是比较严重,一般出现了这个问题就意味着你的站点肯定存在很大问题。有可能是过度优化、有可能是网站结构等等。遇到这样的问题必须要将站点恢复原样,去掉多余链接修改网站框架结构。等待搜索引擎重新收录,一般这个周期会很长。如果这个站点域名不是很重要的话,可以考虑换掉域名,重新提交搜索引擎。
对于出现搜索引擎对网站降权(搜索引擎封闭站点的某个页面,或减少收录量,这就是我们经常说的降权)或封站(搜索引擎不收录该站点,或者将该站点在搜索引擎中的所有页面删除)问题,主baidu只收录网站的首页。而GOOGLE收录效果却良好。解决这些问题根本上就是要先提升站点在搜索引擎中的权重,让搜索引擎认可您的站点。我在多年的实战研究中,总结了以下问题:
1.精代码:很多网站都为了自己页面的美观华丽,为了实现一些复杂的功能而使用很多繁琐的程序来进行控制,而且在部署使用这些程序的时候,非常不注意这些程序的工整性,经常没有任何原则的随便胡乱插入,这样会让搜索引擎非常困惑,没有思路。所以为了搜索引擎能够更好的收录您的站点,请放弃那些花哨或一些不实用的功能吧。
2.改结构:网站的结构也就是说网站的整体框架。有些网站,为了实现一些在线功能,一个页面出现了多个iframe.虽然搜索引擎都在进步,Google已经避免了此问题,但Baidu仍然不是很喜欢存在iframe的页面。对于网站的内部链接情况,一定要本着清楚明白、保持链接通畅、尽量不要出现死链坏链情况。对于出现死链问题(如果是自己的服务器),可以重新制定错误信息。定期使用GoogleWebmasterTools或Xenu来检查自己的站点。
说到网站的整体结构,有过SEO经验或营销型网站(从用户体验,到用户行为跟踪,再到最后销售为一体的网站)建设的人都知道,网站漂亮不是目的,目的是将网站的访问用户转换,让网站高效率被搜索引擎认可。而要做到这些,网站的结构是非常重要的。说的简单一些,网站结构就是让用户看到他想看的东西,让他能时刻找到想要的信息和产品,并随时找到你的联系方式。搜索引擎方面,让搜索引擎能够顺利通过页面的链接抓取到网站中的每个页面,具体方面如建立有效的链接导航,让每个页面都具备导航功能,能方便引擎,也能方便用户。建立网站地图,将重要的内容或目录在地图中体现。尽量使用HTML页面。
3.重质量:网站应当具有一定的质量,如果一个网站不能给用户提供有价值的信息和内容,会被搜索引擎大打折扣,搜索引擎也一样很注重网站内容、页面质量,内部链接、外部链接质量和网站最终页面质量。我认为网站的优质内容在优化中占据很大比重!既然内容很重要,应该怎样去创造优质内容呢?搜索引擎读取文章只能把网页中的内容分离,分别建立索引,然后通过分词等技术对内容进行机器编译。再后是用户使用引擎搜索相关关键词,搜索引擎提供内容。按照它对页面网站的权重、唯一性等将网站或相关页面提前或靠后,展示给用户。所以对于优质内容来说尽量使用原创内容。每个人的写作方式都是不同的,所体现出来的断词形式,也肯定不同,所以尽量保证内容的原创唯一性。页面质量,指的是最终的终端页面质量,内容也算其一了。我还要指出一些网站不曾注意的但是很重要的方面。很多网站都有自己的新闻页面,这个页面可以说是终端页面了,但是站长都会忘记增加此类页面的关键词和一些最基本的meta标记,具体标记就不说了,真的应该注意一下。但切记不要滥用。Baidu的贴吧、知道、词条,可以说是Baidu的几大产品中最有意义的,这几个产品创造了很多唯一独立内容,而且很多内容都是按照中国人的搜索习惯研制的。
搜索引擎的进步体现在不断的为用户提供更高质量内容,并且会更注重网站的时效性,搜索引擎会把最新的新闻相关内容提高到搜索引擎搜索结果前面,尤其是新闻搜索。这块做好之后,也可以给你的站点带来一些流量,一些客户。如何来优化网站实效性呢?如何让搜索引擎更快收录到我的新闻终端页面呢?首先要保证的是网站在搜索引擎中的权重,你的站点与搜索引擎必须要有个良好的“合作”关系。让Spider们及时去关注自己的网站,甚至驻留Spider,这你就成功了!主要通过高质量外部资源来托起你的站点。网站页面本身应该注意代码简单,加入应有标记,保持良好链接。还有一点非常重要,那就是新闻页面的名称或目录。页面文件名来尽量使用NEWS071109.HTML或071109.HTML这样的名字,因为这些具有时间代表的文件名称是搜索引擎判断新闻的一个重要条件。对于