百度与SEO大师的对话

2010年4月16日 由 admin 留言 »

百度最近加强了与站长、SEO们之间的交流,推出了站长俱乐部百度站长平台,等一些系列活动,下面就是百度站长俱乐部的相关SEO牛人提出的SEO相关问题,这些问题相信也是困扰一大批的SEO工作者,在这里,叠鹤就把里面的相关问题都整理出来了,有些,问题,百度还没有做相关回答,到时湖南SEO研究中心抽空再补充!

链接点击率是否计入排名算法

问:百度是否有会估算某网页的某个反向链接被点击次数(例如:从工具条、流量统计等工具得到的部分数据)?比如是否把链接的点击率计入算法之中?是否会利用这点来判断哪些是隐藏链接?或者判断外链的相关性等因素。
答:我只能说,一切有利于排序改进的因素,都有可能被搜索引擎尝试应用。

百度是否跟踪JavaScript链接

问:知道百度支持nofollow后又有了这个问题,百度是否跟踪JS链接并传递权重?

因为有的时候某些页面得到太多权重没什么意义,比如用户登录、注册页面之类的。是否可以用简单的JS阻挡链接传递权重,比如:

<a href=”javascript:void(0)” onClick=”window.open(‘http://www.hn-seo.com’)”>
或者:onclick=”window.location.href=’http://www.hn-seo.com/’;”还是需要更复杂的JS脚本?

答:javascript的解析,是很多搜索引擎正在做的事情;同理,对flash的解析。毕竟有那么多应用javascript或者flash的网站,其实并没有意识到,他们的做法给搜索引擎的收录和索引带来的麻烦。所以,如果期望不被搜索引擎收录的话,最直接的手段,还是写robots文件。

服务器开启gzip压缩

问:服务器开启gzip压缩是否会影响蜘蛛抓取和收录量?

答:服务器开启gzip压缩,不会对spider抓取产生影响,我们会以压缩的方式来抓取。并且也能够节省站点的网络流量。

HTTPS的网页网页被收录

问:一般来说,网站所有者不是太希望 https 的网页被收录。如果收录了,如果处理?把 https 的网页URL更换成 http 形式的?还有一种情况,就是 ip 地址形式的URL被收录。

答:如果不希望被收录,常规的做法是设置robots文件。
https主要的出发点是安全,并没有太多考虑搜索引擎。从用户角度,很多采用了https的站点(尤其是首页),也是需要被搜索到的,比如支付宝,贝宝等。通常情况下,搜索引擎对这类网页并不做内容解析,而只是将url进行索引。
IP地址的url被收录,除了spider在机制上的不完善之外,通常站点设计上也有一些缺陷。一般情况下,这类问题是可以被规避的。

HTTP状态码 200 0 64是怎么回事

问:百度蜘蛛访问后返回的HTTP状态码为200 0 64与200 0 0的区别?是否和服务器开启gzip压缩有关?我开启后感觉百度蜘蛛访问后返回的HTTP状态码均为200 0 64。

答:

链接会不会过一段时间权重降低

问:百度针对连接上存在不存在有效期的问题,意思上是说,一个链接的权重会不会过一段时间后就会没有了,或者逐渐降低?

答:

购买链接是否会被百度惩罚

问:关于当前作SEO的同学们,都在疯狂的购买链接。表现最为突出的即是各大SF类网站,他们全是通过购买大量的友情链接来强J搜索引擎而上来的。(像传世 SF,前几名的站每个月的链接费用就至少超过五万。)
那么,百度对于这种明显的,通过大量购买链接来作SEO,强行登顶的作法今后是否会受到百度的惩罚?
因为就目前来看,百度对购买链接还没有一点惩罚的迹象,一般的词,网站收录后,只要稍加更新然后狂买两个月链接,绝对进前三名。
而谷歌老早就说明确了。通过购买链接来增加PR会受到惩罚,百度在这方面的算法是否也应该更新一下了?

答:这种手段奏效,说明百度在识别和处理超链作弊方面,仍存在很多问题。这类问题理应得到妥善的解决,以使互联网环境得到净化。我们回头会和相关的同事就此问题了解一下。
问:百度目前支持链接的nofollow属性吗?rel=’external nofollow’

答:百度现在支持nofollow标签。带nofollow标签的链接,我们会忽略掉它绝大部分的作用。

nofollow主要用在用户留言等不受站长控制的地方,这些地方的投票不是站长的意志,告诉搜索引擎不要给他投票是合适的,就象zac博客中那些以请输入关键词、网购推荐等做为Anchor描述的链接,肯定不是zac想推荐的。
如果是做友情链接正式地推荐别的人网站,当然就不能使用nofollow了。。。

网站被挂股票类小偷后不收录新文章

问:公司网站是健康类的行业门户网站,能实现每天收录新文章,文章发布数量在100篇左右,主关键词排名和长尾关键词排名都不错,我们网站有好几名专职编辑,所以文章内容质量不存在问题。
但是一个月前,网站被黑客攻击,在网站加了一个小偷程序,是股票类的,百度当天就收录近几千多条,几天我们发现后就删除了这个程序,并设置了robots屏蔽了该地址,第二天百度也删除了这些内容,但是从此之后,网站就不在被搜索引擎收录新文章,排名主关键词也受到了影响。
现在一个月多了还是没有恢复,请问这种有什么好的解决方法?
答:这类问题去年开始流行,我们进行了遏制。我们也希望能分清良莠,但实现上总是有一些不完美。但是这个问题比较奇怪,建议该站长再细细看下抓取和索引记录。不要用site来判定。

文本锚链接采用和背景色一样

问:文本锚链接采用和背景色一样是否算是隐藏链接?搜索引擎是否会判断?

答:这是一个没太多建设性的问题,因为答案是如此的显而易见。这个地方不是用来给spammer试探用的,我们还是期望看到更多富于建设性的沟通。

site: 查询,只有首页收录

问:网站用site: 查询,只有首页收录,请问是什么机制造成的?

答:两种情况吧
1,新站点,具体内容还没来得及抓取和索引。
2,老站点,因为种种原因被严厉惩罚了,站长圈俗称“拔毛”。
后者的严厉惩罚机制,我们期望逐渐演化为更合理的甄别和处理。实际上现在的状况,比之四、五年前,已经人性化多了。呵呵。

页面速度

问:目前谷歌已经把网页加载速度纳入页面排名影响因素,百度是否也考虑此因素决定网站搜索排名。
答:这是很容易想到的一个网站价值评价要素。但如何有效应用,并不是一件很容易的事情,需要非常谨慎。中国尤其复杂,不同网段差异甚大。但显著影响到用户体验的广泛要素,最终都会被搜索引擎谨慎的尝试和使用吧。

百度的互联网论坛收录开放协议现在还有用吗?

问:百度的互联网论坛收录开放协议现在还有用吗?

答:预告一下,随着站长平台的逐步完善,这个问题将会得到比较稳妥、彻底的解决。过去的做法不够系统。

刷百度相关搜索和搜索下拉框搜索提示

问:目前刷百度相关搜索和搜索下拉框的方法很多,怎样才能限制或者根除这种现象。有没有像投诉平台这样的地方,可以让大家投诉,给大家一个更好的相关搜索?

答:这个问题的确很恼人。目前我们正在全力处理中,可预期将有大幅改观。
投诉可以发送到webmaster@baidu.com,肯定可以送达相关工程师,但不会有具体的回复。此外,处理多半是策略级的升级,个案的针对性处理会比较少。

原创与伪原创

问:百度如何看待伪原创?

答:“伪原创”就是“非原创”。对非原创的策略,同样适用于伪原创。归根结底,这是一个技术实现程度问题,而不是策略思路问题。

好多人认为他们做的所谓“伪原创”挺好,应该能骗过搜索引擎,这大概低估了搜索引擎算法。还是得回到根本,内容为王。说起来容易,做起来难,很少人会认真去做。
百度如何对待过期域名?
问:百度如何对待过期域名?谷歌对过期的域名很长一段时间还有收录, 而百度却很快就会将其清空。
答:过期域名也是域名,所以,适用于新域名的策略,也一样适用于过期域名。只是过期域名在历史上累积的与现有网站无关的权重,会被剥离掉,这也是很容易理解的。
谷歌有PR指,搜狗有指数,百度有什么?
问:这个估计是很多站长比较想知道的。谷歌有PR,搜狗有指数,百度有什么?
或许百度已经有对网页进行质量评分了,暂时没有对外开放?以后会有这样的网页评级指数么?
答:多公布一个评级指数,只是为站长们多带来一分烦恼。事实上,很少有成熟的搜索引擎会发布用于最终质量评级的指数。按照Google的官方说法,PR也只是诸多排序因子中的一个而已。
IP或服务器被惩罚
问:使用虚拟主机的网站会不会因为同一个IP或同一台服务器上有其他网站作弊被处罚而受连累,也被惩罚?
答:连坐,血统论等,是在极权社会里才出现的反人类政策。一个成熟的搜索引擎,这么蛮干的可能性很小。
百度数据更新的周期大概是多长?
问:百度数据更新的周期大概是多长?很多站长估计都关心这个问题。
答:如果是一个变化频繁的入口索引页面,相信这个变化周期会很短;而是相对稳固的内容型页面,周期则会相对较长。站长们观察一下蜘蛛的爬取日志,发现的规律会比这边的说明更有价值。
此外,搜索结果页上的那个时间,一直很让人confusing,我们正在考虑修改。
百度沙盒效应
问:百度目前是否沙盒效应明显?
答:不同人有不同感受。这个问题大家会更有发言权
黑链判断
问:最近黑进gov或学校网站加上自己网站链接盛行。百度内部评估对这种黑链的鉴别准确性有多高?如果搜索引擎不能鉴别,普通企业和站长面对黑链很难竞争。
答:这个问题早已留意到,并一直在应对策略的完善中。
大批毫无道德和法律底线的人,使得中国互联网的生态环境变得非常恶劣。但按我们的理解,除了搜索引擎强化技术应对方案之外,中国法治的完善,才是对这类违法犯罪行为进行遏制的根本手段。目前互联网相关的立法,远落后于互联网的发展。
竞争对手陷害
问:百度如何对站外作弊的手法判断是不是竞争对手所做,比如买黑链,建群站,群发垃圾垃圾等,这些竞争对手都能帮你做。可否透露下百度对这个判断的原理,站长如何防范,发现被人陷害的话,如何举报或采取其他措施?
答:如果想维护一个策略的生命周期的话,最好的方式是保守策略细节的秘密。但有一点可以确定,一个成熟的搜索引擎,不会轻易的通过一两个要素来判断一个网站的生死。
子域名问题
问:百度对子域名如 bbs.hn-seo.com和主域名 www.hn-seo.com权重怎么处理?是当作两个不同的网站还是子域名会继承主域名的权重?
答:怎样处理是合乎逻辑的,策略上就会采用那个合乎常理的处理手段。或者这样讲,如果你是负责这个权重处理的,你觉得怎样做是最合理的?那么很可能百度就是如你所想的。呵呵。
搜索引擎理解起来并不复杂,站在用户角度考量,很容易揣摩搜索引擎的策略思路。
76页搜索结果
问:通常百度一共显示76页搜索,至少我常见到的都是76页。76这个数字有什么特殊原因吗?为什么不是100页?
答:就像键盘为什么是qwer一样,原因无从考察起了。但有一点,无论是76,还是100,对用户而言,都无伤大雅。
一个比较敏感的问题
问:对于企业站来说。
如果百度竞价广告不继续投放,那该网站网页在百度中的自然排名是否有消极影响?
另外,对于百度竞价的大广告主的网站所拥有的权重,是否略高(相对于其他非广告客户的网站来说)?
答:问题比较敏感,我也相信,很多人都想得到回答。
呵呵,这个问题一点也不敏感。但有一点,百度网页搜索的技术和产品部门的员工,面对这样的问题的时候,都感到特别无奈。
有一点可以十分的肯定:一个网站在百度自然搜索结果中的排序,和他与百度有怎样的利益瓜葛,毫无关系。
网上经常有这样的言论:
百度业务员要我做竞价排名,我没做,排名下降了;我停掉了百度的竞价排名业务,结果我的网站被百度拔毛了——>百度很黑,利用垄断地位获取不正当利益。
以下是常识性的逻辑分析:
第一,可以统计一下周围拒掉百度业务员电话、停掉百度竞价投放的站长和公司,有多少比例,随后受到的显著的消极影响?这个比例需要大到何种程度,才可以大致获得上面的结论?这是一种最起码的数据分析逻辑。
第二,推广百度业务的销售员,一天打的电话,估计以十万计吧,而被拒掉的,至少也是数万计的。这个数万计的拒绝,都下达给百度的技术部门,要求惩罚,这个操作可行性有多大?这么大的量,早就是遍地证据,百度怕早就被告倒了。但到目前为止法庭上的相关案例,不管是告百度垄断的、还是告恶意屏蔽的,落到最后都是因为自己手脚不干净,当庭出丑。
第三,再从概率角度做一个估算。作为一个搜索引擎,常态就是策略迭代变化。假定每周策略小变化,影响面10%,而一周内百度推广电话以百万计,那么同时接到电话和受到策略影响的,数量至少是10万级。有些影响大一些,有些影响小一些。我们看到的是,受到正面影响的,从来就是偷着乐,或者到站长论坛上炫耀;而受到负面影响的,则是到处破口大骂。
至于所谓的大客户,大部分“大客户”同时也是“大网站”,有稳定的服务,优质而独有的内容。这个集合被赋予高权重的概率本来就高于中小网站集合,而和是否有利益无关。
百度11位现象
问:百度11位现象是怎么回事,有没有这种机制,什么原因造成的?
答:这是一个很有意思的“术语”。作为搜索引擎,10位还是11位不是关键,关键是用户体验。作为站长,在看待网站排序的时候,如果不仅仅是从自己的利益角度出发,也能从一个普通用户角度出发,那么我们相信,大家就能找到更多的共鸣了。呵呵。
关于网站信产部备案
问:网站是否在信产部备案,这是不是会成为影响网站收录和排名的一个因素?
答:任何对站点价值分析有贡献的要素,都有可能被搜索引擎使用。并且这些要素的使用方式,也不是一成不变的。至于具体有哪些要素已经被使用以及如何使用,这个无法详述。呵呵。
百度如何看待域名劫持?
问:百度如何看待域名劫持?
答:一切非法的、有损互联网生态的行为,搜索引擎本身也是受害者。但从技术角度,判定一个域名信息的变更,是正常行为,还是非法行为,是非常困难的。就目前而言,因为域名劫持导致的排序或者权重问题,还是极为罕见的。
中文网站海外空间
问:百度对使用海外空间的中文网站有歧视吗?百度是否会抓取域名注册人的相关whois信息吗?
答:1,百度对海外站点没有歧视。但百度从国内爬出去的蜘蛛,会严格遵守国家的政策和法令,所以国内普通用户访问受限的内容,百度蜘蛛一样会搞不定。
2,任何对站点价值分析有贡献的要素,都有可能被搜索引擎使用。并且这些要素的使用方式,也不是一成不变的。至于具体有哪些要素已经被使用以及如何使用,这个无法详述。
百度对301重定向
问:将一个旧的URL进行301重定向处理,百度反应很慢?
而且旧的URL会在相当一段时间内还存在于百度搜索结果中,但是网页标题是新的,缺少描述。
答:对于内容迁移,我们推荐的做法就是将旧url 301永久重定向到内容对应的新url,这样我们会把旧url积累的权值转移到新url上。
为了避免种种不稳定的因素,目前我们的处理策略比较保守,新、旧url会同时并存相当长的时间。最近我们意识到这样处理其实并不妥当,正在调研更迅速的处理方式,相信很快就可以完美的处理好这个问题。
前段时间各站收录数狂降是怎么回事?
问:大概在10年4月1号前后,很多站长用site查看自己在百度的收录数量,发现狂降,现在好像又恢复了,那是怎么回事?
答:我们也注意到了这种说法,其实收录方面没什么变动,只是我们在上线新策略的过程中短暂影响了结果数估算算法,大家只要关注一下流量即可知道,那段时间从百度获得的流量并没有变化,如果收录数真的发生了大的变动,肯定会影响流量。

另外,相信大家在用site语法查询结果数时,也看到了搜索结果最上方的“找到的相关网页数是估算值,不代表真实结果数,仅供参考的提示”的提示,我们的搜索结果数估算算法是针对正常用户的关键词检索而设计,没有针对site语法检索做过优化,它得出的搜索结果数只能做为一个参考,建议关注网站从百度获得的流量有没有变动更直接。

广告位
分享到:

发表回复