百度最近加强了与站长、SEO们之间的交流,推出了站长俱乐部,百度站长平台,等一些系列活动,下面就是百度站长俱乐部的相关SEO牛人提出的SEO相关问题,这些问题相信也是困扰一大批的SEO工作者,在这里,叠鹤就把里面的相关问题都整理出来了,有些,问题,百度还没有做相关回答,到时湖南SEO研究中心抽空再补充!
链接点击率是否计入排名算法
问:百度是否有会估算某网页的某个反向链接被点击次数(例如:从工具条、流量统计等工具得到的部分数据)?比如是否把链接的点击率计入算法之中?是否会利用这点来判断哪些是隐藏链接?或者判断外链的相关性等因素。
答:我只能说,一切有利于排序改进的因素,都有可能被搜索引擎尝试应用。
百度是否跟踪JavaScript链接
问:知道百度支持nofollow后又有了这个问题,百度是否跟踪JS链接并传递权重?
因为有的时候某些页面得到太多权重没什么意义,比如用户登录、注册页面之类的。是否可以用简单的JS阻挡链接传递权重,比如:
<a href=”javascript:void(0)” onClick=”window.open(‘http://www.hn-seo.com’)”>
或者:onclick=”window.location.href=’http://www.hn-seo.com/’;”还是需要更复杂的JS脚本?
答:javascript的解析,是很多搜索引擎正在做的事情;同理,对flash的解析。毕竟有那么多应用javascript或者flash的网站,其实并没有意识到,他们的做法给搜索引擎的收录和索引带来的麻烦。所以,如果期望不被搜索引擎收录的话,最直接的手段,还是写robots文件。
服务器开启gzip压缩
问:服务器开启gzip压缩是否会影响蜘蛛抓取和收录量?
答:服务器开启gzip压缩,不会对spider抓取产生影响,我们会以压缩的方式来抓取。并且也能够节省站点的网络流量。
HTTPS的网页网页被收录
问:一般来说,网站所有者不是太希望 https 的网页被收录。如果收录了,如果处理?把 https 的网页URL更换成 http 形式的?还有一种情况,就是 ip 地址形式的URL被收录。
答:如果不希望被收录,常规的做法是设置robots文件。
https主要的出发点是安全,并没有太多考虑搜索引擎。从用户角度,很多采用了https的站点(尤其是首页),也是需要被搜索到的,比如支付宝,贝宝等。通常情况下,搜索引擎对这类网页并不做内容解析,而只是将url进行索引。
IP地址的url被收录,除了spider在机制上的不完善之外,通常站点设计上也有一些缺陷。一般情况下,这类问题是可以被规避的。
HTTP状态码 200 0 64是怎么回事
问:百度蜘蛛访问后返回的HTTP状态码为200 0 64与200 0 0的区别?是否和服务器开启gzip压缩有关?我开启后感觉百度蜘蛛访问后返回的HTTP状态码均为200 0 64。
答:
链接会不会过一段时间权重降低
问:百度针对连接上存在不存在有效期的问题,意思上是说,一个链接的权重会不会过一段时间后就会没有了,或者逐渐降低?
答:
购买链接是否会被百度惩罚
问:关于当前作SEO的同学们,都在疯狂的购买链接。表现最为突出的即是各大SF类网站,他们全是通过购买大量的友情链接来强J搜索引擎而上来的。(像传世 SF,前几名的站每个月的链接费用就至少超过五万。)
那么,百度对于这种明显的,通过大量购买链接来作SEO,强行登顶的作法今后是否会受到百度的惩罚?
因为就目前来看,百度对购买链接还没有一点惩罚的迹象,一般的词,网站收录后,只要稍加更新然后狂买两个月链接,绝对进前三名。
而谷歌老早就说明确了。通过购买链接来增加PR会受到惩罚,百度在这方面的算法是否也应该更新一下了?
答:这种手段奏效,说明百度在识别和处理超链作弊方面,仍存在很多问题。这类问题理应得到妥善的解决,以使互联网环境得到净化。我们回头会和相关的同事就此问题了解一下。
问:百度目前支持链接的nofollow属性吗?rel=’external nofollow’
答:百度现在支持nofollow标签。带nofollow标签的链接,我们会忽略掉它绝大部分的作用。
如果是做友情链接正式地推荐别的人网站,当然就不能使用nofollow了。。。
网站被挂股票类小偷后不收录新文章
问:公司网站是健康类的行业门户网站,能实现每天收录新文章,文章发布数量在100篇左右,主关键词排名和长尾关键词排名都不错,我们网站有好几名专职编辑,所以文章内容质量不存在问题。
但是一个月前,网站被黑客攻击,在网站加了一个小偷程序,是股票类的,百度当天就收录近几千多条,几天我们发现后就删除了这个程序,并设置了robots屏蔽了该地址,第二天百度也删除了这些内容,但是从此之后,网站就不在被搜索引擎收录新文章,排名主关键词也受到了影响。
现在一个月多了还是没有恢复,请问这种有什么好的解决方法?
答:这类问题去年开始流行,我们进行了遏制。我们也希望能分清良莠,但实现上总是有一些不完美。但是这个问题比较奇怪,建议该站长再细细看下抓取和索引记录。不要用site来判定。
文本锚链接采用和背景色一样
问:文本锚链接采用和背景色一样是否算是隐藏链接?搜索引擎是否会判断?
答:这是一个没太多建设性的问题,因为答案是如此的显而易见。这个地方不是用来给spammer试探用的,我们还是期望看到更多富于建设性的沟通。
site: 查询,只有首页收录
问:网站用site: 查询,只有首页收录,请问是什么机制造成的?
答:两种情况吧
1,新站点,具体内容还没来得及抓取和索引。
2,老站点,因为种种原因被严厉惩罚了,站长圈俗称“拔毛”。
后者的严厉惩罚机制,我们期望逐渐演化为更合理的甄别和处理。实际上现在的状况,比之四、五年前,已经人性化多了。呵呵。
页面速度
问:目前谷歌已经把网页加载速度纳入页面排名影响因素,百度是否也考虑此因素决定网站搜索排名。
答:这是很容易想到的一个网站价值评价要素。但如何有效应用,并不是一件很容易的事情,需要非常谨慎。中国尤其复杂,不同网段差异甚大。但显著影响到用户体验的广泛要素,最终都会被搜索引擎谨慎的尝试和使用吧。
百度的互联网论坛收录开放协议现在还有用吗?
问:百度的互联网论坛收录开放协议现在还有用吗?
答:预告一下,随着站长平台的逐步完善,这个问题将会得到比较稳妥、彻底的解决。过去的做法不够系统。
刷百度相关搜索和搜索下拉框搜索提示
问:目前刷百度相关搜索和搜索下拉框的方法很多,怎样才能限制或者根除这种现象。有没有像投诉平台这样的地方,可以让大家投诉,给大家一个更好的相关搜索?
答:这个问题的确很恼人。目前我们正在全力处理中,可预期将有大幅改观。
投诉可以发送到webmaster@baidu.com,肯定可以送达相关工程师,但不会有具体的回复。此外,处理多半是策略级的升级,个案的针对性处理会比较少。
原创与伪原创
问:百度如何看待伪原创?
答:“伪原创”就是“非原创”。对非原创的策略,同样适用于伪原创。归根结底,这是一个技术实现程度问题,而不是策略思路问题。
谷歌有PR指,搜狗有指数,百度有什么?
或许百度已经有对网页进行质量评分了,暂时没有对外开放?以后会有这样的网页评级指数么?
百度数据更新的周期大概是多长?
此外,搜索结果页上的那个时间,一直很让人confusing,我们正在考虑修改。
答:这个问题早已留意到,并一直在应对策略的完善中。
大批毫无道德和法律底线的人,使得中国互联网的生态环境变得非常恶劣。但按我们的理解,除了搜索引擎强化技术应对方案之外,中国法治的完善,才是对这类违法犯罪行为进行遏制的根本手段。目前互联网相关的立法,远落后于互联网的发展。
子域名问题
搜索引擎理解起来并不复杂,站在用户角度考量,很容易揣摩搜索引擎的策略思路。
如果百度竞价广告不继续投放,那该网站网页在百度中的自然排名是否有消极影响?
另外,对于百度竞价的大广告主的网站所拥有的权重,是否略高(相对于其他非广告客户的网站来说)?
答:问题比较敏感,我也相信,很多人都想得到回答。
呵呵,这个问题一点也不敏感。但有一点,百度网页搜索的技术和产品部门的员工,面对这样的问题的时候,都感到特别无奈。
有一点可以十分的肯定:一个网站在百度自然搜索结果中的排序,和他与百度有怎样的利益瓜葛,毫无关系。
网上经常有这样的言论:
百度业务员要我做竞价排名,我没做,排名下降了;我停掉了百度的竞价排名业务,结果我的网站被百度拔毛了——>百度很黑,利用垄断地位获取不正当利益。
以下是常识性的逻辑分析:
第一,可以统计一下周围拒掉百度业务员电话、停掉百度竞价投放的站长和公司,有多少比例,随后受到的显著的消极影响?这个比例需要大到何种程度,才可以大致获得上面的结论?这是一种最起码的数据分析逻辑。
第二,推广百度业务的销售员,一天打的电话,估计以十万计吧,而被拒掉的,至少也是数万计的。这个数万计的拒绝,都下达给百度的技术部门,要求惩罚,这个操作可行性有多大?这么大的量,早就是遍地证据,百度怕早就被告倒了。但到目前为止法庭上的相关案例,不管是告百度垄断的、还是告恶意屏蔽的,落到最后都是因为自己手脚不干净,当庭出丑。
第三,再从概率角度做一个估算。作为一个搜索引擎,常态就是策略迭代变化。假定每周策略小变化,影响面10%,而一周内百度推广电话以百万计,那么同时接到电话和受到策略影响的,数量至少是10万级。有些影响大一些,有些影响小一些。我们看到的是,受到正面影响的,从来就是偷着乐,或者到站长论坛上炫耀;而受到负面影响的,则是到处破口大骂。
至于所谓的大客户,大部分“大客户”同时也是“大网站”,有稳定的服务,优质而独有的内容。这个集合被赋予高权重的概率本来就高于中小网站集合,而和是否有利益无关。
百度11位现象
2,任何对站点价值分析有贡献的要素,都有可能被搜索引擎使用。并且这些要素的使用方式,也不是一成不变的。至于具体有哪些要素已经被使用以及如何使用,这个无法详述。
而且旧的URL会在相当一段时间内还存在于百度搜索结果中,但是网页标题是新的,缺少描述。
答:对于内容迁移,我们推荐的做法就是将旧url 301永久重定向到内容对应的新url,这样我们会把旧url积累的权值转移到新url上。
为了避免种种不稳定的因素,目前我们的处理策略比较保守,新、旧url会同时并存相当长的时间。最近我们意识到这样处理其实并不妥当,正在调研更迅速的处理方式,相信很快就可以完美的处理好这个问题。
前段时间各站收录数狂降是怎么回事?
另外,相信大家在用site语法查询结果数时,也看到了搜索结果最上方的“找到的相关网页数是估算值,不代表真实结果数,仅供参考的提示”的提示,我们的搜索结果数估算算法是针对正常用户的关键词检索而设计,没有针对site语法检索做过优化,它得出的搜索结果数只能做为一个参考,建议关注网站从百度获得的流量有没有变动更直接。