304状态码的相关详细介绍

2010年5月2日 由 admin 留言 »

在了解304状态码之前,我们首先来了解下,蜘蛛和爬虫类的工作机制!

蜘蛛和爬虫类的工具在对网站进行相关的抓取的时候经常要对页面进行监控和解析,其中监控就是检查页面内容是否发生了更新。之前湖南SEO研究中心发布过一篇:百度怎样判断你网站的更新!这篇文章里也提到了304状态码!

判断网页是否发生变化最直接的方法是设置页面的某一处为监控区域,每次都抓取该部分区域的内容,然后与本地保存的或最近一次抓取内容比较,如果有差异就表明网页发生了变化,才可以进行解析。这种方法比较稳妥,几乎可达到万无一失的效果。但是,这种方式在每次扫描时都要下载页面内容,并且要去截取监控区域的内容,最后还要进行字符串比较,整个过程比较耗时。其实在众多网页中,有一部分网站的网页内容是静态页面,如图片,html,js等,这些静态页面往往可能是服务器早已准备好的,用户访问时仅仅是下载而已。那么针对这种静态页面,就可以仅仅通过状态码来判断,内容是否发生了变化。

这个状态码就是304(Not Modified),对于这个代码的解释是”如果客户端发送了一个带条件的 GET 请求且该请求已被允许,而文档的内容(自上次访问以来或者根据请求的条件)并没有改变,则服务器应当返回这个状态码”。

很明显通过这个解释,我们就明白了,简单来讲:通常,在网页发生变化时,服务器会返回状态码200,而未发生变化则返回304。

广告位 
分享到:

8 条评论

  1. 反击破碎机说道:

    通过你的网站已经了解了304状态码得作用,谢谢,郑州seohttp://www.1seoer.com友情访问

  2. rhinestone jewellery说道:

    正在找这个 谢谢了,学习了

  3. 杭州seo说道:

    谢谢,找到答案了

  4. 揭阳seo说道:

    请问返回304状态码对网站优化是不是不好?

  5. QQ营销软件说道:

    学习了,代码一直看不懂

  6. 看了网站出现304具体如何操做呢!

  7. 阅微草堂说道:

    跟seo有什么关系呢?

  8. admin说道:

    您确实是高手!

发表评论