各大搜索引擎蜘蛛名称 了解搜索引擎变化

作者: zhushican 分类: 建站教程 发布时间: 2014年7月25日 次浏览 0条评论

      作为一名站长不但要懂得如何原创,如何发外链,还要学会分析网站的日志。站长会分析网站的日志,就能了解你的网站在搜索引擎中是否比较重要。通过网站日志你能得到哪些重要的信息,下面来详细说明下:
  一、看网站的抓取情况

  1、新站刚上线,看看搜索引擎有没有来你网站抓取了;

  2、网站收录异常,或者被k,通过日志可以了解搜索引擎是否还有来光顾你的网站;

  3、对于网站的问题进行解决必须要读懂日志;

  二、怎么查找网站日志?

  一般在FTP一个名为logs的文件夹,不同的服务器可能日志文件命名不一样,不过一定会包含logs这个关键词
 

  三、怎么打开日志?

  下载,解压后,可以用文本编辑器打开,如果打开是乱码的话,可以用Editplus或dreamweaver等网页编辑器打开。

  四、各大搜索引擎蜘蛛名称:

  打开日志后我们可以看到如下的这些搜索引擎蜘蛛名称,分别代表的就是哪个搜索引擎到过你的网站。

  百度baiduspider

  Google=Googlebot

  Msn:msnbot

  yahoo:Slurp

  yodao:YoudaoBot

  sogou:Sogou+get+spider

  360:360Spider

  五:日志拆解

  在日志里面搜索下以上蜘蛛的名称就能清楚了解蜘蛛有没有来过你的网站,并且知道蜘蛛抓取你的网站页面情况。

  123.125.71.33 - - [19/Apr/2013:00:47:39 +0800] "GET /page/contact/contact.php HTTP/1.1" 200 21978 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)"

  具体分析如下:

  123.125.71.33 访问IP

  [19/Apr/2013:00:47:39 +0800] 访问时间与时区

  GET /page/contact/contact.php HTTP/1.1 根据HTTP/1.1 协议 抓取(域名下)/page/contact/contact.php 这个页面(GET表示服务器动作)

  200 服务器响应状态码。

  21978 表示抓取了21978个字节。

  Mozilla/5.0 表示访问者使用火狐浏览器访问端信息

  六、网站日志对seo有关于的信息

  不同的服务器或虚拟主机设置的日志记录内容不同。

  有的如:200 0 33834 237 953 我们通过多看几条记录,观察规律,可以判断第三个数字代表字节数。

  有的如:200 0 0或200 0 64 这是没有记录抓取字节数。注意:200 0 0和200 0 64 没代表什么问题。所谓200 0 64代表要被K的言论没有根据,一般的网站都有64代码。

  在日志里,发现比较多的HTTP状态码是,200(正常)、304(没变化)、404(错误链接)。

  304代表,自从上次抓取后,该内容没有更新。一般情况下,网站的图片经常会返回该值。

  404代表,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外链了这么个死链接

本文出自 老域名查询 ,转载时请注明出处及相应链接。

本文永久链接: http://www.sc8323.com/2014/464.html

回顶部