网站日志分析
什么是网站日志
网站日志是记录Web服务器接收处理请求以及运行时错误等各种原始信息的文件,确切的讲,应该是服务器日志。网站日志最重要的意义是记录网站运行过程之中的服务器空间情况、搜索引擎访问情况、用户访问网站的行为记录等。它连网站日志技术都记录了哪些操作系统、浏览器和客户显示等信息。
如何进行网站日志分析
网站日志分析主要包括以下几个步骤:
-
下载网站日志:如果你使用的是虚拟主机,一般日志都会按天保存在站点根目录的wwwlogs或者logs文件夹中,可以通过FTP工具进行下载;如果是宝塔面板,则可以在文件-根目录-wwwlogs中下载。
-
使用分析工具:下载后的网站日志是需要经过处理才能看到数据的,可以使用一些专业的网站日志分析工具,如爱站的网站日志分析工具,进入日志分析工具后,导入要分析的网站日志,然后点击分析就可以根据需要查看蜘蛛数据。
-
查看网站状态码:通过状态码我们可以了解网站的基本情况,像,301永久跳转、302临时跳转、404打不开页面、503服务器请求错误等等。
-
分析用户行为:我们可以通过用户访问的时间来判断用户的到访我们网站的习惯和用户心理行为分析等。
-
对比网站地图中的URL:对比被抓取页面和网站地图中的URL,如果有sitemap的url中有没有被抓取的页面,可以将这些数据重新提交百度站长平台。
-
处理无效抓取数据:在日志表格中对抓取过sitemap中的url做标记,然后筛选出其他url,通过筛选可以整理出一组数据,近期百度蜘蛛对网站的抓取总量是3743,对整个sitemap中url,根目录,robots文件的抓取总量是1463,对其他页面抓取总量是2280。也就是说有百分之61的蜘蛛抓取了其他页面,那这些页面都是做什么的呢?又该如何处理呢?可以直接将这些url全部加入robots中。
以上就是关于网站日志及其分析方法的详细介绍。
原创文章,作者:Ur47000,如若转载,请注明出处:https://wyc.retuba.cn/3223.html