1. 云栖社区>
  2. PHP教程>
  3. 正文

php正则解析apache日志文件文件

作者:用户 来源:互联网 时间:2017-12-01 12:11:08

php日志文件正则apache解析

php正则解析apache日志文件文件 - 摘要: 本文讲的是php正则解析apache日志文件文件, 可以把日志按小时滚动,采用php正则分析日志的方式进行解决 $logLine ='127.0.0.1 - - [22/May/2015:17:09:13 +0800] "GET /sale/images/y-select.png HTTP


可以把日志按小时滚动,采用php正则分析日志的方式进行解决


$logLine ='127.0.0.1 - - [22/May/2015:17:09:13 +0800] "GET /sale/images/y-select.png HTTP/1.1" 200 1095';
$pattern = '/^(?P[0-9.]+) - - [(?P[^]]+)]+ "GET (?P[^ ]+) HTTP/1.[1|0|2]" (?P[0-9.]+) (?P[0-9.]+)/i';
preg_match($pattern, $log, $match);
//var_dump($match);
$ip = $match['ip'];
$time = strtotime($match['time']);
$url = $match['url'];
$status = $match['status'];
$size = $match['size'];
printf("IP:%s 访问时间:%s URL:%s 状态:%s 文件尺寸:%s",$ip,$time,$url,$status,$size);

 也可是这样


运用正则表达式分隔Apache日志文件www.MyException.Cn  网友分享于:2015-08-26  浏览:17次
 
使用正则表达式分隔Apache日志文件 通用日志格式的Apache日志文件示例:127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326组合日志格式的Apache日志文件示例:127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326 "http://www.example.com/start.html" "Mozilla/4.08 [en] (Win98; I ;Nav)"客户端的IP地址。 由客户端identd进程判断的RFC1413身份(identity),输出中的符号"-"表示此处的信息无效。 HTTP认证系统得到的访问该网页的客户标识(userid),如果网页没有设置密码保护,则此项将是"-"。 服务器完成请求处理时的时间。 客户的动作请求的资源使用的协议。 服务器返回给客户端的状态码。 返回给客户端的不包括响应头的字节数.如果没有信息返回,则此项应该是"-"。 "Referer"请求头。 "User-Agent"请求头。 用来提取信息的正则表达式组成: ^ :匹配每一行的开头。 ([0-9.]+)s :匹配IP地址。 ([w.-]+)s :匹配identity,由数字字母下划线或点分隔符组成。 ([w.-]+)s :匹配userid,由数字字母下划线或点分隔符组成。 ([[^[]]+])s :匹配时间。 "((?:[^"]|")+)"s :匹配请求信息,双引号中可能出现转义的双引号"。 (d{3})s :匹配状态码。 (d+|-)s :匹配响应字节数或-。 "((?:[^"]|")+)"s :匹配"Referer"请求头,双引号中可能出现转义的双引号"。 "((?:[^"]|")+)" :匹配"User-Agent"请求头,双引号中可能出现转义的双引号"。 $ :匹配行尾。 最终的表达式如下: ^([0-9.]+)s([w.-]+)s([w.-]+)s([[^[]]+])s"((?:[^"]|")+)"s(d{3})s(d+|-)s"((?:[^"]|")+)"s"((?:[^"]|")+)"$

以上是云栖社区小编为您精心准备的的内容,在云栖社区的博客、问答、公众号、人物、课程等栏目也有的相关内容,欢迎继续使用右上角搜索按钮进行搜索php , 日志 , 文件 , 正则 , apache 解析 ,以便于您获取更多的相关知识。