使用Python处理Nginx日志

Nginx日志中包含每个HTTP请求的客户端地址、时间、请求方法和页面、返回状态码、返回数据大小,UserAgent这些信息,本文的目的是在Python中使用正则表达式对这些信息进行格式化处理。

示例代码如下:

import re

def extract_nginx_log(log):

    regex = re.compile(
        '''(?P<remote_addr>[\d\.]{7,})\
 - - (?:\[(?P<datetime>[^\[\]]+)\])\
 "(?P<request>[^"]+)" (?P<status>\d+)\
 (?P<size>\d+) "(?:[^"]+)"\
 "(?P<user_agent>[^"]+)"''')

    return regex.match(log).groupdict()

with open('access.log','r') as fp:
    for line in fp.readlines():
        print(extract_nginx_log(line)['remote_addr'])

这段代码将打印Nginx日志文件里的所有访问IP地址;

extract_nginx_log() 函数用于处理单条日志,返回一个字典:

{
    'remote_addr'   :'', #访问者地址
    'datetime'      :'', #访问时间
    'request'       :'', #请求方法和页面
    'status'        :'', #返回状态码
    'size'          :'', #返回数据大小
    'user_agent'    :''  #UserAgent
}

原创内容,如需转载,请注明出处;

本文地址: https://www.perfcode.com/p/use-python-to-process-nginx-log.html

分类: 计算机技术
推荐阅读:
Rust is_x86_feature_detected宏的用法和示例 在Rust中,is_x86_feature_detected宏用于在运行时检查CPU是否支持特定的指令集;例如,你可以用它来检查CPU是否支持SSE、AVX等指令集;
pm.max_children的作用 "pm.max_children" 是一个 PHP-FPM 配置选项,用于指定每个 PHP-FPM 进程池中最大的子进程数。它控制着 PHP-FPM 进程池的大小和性能表现。
如何在MATLAB中画函数的图像 要使用MATLAB绘制函数图形,请按照以下步骤进行操作:
PySide6修改字体颜色 在 PySide6中,我们可以通过修改控件的样式表来修改字体颜色。
Rust中的 if 表达式 if表达式允许根据条件的不同而执行不同的代码分支,如果条件满足,则运行某段代码,如果条件不满足则不运行这段代码;
查询SSL证书的有效期 在本文中,你将了解如何查询网站SSL证书的有效期;首先,通过浏览器打开要查询的网站,以查询本站SSL证书是否过期为例...