如何将单个apache日志条目解析为python对象
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了如何将单个apache日志条目解析为python对象,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1562字,纯文字阅读大概需要3分钟。
内容图文
![如何将单个apache日志条目解析为python对象](/upload/InfoBanner/zyjiaocheng/732/6ab7260f15604741a949940bccf09953.jpg)
我坐在我的第一个python脚本上试图将apache日志解析为可访问的对象而我无法使其工作.
我正在尝试使用this示例(运行Python 2.7)并且只想使用单个日志条目.
这是我有的:
import re
from collections import namedtuple
format_pat= re.compile(
r"(?P<host>[\d\.]+)\s"
r"(?P<identity>\S*)\s"
r"(?P<user>\S*)\s"
r"\[(?P<time>.*?)\]\s"
r'"(?P<request>.*?)"\s'
r"(?P<status>\d+)\s"
r"(?P<bytes>\S*)\s"
r'"(?P<referer>.*?)"\s'
r'"(?P<user_agent>.*?)"\s*'
)
Access = namedtuple('Access',
['host', 'identity', 'user', 'time', 'request',
'status', 'bytes', 'referer', 'user_agent'] )
# my entry
log = '2001:470:1f14:169:15f3:824f:8a61:7b59 - ABC-15414 [14/Nov/2012:09:32:31 +0100] "POST /setConnectionXml HTTP/1.1" 200 4 "-" "-" 102356'
match= format_pat.match(log)
print match
if match:
Access( **match.groupdict() )
print Access
我不确定我做错了什么,但匹配返回none,而不是我希望的对象.
有人能给我一个暗示吗?
解决方法:
您的主机条目仅匹配数字和点(IPv4地址),但您发布的日志条目示例是IPv6地址.调整您的模式以允许该格式(所以要么匹配数字和点,要么匹配十六进制字符和冒号:
format_pat= re.compile(
r"(?P<host>(?:[\d\.]|[\da-fA-F:])+)\s"
r"(?P<identity>\S*)\s"
r"(?P<user>\S*)\s"
r"\[(?P<time>.*?)\]\s"
r'"(?P<request>.*?)"\s'
r"(?P<status>\d+)\s"
r"(?P<bytes>\S*)\s"
r'"(?P<referer>.*?)"\s'
r'"(?P<user_agent>.*?)"\s*'
)
通过该调整,您的示例匹配:
>>> format_pat.match(log).groupdict()
{'status': '200', 'bytes': '4', 'request': 'POST /setConnectionXml HTTP/1.1', 'host': '2001:470:1f14:169:15f3:824f:8a61:7b59', 'referer': '-', 'user': 'ABC-15414', 'time': '14/Nov/2012:09:32:31 +0100', 'identity': '-', 'user_agent': '-'}
内容总结
以上是互联网集市为您收集整理的如何将单个apache日志条目解析为python对象全部内容,希望文章能够帮你解决如何将单个apache日志条目解析为python对象所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。