首页 / PYTHON / python – 解析原始HTTP标头

python – 解析原始HTTP标头

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – 解析原始HTTP标头，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3142字，纯文字阅读大概需要5分钟。

内容图文

我有一串原始HTTP,我想表示对象中的字段.有没有办法解析HTTP字符串中的各个标头？

'GET /search?sourceid=chrome&ie=UTF-8&q=ergterst HTTP/1.1\r\nHost: www.google.com\r\nConnection: keep-alive\r\nAccept: application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5\r\nUser-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_6; en-US) AppleWebKit/534.13 (KHTML, like Gecko) Chrome/9.0.597.45 Safari/534.13\r\nAccept-Encoding: gzip,deflate,sdch\r\nAvail-Dictionary: GeNLY2f-\r\nAccept-Language: en-US,en;q=0.8\r\n
[...]'

解决方法:

标准库中有很好的工具可用于解析RFC 821标头,也可用于解析整个HTTP请求.下面是一个示例请求字符串(请注意,Python将其视为一个大字符串,即使我们将其分为几行以便于阅读),我们可以将其提供给我的示例：

request_text = (
    'GET /who/ken/trust.html HTTP/1.1\r\n'
    'Host: cm.bell-labs.com\r\n'
    'Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.3\r\n'
    'Accept: text/html;q=0.9,text/plain\r\n'
    '\r\n'
    )

正如@TryPyPy指出的那样,你可以使用mimetools.Message来解析标题 – 尽管我们应该添加一下,一旦你完成创建它,生成的Message对象就像一个标题字典：

# Ignore the request line and parse only the headers

from mimetools import Message
from StringIO import StringIO
request_line, headers_alone = request_text.split('\r\n', 1)
headers = Message(StringIO(headers_alone))

print len(headers)     # -> "3"
print headers.keys()   # -> ['accept-charset', 'host', 'accept']
print headers['Host']  # -> "cm.bell-labs.com"

但是,当然,这会忽略请求行,或者让您自己解析它.事实证明,有一个更好的解决方案.

如果您使用BaseHTTPRequestHandler,标准库将为您解析HTTP.虽然它的文档有点模糊 – 标准库中的整套HTTP和URL工具存在问题 – 要使其解析字符串所需要做的就是(a)将字符串包装在StringIO()中,(b) )读取raw_requestline以便它可以被解析,并且(c)捕获在解析期间发生的任何错误代码,而不是让它尝试将它们写回客户端(因为我们没有！).

所以这是我们对标准库类的专业化：

from BaseHTTPServer import BaseHTTPRequestHandler
from StringIO import StringIO

class HTTPRequest(BaseHTTPRequestHandler):
    def __init__(self, request_text):
        self.rfile = StringIO(request_text)
        self.raw_requestline = self.rfile.readline()
        self.error_code = self.error_message = None
        self.parse_request()

    def send_error(self, code, message):
        self.error_code = code
        self.error_message = message

同样,我希望标准库人员已经意识到HTTP解析应该以不需要我们编写九行代码来正确调用它的方式进行分解,但是你能做什么呢？以下是如何使用这个简单的类：

# Using this new class is really easy!

request = HTTPRequest(request_text)

print request.error_code       # None  (check this first)
print request.command          # "GET"
print request.path             # "/who/ken/trust.html"
print request.request_version  # "HTTP/1.1"
print len(request.headers)     # 3
print request.headers.keys()   # ['accept-charset', 'host', 'accept']
print request.headers['host']  # "cm.bell-labs.com"

如果解析期间出错,则error_code将不为None：

# Parsing can result in an error code and message

request = HTTPRequest('GET\r\nHeader: Value\r\n\r\n')

print request.error_code     # 400
print request.error_message  # "Bad request syntax ('GET')"

我更喜欢使用这样的标准库,因为我怀疑他们已经遇到并解决了任何可能会让我感到困惑的边缘情况,如果我尝试使用正则表达式重新实现Internet规范.

内容总结

以上是互联网集市为您收集整理的python – 解析原始HTTP标头全部内容，希望文章能够帮你解决python – 解析原始HTTP标头所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/713540.html

来源：【匿名】

【上一篇】在Python / Django中从City获取时区【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python – 解析原始HTTP标头】教程文章相关的互联网学习教程文章

[Python]HTML/XML解析器Beautiful Soup

【简介】Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库。即HTML/XMLX的解析器。它可以很好的处理不规范标记并生成剖析树(parse tree)。它提供简单又常用的导航（navigating），搜索以及修改剖析树的操作。它可以大大节省你的编程时间。【安装】下载地址：点击打开链接Linux平台安装：如果你用的是新版的Debain或ubuntu,那么可以通过系统的软件包管理来安装:$ apt-get install Python-bs4Beautiful Soup 4 通过P...

十七、python沉淀之路--三元表达式、列表解析【代码】

一、三元表达式1 a = ‘骑车‘23 res = ‘好天气‘if a == ‘骑车‘else‘睡觉‘4print(res)1 睡觉解析：res = ‘好天气‘ if a == ‘骑车‘ else ‘睡觉‘ ，将一个句子分了三部分。简单的逻辑运算可用这种三元表达式二、列表解析 1 gift_list = []2for i in range(10):3 gift_list.append(‘礼盒%s‘%i)4print(gift_list)5 6 gift_list1 = [‘礼盒%s‘%i for i in range(10)]7print(gift_list1)8 9 gift_...

python之列表解析与生成器【代码】

防伪码：忘情公子著什么是列表解析？列表解析就是根据已有列表，高效生成新列表的方式列表解析是python迭代机制的一种应用，它常用于实现创建新的列表，因此要放置于[]中语法：[expression for iter_var in iterable][expression for iter_var in iterable if cond_expr]例：In [1]: L = [i**2 for i in xrange(9)]In [2]: print L[0, 1, 4, 9, 16, 25, 36, 49, 64]假设现在有一个列表list1，需要取得列表list1中每一个元素的平方...

Python爬虫_三种数据解析方式【代码】

正则解析单字符：. : 除换行以外所有字符[] ：[aoe] [a-w] 匹配集合中任意一个字符\d ：数字 [0-9]\D : 非数字\w ：数字、字母、下划线、中文\W : 非\w\s ：所有的空白字符包,括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。\S : 非空白数量修饰：* : 任意多次 >=0+ : 至少1次 >=1? : 可有可无 0次或者1次{m} ：固定m次 hello{3,}{m,} ：至少m次{m,n} ：m-n次边界：$ : 以某某结尾 ^ : 以某某开头分组：(ab) 贪婪模式：...

python解析json文件【代码】

cat t.jo{ "name":"test", "type":"kkk", "ppp":{"parate":[1,2]} }或者加个数组t2.jo： [ {"name":"test","type":"kkk","ppp":{"parate":[1,2]}}, {"name":"ppp"} ]2.解析t.joimport json In [61]: s=json.loads(‘{"name":"kkk","type":"ppp"}‘) In [62]: s[‘name‘] Out[62]: u‘kkk‘ -------------t.jo f=file(‘t.jo‘) s=json.load(file(f)) 或者 s=json.load(file("t.jo")) print s[‘name‘] print s[ppp][‘para...

python"TypeError: 'NoneType' object is not iterable"错误解析【代码】

尊重原创博主，原文链接：https://blog.csdn.net/dataspark/article/details/9953225【解析】一般是函数返回值为None，并被赋给了多个变量。实例看下：c=0def test():if c == 1:a = b = 1return a, ba, b = test() 使用 a, b = test()调用时，就会报错：TypeError: ‘NoneType‘ object is not iterable在Python判断语句中，当if条件不满足并且没有else的时候就会返回None，就算是没有return 也会默认返回None本例中a，b 都赋予...

Python开发爬虫之BeautifulSoup解析网页篇：爬取安居客网站上北京二手房数据【代码】

目标：爬取安居客网站上前10页北京二手房的数据，包括二手房源的名称、价格、几室几厅、大小、建造年份、联系人、地址、标签等。网址为：https://beijing.anjuke.com/sale/BeautifulSoup官网：https://www.crummy.com/software/BeautifulSoup/直接上代码：import requests from bs4 import BeautifulSoupheaders={‘user-agent‘:‘Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0....

python 全栈 linux基础（部分）网络 SSH 更名 DNS解析元字符

nginx---> web ifconfig 查看网络配置信息id add show 查看当前网卡信息（最小安装下）mtu 是指网卡传输的最大单元单位：字节网卡配置临时配置ifconfig 网卡名 IP地址/子网DNS：vim /etc/resolv.conf网关：(填加)route add default gw 网关 netmask 255.255.255.0（删除）route del default gw 网关 netmask 255.255.255.0查看配置：route -n重启网卡：systemctl restart network永久配置cd /etc/sysconfig/network-scripts/vim...

python3实现二叉树的遍历与递归算法解析【代码】【图】

1、二叉树的三种遍历方式二叉树有三种遍历方式：先序遍历，中序遍历，后续遍历即：先中后指的是访问根节点的顺序 eg:先序根左右中序左根右后序左右根　　遍历总体思路：将树分成最小的子树，然后按照顺序输出　　1.1 先序遍历　　　　a 先访问根节点　　　　b 访问左节点　　　　c 访问右节点　　　　a（b ( d ( h ) )( e ( i ) )）( c ( f )( g )) -- abdheicfg 　　1.2 中序遍历　...

[Python]网络爬虫（九）：百度贴吧的网络爬虫（v0.4）源码及解析【代码】【图】

转自：http://blog.csdn.net/pleasecallmewhy/article/details/8934726百度贴吧的爬虫制作和糗百的爬虫制作原理基本相同，都是通过查看源码扣出关键数据，然后将其存储到本地txt文件。项目内容：用Python写的百度贴吧的网络爬虫。使用方法：新建一个BugBaidu.py文件，然后将代码复制到里面后，双击运行。程序功能：将贴吧中楼主发布的内容打包txt存储到本地。原理解释：首先，先浏览一下某一条贴吧，点击只看楼主并点击第二页之后u...

python 简易购物车程序解析【代码】

购物车程序需求：用户信息为：{‘wyf‘:{‘password‘: ‘12‘, ‘role‘: ‘2‘, ‘money‘: ‘100000‘, ‘carts‘: [‘iphone6‘, ‘mi5‘]},‘fei‘: {‘password‘: ‘12‘, ‘role‘: ‘2‘, ‘money‘: ‘100000‘, ‘carts‘: [‘iphone6‘, ‘mi5‘]}}用户角色role：1代表管理员，2，代表普通用户普通用户的权限有：1.查看所有商品；2.输入商品名称购买商品，购买后加入到购物车里面，钱要减去.购买后的商品追加到购物车里...

python解析xml并按照其结构输出【图】

平时写代码需要将一个xml文件按照其结构，将每个节点列出来，如:<root><person age="18"><name>hzj</name><sex>man</sex></person><person age="19" des="hello"><name>kiki</name><sex>female</sex></person> </root>就需要这样表示:{"root"};{"root","person"};{"root","person","name"};{"root","person","sex"}.....将所有节点这样写出来,为了图简单，直接写了一个脚本解析了下.python有三种方法解析XML，SAX，DOM，以及Elemen...

使用由 Python 编写的 lxml 实现高性能 XML 解析

lxml 简介Python 从来不出现 XML 库短缺的情况。从 2.0 版本开始，它就附带了 xml.dom.minidom 和相关的 pulldom 以及 Simple API for XML (SAX) 模块。从 2.4 开始，它附带了流行的 ElementTree API。此外，很多第三方库可以提供更高级别的或更具有 python 风格的接口。尽管任何 XML 库都足够处理简单的 Document Object Model (DOM) 或小型文件的 SAX 解析，但开发人员越来越多碰到更加大型的数据集，以及在 Web 服务上下文中实时...

python实现的解析crontab配置文件代码【代码】

#/usr/bin/env python #-*- coding:utf-8 -*-""" 1.解析 crontab 配置文件中的五个数间参数(分时日月周)，获取他们对应的取值范围 2.将时间戳与crontab配置中一行时间参数对比，判断该时间戳是否在配置设定的时间范围内 """#$Id $import re, time, sys from Core.FDateTime.FDateTime import FDateTimedef get_struct_time(time_stamp_int):"""按整型时间戳获取格式化时间分时日月周Args:time_stamp_int 为传入的值为时间...

全面解析Python的While循环语句的使用方法【代码】

Python 编程中 while 语句用于循环执行程序，即在某条件下，循环执行某段程序，以处理需要重复处理的相同任务。其基本形式为： while 判断条件：执行语句…… 执行语句可以是单个语句或语句块。判断条件可以是任何表达式，任何非零、或非空（null）的值均为true。当判断条件假false时，循环结束。执行流程图如下：实例： #!/usr/bin/pythoncount = 0 while (count < 9):print ‘The count is:‘, countcount = count + 1print "...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python – 解析原始HTTP标头

python – 解析原始HTTP标头

内容导读

内容图文

内容总结

内容备注

内容手机端

【python – 解析原始HTTP标头】教程文章相关的互联网学习教程文章

[Python]HTML/XML解析器Beautiful Soup

十七、python沉淀之路--三元表达式、列表解析【代码】

python之列表解析与生成器【代码】

Python爬虫_三种数据解析方式【代码】

python解析json文件【代码】

python"TypeError: 'NoneType' object is not iterable"错误解析【代码】

Python开发爬虫之BeautifulSoup解析网页篇：爬取安居客网站上北京二手房数据【代码】

python 全栈 linux基础（部分）网络 SSH 更名 DNS解析元字符

python3实现二叉树的遍历与递归算法解析【代码】【图】

[Python]网络爬虫（九）：百度贴吧的网络爬虫（v0.4）源码及解析【代码】【图】

python 简易购物车程序解析【代码】

python解析xml并按照其结构输出【图】

使用由 Python 编写的 lxml 实现高性能 XML 解析

python实现的解析crontab配置文件代码【代码】

全面解析Python的While循环语句的使用方法【代码】

PYTHON - 相关标签

HTTP - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程