首页 / PYTHON / Python请求以utf-8编码的响应,但无法解码

Python请求以utf-8编码的响应,但无法解码

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python请求以utf-8编码的响应,但无法解码，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含6355字，纯文字阅读大概需要10分钟。

内容图文

我正在尝试使用python刮我的messenger.com(facebook messenger)聊天,我使用谷歌chromes开发人员工具查看聊天历史记录的POST请求,我已将整个标题和正文复制为请求可以使用的格式.

我得到HTTP代码200暗示请求至少得到了一些东西,但我可以打印res.encoding以获得它返回的编码,其中说的是utf-8.但我无法解码它！

这是功能：

def download_thread(self, limit, offset, message_timestamp):
    """Download the specified number of messages from the
    provided thread, with an optional offset
    """
    data = request_data(self.thread, offset=offset,
                        limit=limit, group=self.group,
                        timestamp=message_timestamp)

    res = self.ses.post(url_thread, data=data, headers=headers)

    print(res.content)

    thread_contents = json.loads(res.content)
    print(thread_contents)
    return thread_contents

产量

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 0: invalid start byte

当它试图json.load(或加载)数据

但res.encoding确实返回utf-8.

我尝试使用gzip解压缩但是说它不是gzip压缩的内容.

如果我只是尝试打印(res.content)我得到

Traceback (most recent call last):
  File "FBChatScraper.py", line 200, in <module>
    main()
  File "FBChatScraper.py", line 134, in main
    fbms.run()
0f\x82\x048\xbb\xb9=\x87\xebK0.\xff\x90\xdd\xeb\xfa\x16\xc6\xbbz\x8b\x82)\xe8\xaaV\x01^\xda\x8b\xbd\x15d-\xb1\x10@\x17\\\xd43\xa8\x92w\xe8\xc0\xcdU\xc4\xff\xc7\xfa\x90\xb2\xb3\xf5\x84\x11u\x0b\t\x8f\x83r\xf3}\xe5!y$\xe6\xf6c0\xf0\xb4\x98\xcat_\x0c\x08\xb5\xdd\x8ctx\x91\xa9\x95\rB%\xe2\x93\xa52\x85_\xa6\x10\xc2\xc9\xa3\xee4SDb\xa5\x18QJ\x83X\x19)\xaa$\xf4\xb4\xb7\x0b\x84\x15&\x88\x08L\xc9iP\xa2\xb9\xf2\xaf\x96\x96N\xd8\xcf=\x05\xc1\x18\x8d\xa0\xf2Y\x8e\n\xcf\xc8\x0fE4\xd6)\xa1\xd4\xb7D\xd6{i\xc8P\x96R\x11HC\xac\xbcKyT#~}\x93\xf7@K\xc7r/\x82\xb0\xe4\xefX\xf9j\x08\xa6Hp\xfcn\x06\xfdo\x9a\xd0wJ\xb4fJ(\x89+\x1c\xf6\x0eOI\x90\xac\x9eDD\xfd,\xa5\xe9\x89\x1blh\x86Z\x98\x05\xdd9\xc7\xf4\x80\xfcY\x8e\xad\xee\x99!\x15\x13+\x9b\x07\xe8Fdj\xfc\x11\xfc\xfe7\x06h\x02\x00@>]W\x92\xc9\x02\xb1c3\x82\xcd\xa4\xefN9\x90\xe6\x81y\x9c\x84er\xd4\xc3\x06\x1c\x06\x14\xcf\xc7\x07hj\xbfH\xdc\xf5~\xf7z\x18Ce\xaf^\x8c\xab \xdfV\xce\xb8\x11\xf8\x06\x03'

Traceback (most recent call last):
  File "FBChatScraper.py", line 200, in <module>
    main()
  File "FBChatScraper.py", line 134, in main
    fbms.run()
  File "FBChatScraper.py", line 43, in run
    thread_contents = self.download_thread(limit, offset, message_timestamp)
  File "FBChatScraper.py", line 74, in download_thread
    thread_contents = json.loads(res.content)
  File "/Users/silman/anaconda/lib/python3.6/json/__init__.py", line 349, in loads
    s = s.decode(detect_encoding(s), 'surrogatepass')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 0: invalid start byte

奇怪地在追溯中间打印内容让我觉得有一些看不见的字符将其推倒.

我无法将响应加载到json格式中,因为无论我如何处理响应内容,它都没有正确格式化以供json库解释.

此外,如果我只是打印(res.text)我得到垃圾：

Traceback (most recent call last):
  File "FBChatScraper.py", line 200, in <module>
    main()
  File "FBChatScraper.py", line 134, in main
    fbms.run()
}sP???c???f?u0???\? QZed?C??? M$x???H?????eǘ?]???5???^?*??aM?Y??b???/??JW/???>H6z?\??l4????t=i??%?u?x??%?x?
       F    <???{1i?#%;?r?=Rχm??1B?Z(+?(S-???#??\v?{b??
                                                           ?    f/V?i???_??83?  ?_????*??O??
                                                                                            ??????Z??i-?TVeaG54?!v?a??|gu-g??.???"J$?L`&?t?#s)?H????s???q???^?0??[)???j???T???U???J?ЁwW???!eg?#j ??r??$y???3?4??4.??M?@Kb?AX?SDb?QJ?X)?,???a?   "Sp?h?????sOA0Vé|???????:%?rKdKC???@ M??.?^
?       ?g???SWQH?.??B?G?,????@E????????
                                        nras??L?/??ch@>]W???c3???N9??y??er????hj?H??~?zCe?^?? ?Vθ?

Traceback (most recent call last):
  File "FBChatScraper.py", line 200, in <module>
    main()
  File "FBChatScraper.py", line 134, in main
    fbms.run()
  File "FBChatScraper.py", line 43, in run
    thread_contents = self.download_thread(limit, offset, message_timestamp)
  File "FBChatScraper.py", line 74, in download_thread
    thread_contents = json.loads(res.content)
  File "/Users/silman/anaconda/lib/python3.6/json/__init__.py", line 349, in loads
    s = s.decode(detect_encoding(s), 'surrogatepass')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 0: invalid start byte

编辑：

MWE尽我所能,不确定我的帖子请求中的哪些数据是私有的,所以我留下了一些

使用这些数据

url_thread = "https://www.messenger.com/api/graphqlbatch/"


request_data = {
  "batch_name": "MessengerGraphQLThreadFetcher",
  "__user": "<user_id>",
  "__a": "1",
  "__dyn": "<dyn>",
  "__req": "9",
  '__be'      : '-1',
  '__pc'      : 'PHASED:messengerdotcom_pkg',
  "fb_dtsg": "AQFni7TU2nes:AQGSC8FSDqyw",
  "ttstamp": "265817254666710077746711957586581715370521181008510710777",
  "__rev": "3791607",
  "jazoest": "<jazoest>",
  "queries": '<queries>'
  }

headers = {
  "authority": "www.messenger.com",
  "method": "POST",
  "path": "/api/graphqlbatch/",
  "scheme": "https",
  "accept": "*/*",
  "accept-encoding": "gzip, deflate, br",
  "accept-language": "en-US,en;q=0.9",
  "cache-control": "no-cache",
  "content-length": "754",
  "content-type" : "application/x-www-form-urlencoded",
  "cookie": "<cookies>",
  "origin": "https://www.messenger.com",
  "pragma": "no-cache",
  "referer": "https://www.messenger.com/t/<chatID>",
  "user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36"
}

您可以获取所有< item>通过使用chrome开发人员工具并在网络选项卡上查找请求URL的POST请求：https：//www.messenger.com/api/graphqlbatch/.

如果您在Chrome开发工具录制时向上滚动以重新加载旧邮件,则很容易找到.

然后用python汇总一个简单的请求

import requests as rq
import time

ses = rq.Session()
thread = <ID of thread found in URL of messenger.com>

conversation_type = <'thread_fbids' if group chat else 'user_ids'>

data = request_data
data['messages[{}][{}][offset]'.format(conversation_type, thread)] = 0
data['messages[{}][{}][timestamp]'.format(conversation_type, thread)] = int(time.time())
data['messages[{}][{}][limit]'.format(conversation_type, thread)] = 2000

res = ses.post(url_thread, data=data, headers=headers)

print(res.content)
thread_contents = json.loads(res.content)
print(thread_contents)

正如我的开发工具所取回的那样,你可以看到json here的开始

解决方法:

问题是请求标头中的这一行：

"accept-encoding": "gzip, deflate, br",

那个br要求Brotli compression,一个新的压缩标准(见RFC 7932)谷歌正在推动取代网络上的gzip. Chrome正在要求Brotli,因为最新版本的Chrome本身就能理解它.您要求Brotli,因为您从Chrome复制了标题.但请求本身并不了解Brotli.

您可以pip install brotli并注册解压缩程序或只在res.content上手动调用它.但更简单的解决方案是删除br：

"accept-encoding": "gzip, deflate",

…然后你应该得到gzip,你和请求已经知道如何处理.

内容总结

以上是互联网集市为您收集整理的Python请求以utf-8编码的响应,但无法解码全部内容，希望文章能够帮你解决Python请求以utf-8编码的响应,但无法解码所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/788825.html

来源：【匿名】

【上一篇】python – 来自两个不同数据帧的平均值【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【Python请求以utf-8编码的响应,但无法解码】教程文章相关的互联网学习教程文章

python输出excel能够识别的utf-8格式csv文件【图】

http://blog.csdn.net/azhao_dn/article/details/16989777 可能大家都遇到过，python在输出的csv文件中如果有utf-8格式的中文，那么在使用excel打开该csv文件时，excel将不能够有效识别出文件中的中文数据，严重时甚至不能够识别出分隔符。那么，要怎样操作才能够让excel识别出utf-8格式的中文呢？方法其实很简单，见以下代码：[python] view plaincopyimport codecs with open(‘ExcelUtf8.csv‘, ‘w‘) as f: t ...

Python load json file with UTF-8 BOM header - Stack Overflow【代码】

Python load json file with UTF-8 BOM header - Stack Overflow12down voteacceptedYou can open with codecs:import json import codecsjson.load(codecs.open(‘sample.json‘,‘r‘,‘utf-8-sig‘))or decode with utf-8-sig yourself and pass to loads:json.loads(open(‘sample.json‘).read().decode(‘utf-8-sig‘))原文：http://www.cnblogs.com/lexus/p/3731344.html

Python的ASCII, GB2312, Unicode , UTF-8 相互转换【代码】

ASCII 是一种字符集,包括大小写的英文字母、数字、控制字符等，它用一个字节表示，范围是 0-127 Unicode分为UTF-8和UTF-16。UTF-8变长度的，最多 6 个字节，小于 127 的字符用一个字节表示，与 ASCII 字符集的结果一样，ASCII 编码下的英语文本不需要修改就可以当作 UTF-8 编码进行处理。 Python 从 2.2 开始支持 Unicode ，函数 decode( char_set )可以实现其它编码到 Unicode 的转换，函数 encode( char_set )实现 Unicode 到其...

Python3读取UTF-8文件及统计文件行数的方法【代码】

本文实例讲述了Python3读取UTF-8文件及统计文件行数的方法。分享给大家供大家参考。具体实现方法如下： ‘‘‘‘‘ Created on Dec 21, 2012 Python 读取UTF-8文件统计文件的行数目 @author: liury_lab ‘‘‘ # -*- coding: utf-8 -*- import codecs # 对较小的文件，最简单的方法是将文件读入一个行列表中， # 然后计算列表的长度即可 count = len(codecs.open(‘d:/FreakOut.cpp‘, ‘rU‘, ‘utf-8‘).readlines()) ...

python版去UTF-8 BOM【代码】

今天给app弄银联支付接口。直接copy银联的sdk。结果。安卓和ios始终报json格式错误。找了半天。都没找到问题。最后怀疑可能是BOM破坏了json的数据格式转换。验证后确认是BOM的问题。为方便以后遇见BOM的问题的快速解决。写了个python版本的去除BOM小脚本。。 1#!/usr/bin/env python 2#coding=utf-8 3 4""" 5清除指定目录下面文件的BOM 6 不包含子目录7 8用法 ./clearBOM.py 文件目录910"""1112import sys; 13import os; 1415def...

python解决js文件utf-8编码乱码问题

这篇文章主要介绍了python解决js文件utf-8编码乱码问题,非常不错，具有参考借鉴价值，需要的朋友可以参考下html文件中引入js文件，显示乱码！js文件为utf-8 编码(无bom) ，此时只要将js文件转成utf-8 BOM编码就可以解决了可以使用notepad++转码也可以使用下面的python代码批量转码# -*- coding:utf-8 -*- import os,sys import chardet def convert( filename, in_enc = "GBK", out_enc="UTF-8" ): try: print("convert " + fi...

详解Python中Unicode和utf-8

在Python语言中，Uincode字符串处理一直是一个容易让人迷惑的问题。许多Python爱好者经常因为搞不清Unicode、UTF-8还有其它许许多多的编码之间的区别而大伤脑筋。本文将介绍Unicode和Python的中文处理的相关知识。下面跟着小编一起来看下吧在Python语言中，Uincode字符串处理一直是一个容易让人迷惑的问题。许多Python爱好者经常因为搞不清Unicode、UTF-8还有其它许许多多的编码之间的区别而大伤脑筋。笔者曾经也是这“伤脑筋一族”...

Python3读取UTF-8文件及统计文件行数的方法

本文实例讲述了Python3读取UTF-8文件及统计文件行数的方法。分享给大家供大家参考。具体实现方法如下： Created on Dec 21, 2012 Python 读取UTF-8文件统计文件的行数目 @author: liury_lab # -*- coding: utf-8 -*- import codecs # 对较小的文件，最简单的方法是将文件读入一个行列表中， # 然后计算列表的长度即可 count = len(codecs.open(d:/FreakOut.cpp, rU, utf-8).readlines()) print(count) # 对较大的文件，...

Python实现把utf-8格式的文件转换成gbk格式的文件

需求：将utf-8格式的文件转换成gbk格式的文件实现代码如下：代码如下: def ReadFile(filePath,encoding="utf-8"):with codecs.open(filePath,"r",encoding) as f:return f.read() def WriteFile(filePath,u,encoding="gbk"):with codecs.open(filePath,"w",encoding) as f:f.write(u) def UTF8_2_GBK(src,dst):content = ReadFile(src,encoding="utf-8")WriteFile(dst,content,encoding="gbk")代码讲解：函数ReadFile的第二个参数...

python实现JAVA源代码从ANSI到UTF-8的批量转换方法

本文实例讲述了python实现JAVA源代码从ANSI到UTF-8的批量转换方法。分享给大家供大家参考。具体如下：喜欢用eclipse的大神们，可能一不小心代码就变成ANSI码了，需要转换成utf-8嘛，一个文件一个文件的在Notepad2或者notepad++里面转换么？不，这里有批量转换的程序，python实现，需要的拿去用吧。 ansi2utf8.py：#-*- coding: utf-8 -*- import codecs import os import shutil import re import chardet def convert_encoding(f...

Python新建项目自动添加介绍和utf-8编码仙桃【代码】

仙桃代孕公司電薇同号（131-62292-573）22万起招代妈本文我们来看一下如何使用 Python + Appium 实现定时自动化收取蚂蚁森林能量。2. 环境本文主要环境如下：Win7小米5sPython3.7Appium1.5支付宝10.2.6.7010如果对环境搭建不熟悉的话，可以看一下：Python + Appium 自动化操作微信入门和我用 Python 找出了删除我微信的所有人并将他们自动化删除了。3. 实现功能实现的...

python utf-8 转码问题

print str(\345\207\235\346\266\265\346\237\217).decode(string_escape)凝涵柏但该语句在python3中无法运行 File "script.py", line 3print str(\345\207\235\346\266\265\346\237\217).decode(string_escape)^SyntaxError: invalid syntax Exited with error status 1 解决办法： print (str(\345\207\235\346\266\265\346\237\217).encode(latin1).decode(unicode-escape).encode(latin1).decode(utf-8)) 凝涵柏

#!/usr/bin/env python3和# -- coding: utf-8 --【代码】

#!/usr/bin python3 #!/usr/bin/env python3 # -*- coding: utf-8 -*- #!/usr/bin/env python3表示 python3 解释器所处的绝对路径就是 /usr/bin/python3，这样可以避免python2来解释python 3的代码（python2与python3有差异），但 /usr/bin/python3指定的是绝对路径如果碰到 python 解释器不在该路径下的话, 脚本就无法执行了。因此建议用环境变量的路径#!/usr/bin/env python3，这样会去"PATH 环境变量"中查找 python3...

Python把txt转为csv 可能出现的乱码问题，如果txt是以utf-8保存的，在转换成csv时，打开乱码问题【代码】

with open(直播源.csv, w, newline=,encoding=utf-8-sig)需要增加 encoding=utf-8-sig ，防止打开csv时中文乱码的情况。 UTF-8以字节为编码单元，它的字节顺序在所有系统中都是一様的，没有字节序的问题，也因此它实际上并不需要BOM(“ByteOrder Mark”)。但是UTF-8 with BOM即utf-8-sig需要提供BOM。简单的说，utf-8-sig是对字节编码有序的。

python UnicodeDecodeError utf-8 codec cant decode byte 0xcc in position 0: invalid continuation【代码】【图】

错误代码提示： hostname, aliases, ipaddrs = gethostbyaddr(name) UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcc in position 0: invalid continuation byte这个在网上大部分解法是修改主机名，主机名的修改方法就是去控制面板->用户账户->更改账户名称，如果没有更改账户名称，八成你的账户是直接用Microsoft账户登陆的，需要去开始，右键你的头像，选择更改账户设置，把账户设置为本地账户，然后再修改账户名然而...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / Python请求以utf-8编码的响应,但无法解码

Python请求以utf-8编码的响应,但无法解码

内容导读

内容图文

内容总结

内容备注

内容手机端

【Python请求以utf-8编码的响应,但无法解码】教程文章相关的互联网学习教程文章

python输出excel能够识别的utf-8格式csv文件【图】

Python load json file with UTF-8 BOM header - Stack Overflow【代码】

Python的ASCII, GB2312, Unicode , UTF-8 相互转换【代码】

Python3读取UTF-8文件及统计文件行数的方法【代码】

python版去UTF-8 BOM【代码】

python解决js文件utf-8编码乱码问题

详解Python中Unicode和utf-8

Python3读取UTF-8文件及统计文件行数的方法

Python实现把utf-8格式的文件转换成gbk格式的文件

python实现JAVA源代码从ANSI到UTF-8的批量转换方法

Python新建项目自动添加介绍和utf-8编码仙桃【代码】

python utf-8 转码问题

#!/usr/bin/env python3和# -- coding: utf-8 --【代码】

Python把txt转为csv 可能出现的乱码问题，如果txt是以utf-8保存的，在转换成csv时，打开乱码问题【代码】

python UnicodeDecodeError utf-8 codec cant decode byte 0xcc in position 0: invalid continuation【代码】【图】

PYTHON - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程