首页 / PYTHON / Python3 utf-8解码问题

Python3 utf-8解码问题

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python3 utf-8解码问题，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1620字，纯文字阅读大概需要3分钟。

内容图文

以下代码在我的Windows机器上使用Python3运行正常并打印字符’é’：

data = b"\xc3\xa9"

print(data.decode('utf-8'))

但是,在基于Ubuntu的docker容器上运行相同会导致：

UnicodeEncodeError: 'ascii' codec can't encode character '\xe9' in position 0: ordinal not in range(128)

有什么必须安装才能启用utf-8解码吗？

解决方法:

问题在于print()表达式,而不是decode()方法.
如果仔细观察,引发的异常是UnicodeEncodeError,而不是-DecodeError.

每当你使用print()函数时,Python都会将其参数转换为str,然后将结果编码为字节,这些字节将被发送到终端(或运行的任何Python).
用于编码的编解码器(例如UTF-8或ASCII)取决于环境.
在一个理想的情况下,

> Python使用的编解码器与终端所期望的编解码器兼容,因此字符显示正确(否则你会得到像“é”而不是“é”的mojibake);
>使用的编解码器涵盖了足以满足您需求的一系列字符(例如UTF-8或UTF-16,它们包含所有字符).

在您的情况下,您提到的Linux docker不符合第二个条件：使用的编码是ASCII,它只支持旧英文打字机上的字符.
这些是解决此问题的几个选项：

>设置环境变量：在Linux上,Python的编码默认值取决于此(至少部分).根据我的经验,这是一个试验和错误;将LC_ALL设置为包含“UTF-8”的东西曾经为我工作过一次.您必须将它们放在终端运行的shell的启动脚本中,例如. .bashrc中.
>重新编码STDOUT,如下所示：

sys.stdout = open(sys.stdout.buffer.fileno(), 'w', encoding='utf8')

使用的编码必须匹配终端之一.
>自己编码字符串并将它们发送到sys.stdout底层的二进制缓冲区,例如. sys.stdout.buffer.write( “E” .encode( ‘UTF8’)).这当然是比印刷品(“é”)更多的样板.同样,使用的编码必须匹配终端之一.
>完全避免打印().使用open(fn,encoding = …)作为输出,进度信息的日志记录模块 – 取决于脚本的交互方式,这可能是值得的(诚然,在写入STDERR时可能会遇到相同的编码问题)记录模块).

可能还有其他选择,但我怀疑有更好的选择.

内容总结

以上是互联网集市为您收集整理的Python3 utf-8解码问题全部内容，希望文章能够帮你解决Python3 utf-8解码问题所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/727637.html

来源：【匿名】

【上一篇】python – 禁止从/ dev / tty读取【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【Python3 utf-8解码问题】教程文章相关的互联网学习教程文章

Python3读取UTF-8文件及统计文件行数的方法【代码】

本文实例讲述了Python3读取UTF-8文件及统计文件行数的方法。分享给大家供大家参考。具体实现方法如下： ‘‘‘‘‘ Created on Dec 21, 2012 Python 读取UTF-8文件统计文件的行数目 @author: liury_lab ‘‘‘ # -*- coding: utf-8 -*- import codecs # 对较小的文件，最简单的方法是将文件读入一个行列表中， # 然后计算列表的长度即可 count = len(codecs.open(‘d:/FreakOut.cpp‘, ‘rU‘, ‘utf-8‘).readlines()) ...

python版去UTF-8 BOM【代码】

今天给app弄银联支付接口。直接copy银联的sdk。结果。安卓和ios始终报json格式错误。找了半天。都没找到问题。最后怀疑可能是BOM破坏了json的数据格式转换。验证后确认是BOM的问题。为方便以后遇见BOM的问题的快速解决。写了个python版本的去除BOM小脚本。。 1#!/usr/bin/env python 2#coding=utf-8 3 4""" 5清除指定目录下面文件的BOM 6 不包含子目录7 8用法 ./clearBOM.py 文件目录910"""1112import sys; 13import os; 1415def...

python解决js文件utf-8编码乱码问题

这篇文章主要介绍了python解决js文件utf-8编码乱码问题,非常不错，具有参考借鉴价值，需要的朋友可以参考下html文件中引入js文件，显示乱码！js文件为utf-8 编码(无bom) ，此时只要将js文件转成utf-8 BOM编码就可以解决了可以使用notepad++转码也可以使用下面的python代码批量转码# -*- coding:utf-8 -*- import os,sys import chardet def convert( filename, in_enc = "GBK", out_enc="UTF-8" ): try: print("convert " + fi...

详解Python中Unicode和utf-8

在Python语言中，Uincode字符串处理一直是一个容易让人迷惑的问题。许多Python爱好者经常因为搞不清Unicode、UTF-8还有其它许许多多的编码之间的区别而大伤脑筋。本文将介绍Unicode和Python的中文处理的相关知识。下面跟着小编一起来看下吧在Python语言中，Uincode字符串处理一直是一个容易让人迷惑的问题。许多Python爱好者经常因为搞不清Unicode、UTF-8还有其它许许多多的编码之间的区别而大伤脑筋。笔者曾经也是这“伤脑筋一族”...

Python3读取UTF-8文件及统计文件行数的方法

本文实例讲述了Python3读取UTF-8文件及统计文件行数的方法。分享给大家供大家参考。具体实现方法如下： Created on Dec 21, 2012 Python 读取UTF-8文件统计文件的行数目 @author: liury_lab # -*- coding: utf-8 -*- import codecs # 对较小的文件，最简单的方法是将文件读入一个行列表中， # 然后计算列表的长度即可 count = len(codecs.open(d:/FreakOut.cpp, rU, utf-8).readlines()) print(count) # 对较大的文件，...

Python实现把utf-8格式的文件转换成gbk格式的文件

需求：将utf-8格式的文件转换成gbk格式的文件实现代码如下：代码如下: def ReadFile(filePath,encoding="utf-8"):with codecs.open(filePath,"r",encoding) as f:return f.read() def WriteFile(filePath,u,encoding="gbk"):with codecs.open(filePath,"w",encoding) as f:f.write(u) def UTF8_2_GBK(src,dst):content = ReadFile(src,encoding="utf-8")WriteFile(dst,content,encoding="gbk")代码讲解：函数ReadFile的第二个参数...

python实现JAVA源代码从ANSI到UTF-8的批量转换方法

本文实例讲述了python实现JAVA源代码从ANSI到UTF-8的批量转换方法。分享给大家供大家参考。具体如下：喜欢用eclipse的大神们，可能一不小心代码就变成ANSI码了，需要转换成utf-8嘛，一个文件一个文件的在Notepad2或者notepad++里面转换么？不，这里有批量转换的程序，python实现，需要的拿去用吧。 ansi2utf8.py：#-*- coding: utf-8 -*- import codecs import os import shutil import re import chardet def convert_encoding(f...

Python新建项目自动添加介绍和utf-8编码仙桃【代码】

仙桃代孕公司電薇同号（131-62292-573）22万起招代妈本文我们来看一下如何使用 Python + Appium 实现定时自动化收取蚂蚁森林能量。2. 环境本文主要环境如下：Win7小米5sPython3.7Appium1.5支付宝10.2.6.7010如果对环境搭建不熟悉的话，可以看一下：Python + Appium 自动化操作微信入门和我用 Python 找出了删除我微信的所有人并将他们自动化删除了。3. 实现功能实现的...

python utf-8 转码问题

print str(\345\207\235\346\266\265\346\237\217).decode(string_escape)凝涵柏但该语句在python3中无法运行 File "script.py", line 3print str(\345\207\235\346\266\265\346\237\217).decode(string_escape)^SyntaxError: invalid syntax Exited with error status 1 解决办法： print (str(\345\207\235\346\266\265\346\237\217).encode(latin1).decode(unicode-escape).encode(latin1).decode(utf-8)) 凝涵柏

#!/usr/bin/env python3和# -- coding: utf-8 --【代码】

#!/usr/bin python3 #!/usr/bin/env python3 # -*- coding: utf-8 -*- #!/usr/bin/env python3表示 python3 解释器所处的绝对路径就是 /usr/bin/python3，这样可以避免python2来解释python 3的代码（python2与python3有差异），但 /usr/bin/python3指定的是绝对路径如果碰到 python 解释器不在该路径下的话, 脚本就无法执行了。因此建议用环境变量的路径#!/usr/bin/env python3，这样会去"PATH 环境变量"中查找 python3...

Python把txt转为csv 可能出现的乱码问题，如果txt是以utf-8保存的，在转换成csv时，打开乱码问题【代码】

with open(直播源.csv, w, newline=,encoding=utf-8-sig)需要增加 encoding=utf-8-sig ，防止打开csv时中文乱码的情况。 UTF-8以字节为编码单元，它的字节顺序在所有系统中都是一様的，没有字节序的问题，也因此它实际上并不需要BOM(“ByteOrder Mark”)。但是UTF-8 with BOM即utf-8-sig需要提供BOM。简单的说，utf-8-sig是对字节编码有序的。

python UnicodeDecodeError utf-8 codec cant decode byte 0xcc in position 0: invalid continuation【代码】【图】

错误代码提示： hostname, aliases, ipaddrs = gethostbyaddr(name) UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcc in position 0: invalid continuation byte这个在网上大部分解法是修改主机名，主机名的修改方法就是去控制面板->用户账户->更改账户名称，如果没有更改账户名称，八成你的账户是直接用Microsoft账户登陆的，需要去开始，右键你的头像，选择更改账户设置，把账户设置为本地账户，然后再修改账户名然而...

如何将Python中的双UTF-8解码器代码转换为Lua【代码】

我有这个旧代码片段,(显然)它将经过双重编码的UTF-8文本解码回普通的UTF-8：# Run with python3! import codecs import sys s=codecs.open('doubleutf8.dat', 'r', 'utf-8').read() sys.stdout.write(s.encode('raw_unicode_escape').decode('utf-8'))我需要将其翻译为Lua,并模仿所有可能的解码副作用(如果有). 局限性：我可以使用任何可用的Lua模块进行UTF-8处理,但最好使用稳定的模块,并带有LuaRocks支持.我不会使用Lupa或其他Lu...

Python强制dict条目为utf-8【代码】

我花了一个下午的大部分时间来尝试修补字典对象以utf-8编码代替unicode.我试图找到扩展词典对象的最快,性能最好的方法,并确保其条目,键和值均为utf-8. 这是我想出的,它可以完成工作,但是我想知道可以进行哪些改进.class UTF8Dict(dict):def __init__(self, *args, **kwargs):d = dict(*args, **kwargs)d = _decode_dict(d)super(UTF8Dict,self).__init__(d)def __setitem__(self,key,value):if isinstance(key,unicode):key = key....

Python：UTF-8十六进制到UTF-16十进制【代码】

我有一个汉字汉字“烷烃”(U 70F7),UTF-8(十六进制)-0xE7 0x83 0xB7(e783b7)的表示形式.(请参见http://www.fileformat.info/info/unicode/char/70f7/index.htm) 我需要将此字符串’e783b7’转换为十进制值28.919(UTF-16十进制). 我现在要花一个小时来解决这个问题,所以我认为对stackoverflow进行询问会更快非常感谢眼镜蛇博士解决方法:使用ord内置函数,如下所示：>>> print('\u70f7') 烷 >>> print(ord('\u70f7')) 28919如果只有...

首页 / PYTHON / Python3 utf-8解码问题

Python3 utf-8解码问题

内容导读

内容图文

内容总结

内容备注

内容手机端

【Python3 utf-8解码问题】教程文章相关的互联网学习教程文章

PYTHON3 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程