首页 / PYTHON / python中文乱码问题大总结

python中文乱码问题大总结

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python中文乱码问题大总结，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4409字，纯文字阅读大概需要7分钟。

内容图文

在运行这样类似的代码：

#!/usr/bin/env python
s="中文"
print s

最近经常遇到这样的问题：

问题一：SyntaxError: Non-ASCII character '\xe4' in file E:\coding\python\Untitled 6.py on line 3, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

问题二：UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 108: ordinal not in range(128)

问题三：UnicodeEncodeError: 'gb2312' codec can't encode character u'\u2014' in position 72366: illegal multibyte sequence

这些都是跟字符编码有关的问题，很郁闷，中文总是弄不出来，找了很多方案，这里有些是我前几天找到的一些方案，拿出来给大家分享一下哈

　　字符串在Python内部的表示是unicode 编码，因此，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码（encode）成另一种编码。

decode的作用是将其他编码的字符串转换成unicode编码，如str1.decode('gb2312')，表示将gb2312编码的字符串str1转换成unicode编码。

encode的作用是将unicode编码转换成其他编码的字符串，如str2.encode('gb2312')，表示将unicode编码的字符串str2转换成gb2312编码。

在某些IDE中，字符串的输出总是出现乱码，甚至错误，其实是由于IDE的结果输出控制台自身不能显示字符串的编码，而不是程序本身的问题。

如在UliPad中运行如下代码：

s=u"中文"

print s

会提示：UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)。这是因为UliPad在英文WindowsXP 上的控制台信息输出窗口是按照ascii编码输出的（英文系统的默认编码是ascii），而上面代码中的字符串是Unicode编码的，所以输出时产生了错误。

将最后一句改为：print s.encode('gb2312')

则能正确输出“中文”两个字。

若最后一句改为：print s.encode('utf8')

则输出：\xe4\xb8\xad\xe6\x96\x87，这是控制台信息输出窗口按照ascii编码输出utf8编码的字符串的结果。

下面代码可能比较通用一些，如下:

#!/usr/bin/env python  
#coding=utf-8  
s="中文"
if isinstance(s, unicode): 
    #s=u"中文"  
    print s.encode('gb2312') 
else: 
    #s="中文"  
    print s.decode('utf-8').encode('gb2312')
#!/usr/bin/env python
#coding=utf-8
s="中文"
if isinstance(s, unicode):
 #s=u"中文"
 print s.encode('gb2312')
else:
 #s="中文"
 print s.decode('utf-8').encode('gb2312')

看看下面一段代码：

#!/usr/bin/env python  
#coding=utf-8  
#python version:2.7.4 
#system:windows xp 
   
import httplib2
def getPageContent(url):
    '''''
    使用httplib2用编程的方式根据url获取网页内容
    将bytes形式的内容转换成utf-8的字符串
    '''
    #使用ie9的user-agent，如果不设置user-agent将会得到403禁止访问 
    headers={'user-agent':'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)',
            'cache-control':'no-cache'}
    if url:
         response,content = httplib2.Http().request(url,headers=headers)
            
         if response.status == 200 :
            return content

import sys  
reload(sys)  
sys.setdefaultencoding('utf-8')   #修改默认编码方式，默认为ascci 
print sys.getdefaultencoding()
   
content = getPageContent("http://www.oschina.net/")
print content.decode('utf-8').encode('gb2312')
#!/usr/bin/env python
#coding=utf-8
#python version:2.7.4
#system:windows xp
import httplib2
def getPageContent(url):
    '''
    使用httplib2用编程的方式根据url获取网页内容
    将bytes形式的内容转换成utf-8的字符串
    '''
    #使用ie9的user-agent，如果不设置user-agent将会得到403禁止访问
    headers={'user-agent':'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)',
            'cache-control':'no-cache'}
    if url:
         response,content = httplib2.Http().request(url,headers=headers)
          
         if response.status == 200 :
            return content

import sys
reload(sys)
sys.setdefaultencoding('utf-8')   #修改默认编码方式，默认为ascci
print sys.getdefaultencoding()
content = getPageContent("http://www.oschina.net/")
print content.decode('utf-8').encode('gb2312')

上面的代码的意思：向www.oschina.net网站请求他的主页，（如果直接是utf-8编码，不能输出中文）想将编码方式为utf-8转向gd2312,出现问题三

当我把它将print content.decode('utf-8').encode('gb2312')改成　　print content.decode('utf-8').encode('gb2312', ‘ignore’)时，ＯＫ了，可以显示中文了，但不敢确定是否为全部，貌似只有部分吧，有些不能用gb2312编码

然而，当我把网站换成 www.soso.com时，不用转为gb2312,用utf-8即可正常显示中文

总结一下：

　　向文件直接输出ss会抛出同样的异常。在处理unicode中文字符串的时候，必须首先对它调用encode函数，转换成其它编码输出。这一点对各个环境都一样。在Python中，“str”对象就是一个字节数组，至于里面的内容是不是一个合法的字符串，以及这个字符串采用什么编码（gbk, utf-8, unicode）都不重要。这些内容需要用户自己记录和判断。这些的限制也同样适用于“unicode”对象。要记住“unicode”对象中的内容可绝对不一定就是合法的unicode字符串，我们很快就会看到这种情况。在windows的控制台上，支持gbk编码的str对象和unicode编码的unicode对象。

内容总结

以上是互联网集市为您收集整理的python中文乱码问题大总结全部内容，希望文章能够帮你解决python中文乱码问题大总结所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/432002.html

来源：【匿名】

【上一篇】Python列表类型的所有方法【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python中文乱码问题大总结】教程文章相关的互联网学习教程文章

python json.dumps() 中文乱码问题【代码】

python 输出一串中文字符，在控制台上（控制台使用UTF-8编码）通过print 可以正常显示，但是写入到文件中之后，中文字符都输出成ascii编码了。英文字符能正常显示可读字符。原因：json.dumps 序列化时默认使用的ascii编码，想输出真正的中文需要指定ensure_ascii=False：更深入分析，是应为dJSON object 不是单纯的unicode实现，而是包含了混合的unicode编码以及已经用utf-8编码之后的字符串。可行的方式如下： 1 import os2 impor...

pycharm开发python时出现控制中文显示乱码【图】

当pycharm开发python时，中文出现乱码650) this.width=650;" src="/upload/getfiles/default/2022/11/16/20221116095116835.jpg" title="QQ截图20140818143130.png" />修改setting文件650) this.width=650;" src="/upload/getfiles/default/2022/11/16/20221116095117136.jpg" title="QQ截图20140818143155.png" />650) this.width=650;" src="/upload/getfiles/default/2022/11/16/20221116095117572.jpg" title="QQ截图201408181...

python处理列表或字典包含中文乱码问题【代码】

Python中的列表（list）或字典包含中文字符串，直接使用print会出现乱码 #打印字典 dict1 = {‘name‘:‘张三‘} print(dict) {‘name‘: ‘\xe5\xbc\xa0\xe4\xb8\x89‘}#打印列表list1 = [‘艺术‘,‘名画‘] print(list1) ["\u827a\u672f", "\u540d\u753b"] 解决方法一：import json #打印字典 dict1 = {‘name‘:‘张三‘} print(json.dumps(dict1,encoding=‘utf-8‘,ensure_ascii=False))#打印列表 list1 = [‘艺术‘,‘名画‘...

解决CentOS 6.5中，Python-2.7.*交互模式下方向键、退格键等出现乱码的问题

由于CentOS6.5系统自带的python版本为2.6.6，而很多情况下我们要求使用的python版本为2.7.*安装完毕后，发现使用系统自带的python 2.6.6版本时，箭头和退格正常使用，然而升级后的python2.7.*使用退格键和上下左右键会出现乱码。分析原因：由于系统缺少了readline相关模块，CentOS 6.5默认只安装了readline模块而没有安装readline-devel模块解决方法：安装readline-devel模块yum -y install readline-devel重新编译一下python2.7....

python3解决 json.dumps中文乱码【图】

使用json.dumps()运行结果如下role_name字段中文乱码了只需要使用ensure_ascii=False运行结果如下：原文：https://www.cnblogs.com/zhmiao/p/10752450.html

Python3.x：BeautifulSoup()解析网页内容出现乱码【代码】

Python3.x：BeautifulSoup()解析网页内容出现乱码问题：start_html = requests.get(all_url, headers=Hostreferer) BeautifulSoup(start_html.text, "html.parser")　出现乱码；　解决方案：　将BeautifulSoup(start_html.text, "html.parser")替换为BeautifulSoup(start_html.content, "html.parser")，即可；start_html = requests.get(all_url, headers=Hostreferer) BeautifulSoup(start_html.content, "html.parser") 原文：h...

python读写csv时中文乱码问题解决办法【代码】

https://www.cnblogs.com/shengulong/p/7097869.html 参考1参考2参考3CSV是英文Comma Separate Values（逗号分隔值）的缩写，顾名思义，文档的内容是由 “,” 分隔的一列列的数据构成的，可以使用excel和文本编辑器等打开。CSV文档是一种编辑方便，可视化效果极佳的数据存储方式1、python读写、追加csv方法：‘r’：只读（缺省。如果文件不存在，则抛出错误）‘w’：只写（如果文件不存在，则自动创建文件）‘a’：附加到文件末尾（...

一种可以解决python读取文件中文出乱码的方法

这几天刚刚入手学习python，今天在进行python文件存取的时候出现输出中文乱码问题。当然作为一名python技术小白，也只能通过在百度上查找结果。通过导入 ‘os‘模块，如下： username = input(‘username:‘) os.system("cd.>test.txt") fp = open(‘test.txt‘,‘w+‘) fp.write(username)可以将输入的username字符串写入到文件text.txt中，该文件存在本项目下面。知识在输出的时候遇到中文输出乱码的问题，然...

Python抓取中文网页出现乱码【代码】

转自http://www.oschina.net/code/snippet_1448389_33526原来是有的时候网站将网页用gzip压缩了 1""" 2迪艾姆公司python远程培训班黄哥所写 3python远程视频培训班周末班4迪艾姆python培训周末班北京3月8、上海3月9日上课欢迎报名参加。5http://www.010dm.com/xflml/3089.html6回答贴吧上一个同学用python3访问sina首页中文的处理7 8如果只用普通的9import urllib.request 10html = urllib.request.urlopen("http://www.sina.co...

win10下使用vscode调试python输出中文乱码的解决办法【代码】

今天在vscode中调试一个python脚本时发现中文乱码了，折腾了好一会儿才找到原因，记录一下。　　很简单的一句代码测试一下：　　# -*- coding: utf-8 -*-print(‘乱码不？‘) 　　文件编码设置的也是utf-8，但是调试就是乱码，网上看大都是说设置PYTHONIOENCODING=UTF8的环境变量，尝试过发现还是不行。　　其实问题在于windows下的cmd或者PS终端都是默认GBK编码，VSCODE调试时是调用的cmd的，如果把文件头和编码都改成GBK就不会乱...

Python 读写文件中文乱码错误TypeError: write() argument must be str, not bytes+【代码】

今天写上传文件代码，如下def uploadHandle(request):pic1=request.FILES[‘pic1‘]picName=os.path.join(settings.MEDIA_ROOT,pic1.name)with open(picName,‘w‘) as pic:for c in pic1.chunks():pic.write(c)return HttpResponse(picName)出现TypeError: write() argument must be str, not bytes错误网上搜索才发现原来是文件打开方式有问题，把之前的打开语句修改为用二进制方式打开就没有问题改为：def uploadHandle(request...

解决RHEL6.5中，Python-2.7.6交互模式下方向键、退格键等出现乱码的问题【代码】

由于CentOS6.5系统自带的python版本为2.6.6，而很多情况下我们要求使用的python版本为2.7.*，手动升级python版本至2.7.13，安装完毕后，发现使用系统自带的python 2.6.6版本时，箭头和退格正常使用，但自定义安装的python 2.7.13退格键和箭头无法正常使用，如下：[root@M1 ~]# pythonPython 2.7.13 (default, Feb 26 2017, 22:50:38) [GCC 4.4.7 20120313 (Red Hat 4.4.7-3)] on linux2Type "help", "copyright", "credits" or "l...

Python乱码，编码，repr，encode，decode探究

#encoding:utf-8 #用命令行执行 s = ‘百度‘ print s # 输出环境为gbk，编码为utf-8，输出乱码 print s.decode(‘utf-8‘) # => 发现输出环境为gbk，自动转换 print s.decode(‘utf-8‘).encode(‘utf-8‘) # 输出环境为gbk，编码为utf-8，输出乱码 print s.decode(‘utf-8‘).encode(‘gbk‘) # 输出环境为gbk，编码为gbk，正常输出 # s = 0xF21938274ABDS... 二进制内存 # 把这些内存数据转化为可显示的字符串就是repr(s)的prin...

Windows下，gVim编辑，Python2应用程序的乱码问题【图】

Windows，Python2环境下，当gVim配置了 set fileencoding=utf-8，则新建文件编码方式为utf-8。 ○ 如果代码不包含中文，或者仅包含中文注释，则utf-8编码方式可以用。只要在文件头加上 # -*- coding:utf-8 -*- 即可。可以在gVim中使用命令 :set fileencoding来查看文档编码方式，如果不是utf-8，则可以使用命令 :set fileencoding=utf-8来设置。 ○ 如果代码正文包含中文，则utf-8编码方式不可用，因为Windows默认的中文编码方...

使用Windows系统cmd运行Python时中文乱码问题有效的解决方式

系统是Windows7.在cmd或者powershell上使用Python2/3运行含有中文的Python源文件，都有中文乱码问题。目前找到的有效解决方法是先对中文按照指导的编码方式解码，然后按照指定的编码方式编码字符串，当然对于Python2要加上使用utf-8的注解，例如：（该解决方案来自于http://www.runoob.com/python/python-chinese-encoding.html 的笔记）#!/usr/bin/python# -*- coding:utf-8 -*-s = "你好，世界！"print s.decode("utf-8").encode...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python中文乱码问题大总结

python中文乱码问题大总结

内容导读

内容图文

内容总结

内容备注

内容手机端

【python中文乱码问题大总结】教程文章相关的互联网学习教程文章

python json.dumps() 中文乱码问题【代码】

pycharm开发python时出现控制中文显示乱码【图】

python处理列表或字典包含中文乱码问题【代码】

解决CentOS 6.5中，Python-2.7.*交互模式下方向键、退格键等出现乱码的问题

python3解决 json.dumps中文乱码【图】

Python3.x：BeautifulSoup()解析网页内容出现乱码【代码】

python读写csv时中文乱码问题解决办法【代码】

一种可以解决python读取文件中文出乱码的方法

Python抓取中文网页出现乱码【代码】

win10下使用vscode调试python输出中文乱码的解决办法【代码】

Python 读写文件中文乱码错误TypeError: write() argument must be str, not bytes+【代码】

解决RHEL6.5中，Python-2.7.6交互模式下方向键、退格键等出现乱码的问题【代码】

Python乱码，编码，repr，encode，decode探究

Windows下，gVim编辑，Python2应用程序的乱码问题【图】

使用Windows系统cmd运行Python时中文乱码问题有效的解决方式

PYTHON - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程