首页 / PYTHON / python中的encode（）和decode（）函数

python中的encode（）和decode（）函数

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python中的encode（）和decode（）函数，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3920字，纯文字阅读大概需要6分钟。

内容图文

前言：

我们知道，计算机是以二进制为单位的，也就是说计算机只识别0和1,也就是我们平时在电脑上看到的文字，只有先变成0和1，计算机才会识别它的意思。这种数据和二进制的转换规则就是编码。计算机的发展中，有ASCII码，GBK，Unicode，utf-8编码。我们先从编码的发展史了解一下编码的进化过程。

编码发展史

很久很久以前，有一群人，他们决定用8个可以开合的晶体管来组合成不同的状态，以表示世界上的万物，他们把这称为”字节”（bytes）。再后来，他们又做了一些可以处理这些字节的机器，机器开动了，可以用字节来组合出很多状态，状态开始变来变去，他们就把这机器称为”计算机”。

他们把所有的空格、标点符号、数字、大小写字母分别用连续的字节状态表示，一直编到了第127号，这样计算机就可以用不同字节来存储英语的文字了。大家看到这样，都感觉很好，于是大家都把这个方案叫做 ANSI 的”Ascii”编码（American Standard Code for Information Interchange，美国信息互换标准代码）。当时世界上所有的计算机都用同样的ASCII方案来保存英文文字。

后来计算机发展越来越广泛，世界各国为了可以在计算机保存他们的文字，他们决定采用127号之后的空位来表示这些新的字母、符号，还加入了很多画表格时需要用下到的横线、竖线、交叉等形状，一直把序号编到了最后一个状态255。从128到255这一页的字符集被称”扩展字符集”。但是原有的编号方法，已经再也放不下更多的编码。

等中国人们得到计算机时，已经没有可以利用的字节状态来表示汉字，况且有6000多个常用汉字需要保存呢。于是国人就自主研发，把那些127号之后的奇异符号们直接取消掉。规定：一个小于127的字符的意义与原来相同，但两个大于127的字符连在一起时，就表示一个汉字，前面的一个字节（他称之为高字节）从0xA1用到 0xF7，后面一个字节（低字节）从0xA1到0xFE，这样我们就可以组合出大约7000多个简体汉字了。在这些编码里，我们还把数学符号、罗马希腊的字母、日文的假名们都编进去了，连在 ASCII 里本来就有的数字、标点、字母都统统重新编了两个字节长的编码，这就是常说的”全角”字符，而原来在127号以下的那些就叫”半角”字符了。

中国人民看到这样很不错，于是就把这种汉字方案叫做 “GB2312″。GB2312 是对 ASCII 的中文扩展。

中国人民通过对 ASCII 编码的中文扩充改造，产生了 GB2312 编码，可以表示6000多个常用汉字。

● 汉字实在是太多了，包括繁体和各种字符，于是产生了 GBK 编码，它包括了 GB2312 中的编码，同时扩充了很多。

● 中国是个多民族国家，各个民族几乎都有自己独立的语言系统，为了表示那些字符，继续把 GBK 编码扩充为 GB18030 编码。

● 每个国家都像中国一样，把自己的语言编码，于是出现了各种各样的编码，如果你不安装相应的编码，就无法解释相应编码想表达的内容。

● 终于，有个叫 ISO 的组织看不下去了。他们一起创造了一种编码 UNICODE（Universal Multiple-Octet Coded Character Set），这种编码非常大，大到可以容纳世界上任何一个文字和标志。所以只要电脑上有 UNICODE 这种编码系统，无论是全球哪种文字，只需要保存文件的时候，保存成 UNICODE 编码就可以被其他电脑正常解释。

● UNICODE 在网络传输中，出现了两个标准 UTF-8 和 UTF-16，分别每次传输 8个位和 16个位。

于是就会有人产生疑问，UTF-8 既然能保存那么多文字、符号，为什么国内还有这么多使用 GBK 等编码的人？因为 UTF-8 等编码体积比较大，占电脑空间比较多，如果面向的使用人群绝大部分都是中国人，用 GBK 等编码也可以。但是目前的电脑来看，硬盘都是白菜价，电脑性能也已经足够无视这点性能的消耗了。所以推荐所有的网页使用统一编码：UTF-8。utf-8既每次传输8位字节，utf-16每次传输16位字节。

encode()和decode()

decode英文意思是解码，encode英文原意编码
字符串在Python内部的表示是unicode编码，因此，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码（encode）成另一种编码。
decode的作用是将其他编码的字符串转换成unicode编码，如str1.decode('gb2312')，表示将gb2312编码的字符串str1转换成unicode编码。
encode的作用是将unicode编码转换成其他编码的字符串，如str2.encode('gb2312')，表示将unicode编码的字符串str2转换成gb2312编码。
总得意思:想要将其他的编码转换成utf-8必须先将其解码成unicode然后重新编码成utf-8,它是以unicode为转换媒介的如：s='中文' 如果是在utf8的文件中，该字符串就是utf8编码，如果是在gb2312的文件中，则其编码为gb2312。这种情况下，要进行编码转换，都需要先用 decode方法将其转换成unicode编码，再使用encode方法将其转换成其他编码。通常，在没有指定特定的编码方式时，都是使用的系统默认编码创建的代码文件

内容总结

以上是互联网集市为您收集整理的python中的encode（）和decode（）函数全部内容，希望文章能够帮你解决python中的encode（）和decode（）函数所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/849917.html

来源：【匿名】

【上一篇】Python3 数据类型转换【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python中的encode（）和decode（）函数】教程文章相关的互联网学习教程文章

Mac sublime 编译Python UnicodeEncodeError: 'ascii' codec can't encode characters in position 6-8: ordinal not in range(128)【代码】

刚学Python，想打印个“hello 张林峰”，代码如下：#!/usr/bin/env python3 # -*- coding: utf-8 -*-print(‘hello 张林峰‘)　　用sublime运行一下，竟然报错？？？Traceback (most recent call last):File "/Users/zhanglinfeng/Documents/Python/\u7ec3\u4e60/\u5b57\u7b26\u4e32\u7f16\u7801\u53ca\u8f93\u51fa\u683c\u5f0f.py", line 4, in <module>print(‘hello \u5f20\u6797\u5cf0‘) UnicodeEncodeError: ‘ascii‘ codec...

探究 encode 和 decode 的使用问题（Python）【代码】【图】

很多时候在写Python程序的时候都要在头部添加这样一行代码#coding: utf-8或者是这样# -*- coding:utf-8 -*-等等这行代码的意思就是设定同一编码格式为utf-8计算机中存储数据的编码方式多种多样，常用的有 unicode， utf-8， gbk，等等在Windows系统下，文本文件默认保存的格式应该是gbk在以一种编码格式保存文件时，应该使用相同的编码进行解析此文件，不然可能会出现乱码情况今天就是想记录一下我在写Python程序时，在解析字符...

python爬虫-'gbk' codec can't encode character '\xa0' in position 134: illegal multibyte sequence【代码】

UnicodeEncodeError Traceback (most recent call last) <ipython-input-95-45a7accf2da0> in <module>1 fout = open(‘job_desc.txt‘, ‘wt‘)2 for info in job_desc: ----> 3 fout.write("{},\"{}\"\n".format(info[0],info[1].replace("\n","").replace("","")))4 fout.close()UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa0‘ in position 134: illegal multibyte sequence运...

python 序列化pickle 和 encode的区别

我们把变量从内存中变成可存储或传输的过程称之为序列化。　　序列化之后，就可以把序列化后的内容写入磁盘，或者通过网络传输到别的机器上。　　反过来，把变量内容从序列化的对象重新读到内存里称之为反序列化，即unpickling。encode 编码和 decode 解码　　是在文件中读取或者写入数据，但是都是写入的字符串的二进制格式，没有数据类型的分别两者都是将数据转换为 bytes 但是　 pickle 变成二进制还能保持数据类型　　 enco...

python3的encode和decode涉及的str和bytes转换【代码】

参考链接：python3的decode()与encode()文本总是Unicode,由str类型进行表示，二进制数据使用bytes进行表示，不会将str与bytes偷偷的混在一起，使得两者的区别更加明显。在python2中会明显发现不能将str与bytes拼接在一起，也不能在bytes中查找字符。在实际应用中经常需要对两者进行转换操作以便后续的代码能够顺利跑完。两者之间的关如下所示：str->bytes:encode编码 bytes->str:decode解码字符串通过编码成为字节码，字节码通过解...

Python字符串的encode与decode

首先要搞清楚，字符串在Python内部的表示是unicode编码. 因此，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码（encode）成另一种编码。 decode的作用是将其他编码的字符串转换成unicode编码，如str1.decode(‘gb2312‘)，表示将gb2312编码的字符串转换成unicode编码。 encode的作用是将unicode编码转换成其他编码的字符串，如str2.encode(‘gb2312‘)，表示将...

Python乱码，编码，repr，encode，decode探究

#encoding:utf-8 #用命令行执行 s = ‘百度‘ print s # 输出环境为gbk，编码为utf-8，输出乱码 print s.decode(‘utf-8‘) # => 发现输出环境为gbk，自动转换 print s.decode(‘utf-8‘).encode(‘utf-8‘) # 输出环境为gbk，编码为utf-8，输出乱码 print s.decode(‘utf-8‘).encode(‘gbk‘) # 输出环境为gbk，编码为gbk，正常输出 # s = 0xF21938274ABDS... 二进制内存 # 把这些内存数据转化为可显示的字符串就是repr(s)的prin...

python 编码报错问题 'ascii' codec can't encode characters 解决方法【代码】

python在安装时，默认的编码是ascii，当程序中出现非ascii编码时，python的处理常常会报这样的错 ‘ascii‘ codec can‘t encode characters python没办法处理非ascii编码的，此时需要自己设置将python的默认编码，一般设置为utf8的编码格式。查看python的默认编码print sys.getdefaultencoding()解决方法一（已通过验证，顺带也解决了我之前字符前一直加u的问题）在python安装目录下，进入\Python27\Lib\site-packages下新建一个...

python - run length encode / decode【代码】

编 / 解码：def rle(s):c = ‘‘p = ‘‘x = 1for _ in s:if _ == p:x += 1else:c += str(x)c += px = 1p = _c += str(x)c += preturn c[1:]def rld(s):r = ‘‘n = 0for _ in s:if _.isdigit():n = int(_)elif n > 0:r += _ * nreturn rs = ‘aaaaaaassssssssgggrrrttaawefw‘ e = rle(s) print(e)输出：7a8s3g3r2t2a1w1e1f1w 原文：https://www.cnblogs.com/darkchii/p/12757841.html

Python字符串的encode与decode研究心得乱码问题解决方法

为什么会报错“UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 0-1: ordinal not in range(128)”？本文就来研究一下这个问题。字符串在Python内部的表示是unicode编码，因此，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码（encode）成另一种编码。 decode的作用是将其他编码的字符串转换成unicode编码，如str1.decode(‘gb2312‘...

python写文件时遇到UnicodeEncodeError: 'gbk' codec can't encode character...时处理办法

网页上爬取内容后要写入文件保存，在写入时出错了。写文件时遇到“UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\uf0fc‘ in position 147: illegal multibyte sequence”错误网上查找处理办法，经过实测=后以下方法可行：在打开文件时定义文件编码为UTF-8，出现错误时忽略，即：f = open(‘tt.csv‘, ‘w‘, encoding="utf-8", errors="ignore")f.writelines("爬取的内容")f.close()或：with open(hid+".html",‘...

python3字符集之间--encode与decode之间的转码详解【代码】

encode是编码,里面传入的参数是需要转成的字符集,decode是解码,里面传入的参数是本身的字符集,用本身的字符集解码为unicode字符集再转码字符集之间的爱恨纠缠 1# -*- coding: utf-8 -*- 2‘‘‘ 3 Python3 默认编码为unicode4‘‘‘ 5#输出默认编码 6import sys7print(sys.getdefaultencoding())8 9#文件编码为utf-810 s = ‘你好‘11#把s转换为gbk编码12 s_to_gbk = s.encode("gbk") 13print(s_to_gbk) 14#输出结果为bytes类型...

关于php中json_encode中文乱码问题jsonencode数组jsonencodetruepythonjsonencode

function message(){$arr = array(1 => 留言1,2 => 留言2,3 => 留言3,4 => 留言4,5 => 留言5,6 => 留言6,7 => 留言7,8 => 留言8);foreach($arr as $key => $value){$arr[$key] = urlencode ( $value ); }$data = urldecode ( json_encode ( $arr ) );return $data;}使用urlencode对数组内容遍历，最后再使用urlencode对json_encode结果处理以上就介绍了关于php中json_encode中文乱码问题，包括了json_encode方面的内容，希望对PHP教...

详解字符串的encode与decode乱码问题解决方法

为什么会报错“UnicodeEncodeError: ascii codec cant encode characters in position 0-1: ordinal not in range(128)”？本文就来研究一下这个问题。字符串在Python内部的表示是unicode编码，因此，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码（encode）成另一种编码。 decode的作用是将其他编码的字符串转换成unicode编码，如str1.decode(gb2312)，表示将...

字符串的encode与decode解决乱码问题

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python中的encode（）和decode（）函数

python中的encode（）和decode（）函数

内容导读

内容图文

内容总结

内容备注

内容手机端

【python中的encode（）和decode（）函数】教程文章相关的互联网学习教程文章

Mac sublime 编译Python UnicodeEncodeError: 'ascii' codec can't encode characters in position 6-8: ordinal not in range(128)【代码】

探究 encode 和 decode 的使用问题（Python）【代码】【图】

python爬虫-'gbk' codec can't encode character '\xa0' in position 134: illegal multibyte sequence【代码】

python 序列化pickle 和 encode的区别

python3的encode和decode涉及的str和bytes转换【代码】

Python字符串的encode与decode

Python乱码，编码，repr，encode，decode探究

python 编码报错问题 'ascii' codec can't encode characters 解决方法【代码】

python - run length encode / decode【代码】

Python字符串的encode与decode研究心得乱码问题解决方法

python写文件时遇到UnicodeEncodeError: 'gbk' codec can't encode character...时处理办法

python3字符集之间--encode与decode之间的转码详解【代码】

关于php中json_encode中文乱码问题jsonencode数组jsonencodetruepythonjsonencode

详解字符串的encode与decode乱码问题解决方法

字符串的encode与decode解决乱码问题

PYTHON - 相关标签

DECODE - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程