首页 / PYTHON / 修复由另一种语言引起的Python Unicode错误

修复由另一种语言引起的Python Unicode错误

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了修复由另一种语言引起的Python Unicode错误，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2122字，纯文字阅读大概需要4分钟。

内容图文

我收到这个错误：

UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 52-57: ordinal not in range(128)

导致错误的代码：

f.write(textwrap.dedent(unicode(the_string))

我想写的字符串摘自一个网站,其中包含英语和日语(用于测试)外语单词和名称的音译,例如コンピュータ(konpyūta,“computer”)和ロンドン(Rondon,“London”). (一些已归化的外国借款可能不会以片假名呈现.)

在Python中处理字符串时使用另一种语言(日语).我如何解析这个以防止错误仍然保留字符串？

解决方法:

这里的问题是文件对象的.write方法天真地尝试转换unicode字符串(如果你在Python 2.x中,这将是unicode类型),你将它传递给字节字符串(如果你在Python 2.x中,这将是str类型)使用ASCII编解码器,但是你传递的unicode字符串不能用ASCII表示,因为它有(日语)字符不是ASCII字符集的一部分.

您需要使用unicode字符串的.encode方法将其转换为表示该字符串的一系列字节,然后才能保存它.这基本上是str类型在Python 2.x中表示的 – 只是一系列字节,而不是你可能期望的一系列字符.但是Python很容易让你思考,因为当你打印str类型的变量时,Python会使用系统的默认unicode编码将它显示为终端中的一系列字符.

您应该使用什么编码来编码字符串取决于您的用例. UTF-8是最常见的,你可能只想使用它,但如果你想确保你写的文件将在同一系统的文本编辑器中正确显示,即使你在一个设备上运行它一个不太常见的系统编码,如UTF-16,您可能希望使用系统的默认编码(如果系统具有无法对您的字符串进行编码的默认编码,这当然会失败).

换句话说,您几乎肯定想要做以下事情之一：

一个)

f.write(textwrap.dedent(the_string).encode( ‘UTF-8’))

import sys
f.write(textwrap.dedent(the_string).encode(sys.getdefaultencoding()))

如果你认为这是一个相当恼人和复杂的东西,让你的头脑执行相当基本的任务,写一些非ASCII文本到文件,那么 – 我同意你的意见！当我开始使用Python(这是我的第一个编程语言)时,我在理解unicode,字符串编码以及与之相关的Python类型和方法方面遇到了很多困难.然而,复杂性不是Python的错 – 它取决于计算机对文本进行编码的方式,特别是对文本进行多种编码的事实.不同的字节序列可以表示相同的字符序列,具体取决于正在使用的编码.这使得Python不可能只隐藏你的字符串编码的细节和“像我一样自动做一些明智的事情”,作为一个新手,天真的希望和预期.

如果您要编写任何涉及从Web上获取和使用可能包含非ASCII字符的文本数据的大量代码,我建议您仔细阅读本主题,并从中深入了解它一般和Python特定的观点.

内容总结

以上是互联网集市为您收集整理的修复由另一种语言引起的Python Unicode错误全部内容，希望文章能够帮你解决修复由另一种语言引起的Python Unicode错误所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/825517.html

来源：【匿名】

【上一篇】python – 查找字符和数字之间可能的双射【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【修复由另一种语言引起的Python Unicode错误】教程文章相关的互联网学习教程文章

python中unicode的坑

项目中遇到这么一个python编码的问题，通过网络得到了一个带‘\u’的字符串，了解到这是unicode码，对应的是若干个中文，所以尝试用网上“python中unicode转中文”的方法做encode和decode，结果都不行。后来查到做decode的时候可以带一个‘unicode-escape’的选项，加上之后就可以了。通过这次问题的解决，大概了解到，python里面做任何编码的转换都离不开解码和编码两个过程，解码可以理解为解密，编码可以理解为加密，‘\u‘这种...

python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multibyte sequence【代码】

python读取文件时提示"UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 205: illegal multibyte sequence"解决办法1.FILE_OBJECT= open(‘order.log‘,‘r‘, encoding=‘UTF-8‘)解决办法2.FILE_OBJECT= open(‘order.log‘,‘rb‘) ' codec can't decode byte 0x80 in position 205: illegal multibyte sequence' ref='nofollow'>python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode by...

PyQt QString 与 Python str&unicode【代码】【图】

昨日，将许久以前做的模拟网页登录脚本用PyQt封装了一下，结果出大问题了，登录无数次都提示登录失败！！而不用PyQt实现的GUI登录直接脚本登录无数次都提示登录成功！！心中甚是伤痛，于是探究起来，解决这一问题。问题描述及证据如下：上图是脚本MD5加密过程及结果上图是PyQt GUI中获取密码框内容后加密的结果，其实现代码如下：# -*- coding: gbk -*-‘‘‘ Version : Python27 Author : Spring God Date : 2013-6-28...

Python报错：UnicodeDecodeError: ‘gbk‘ codec can‘t ...【代码】

python读取文件时提示：UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xaa in position 82: illegal multibyte sequence 解决办法：例如，错误代码是：f=open(file_new,‘r‘)改为如下：f=open(file_new,‘r‘, encoding=‘UTF-8‘)这样执行python就不会报这个错误啦~~~~原文：http://blog.51cto.com/11959825/2286979

python判断unicode是否是汉字，数字，英文，或者其他字符

下面这个小工具包含了判断unicode是否是汉字，数字，英文，或者其他字符。全角符号转半角符号。 unicode字符串归一化等工作。 #!/usr/bin/env python # -*- coding:GBK -*- """汉字处理的工具: 判断unicode是否是汉字，数字，英文，或者其他字符。全角符号转半角符号。""" def is_chinese(uchar): """判断一个unicode是否是汉字""" if uchar >= u‘u4e00‘ and uchar<=u‘u9fa5‘: return...

python写文件时遇到UnicodeEncodeError: 'gbk' codec can't encode character...时处理办法

网页上爬取内容后要写入文件保存，在写入时出错了。写文件时遇到“UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\uf0fc‘ in position 147: illegal multibyte sequence”错误网上查找处理办法，经过实测=后以下方法可行：在打开文件时定义文件编码为UTF-8，出现错误时忽略，即：f = open(‘tt.csv‘, ‘w‘, encoding="utf-8", errors="ignore")f.writelines("爬取的内容")f.close()或：with open(hid+".html",‘...

解决Python 2下的json.loads()导致的unicode编码问题,json数据转换前面带u,去掉字典类型前面的u

https://blog.csdn.net/qq_24342335/article/details/84561341 def unicode_convert(input): if isinstance(input, dict): return {unicode_convert(key): unicode_convert(value) for key, value in input.iteritems()} elif isinstance(input, list): return [unicode_convert(element) for element in input] elif isinstance(input, unicode): return input.encode(‘utf-8‘) else: ...

python 对Unicode解码【代码】

打印：print(‘我喜欢你‘.encode(‘utf8‘))得到Unicode编码：b‘\\u6211\\u559c\\u6b22\\u4f60 将上面的编码赋值给str后解码：#Unicode s1=‘\\u6211\\u559c\\u6b22\\u4f60‘#转为utf-8(明文)print(s1.encode(‘utf8‘).decode(‘unicode_escape‘)) #转为utf-8编码print(s1.encode(‘utf8‘).decode(‘unicode_escape‘).encode(‘utf8‘))输出：我喜欢你 b‘\xe6\x88\x91\xe5\x96\x9c\xe6\xac\xa2\xe4\xbd\xa0‘ 原文：https:/...

Python-正确使用Unicode

正确处理文本，特别是正确处理Unicode。是个老生常谈的问题，有时甚至会难倒经验丰富的开发者。并不是因为这个问题很难，而是因为对软件中的文本，开发者没有正确理解一些关键概念及其表示方法。在StackOverflow上搜索关于UnicodeDecodeError相关的问题，可以看到很多人都有这样的误解。这些错误的概念可以追溯到Unicode出现之前。那时许多现今的开发者还没入职，也包括我自己。如果这些错误的概念没有散布开来，其实不是个问题。...

python读取csv,txt,excel类似文件出现UnicodeDecodeError错误

错误如下：UnicodeDecodeError: utf-8 codec cant decode byte 0xff in position 0简单粗暴，用Windows的记事本打开源文件，编码格式改为utf-8，再用pandas，xlrd等库文件读文件就解决了。原因是因为python读文件的时候默认使用utf-8编码，而存下来的文件鱼龙混杂，很大一部分是ANSI编码。

将python中的unicode字符串解析为字典【代码】

我确信这既非常简单,也是SO的其他问题的组合,但我找不到正确的答案. 我有一个unicode字符串：u“word1 word2 word3 …”它将始终采用相同的格式.我想将它解析成一个总是有相同键的字典： “key1：word1 key2：word2 key3：word3 ……” 我该怎么做呢？解决方法:试试这个：keys = ['key1', 'key2', 'key3'] words = u'word1 word2 word3' vals = words.split()d = dict(zip(keys, vals))然后,如果要检索字符串中的键/值对,就像示例中...

Python：在Ubuntu上覆盖os.path.supports_unicode_filenames【代码】

我在Ubuntu服务器上运行python网络应用程序,而我在OS X上本地开发. 我为希伯来语使用了很多unicode字符串,包括处理图像的文件名,因此它们将使用希伯来语字符保存在文件系统中. 我的Ubuntu服务器已针对UTF-8进行了完全配置-我在文件系统上(此应用程序之外)在其他文件中使用希伯来语名称,希伯来语命名目录等. 但是,当尝试在Ubuntu(而不是OS X)上使用希伯来语文件名保存图像时,我的应用程序返回错误. 错误是：UnicodeEncodeError: 'as...

python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205:【代码】

python读取文件时提示"UnicodeDecodeError: gbk codec cant decode byte 0x80 in position 205: illegal multibyte sequence" 解决办法1:FILE_OBJECT= open(order.log,r, encoding=UTF-8) 解决办法2：FILE_OBJECT= open(order.log,rb)解决Python中出现的ValueError: not enough values to unpack (expected 2, got 1)的问题姓名地区身高体重电话况咏蜜北京 171 48 13651054608 王心颜上...

python – TypeError：强制转换为Unicode：需要字符串或缓冲区,找到用户【代码】

我必须为用户抓取last.fm(大学练习).我是python的新手,并得到以下错误：Traceback (most recent call last):File "crawler.py", line 23, in <module>for f in user_.get_friends(limit='200'):File "/opt/local/Library/Frameworks/Python.framework/Versions/2.6/lib/python2.6/site-packages/pylast.py", line 2717, in get_friendsfor node in _collect_nodes(limit, self, "user.getFriends", False):File "/opt/local/Librar...

python中的smtplib.server.sendmail函数引发了UnicodeEncodeError：’ascii’编解码器无法编码字符【代码】

我正在尝试编辑文本文件,然后使用python脚本将其作为电子邮件正文发送,但我得到unicode编码错误.经过一些研究后,我发现解决方案使用的方法.encode(‘utf-8’),但这并不适合我,因为sendmail()方法只发送字符串这是我使用的python代码片段：irtem = open('irtemplate.txt') data = irtem.read().replace('(name)', eng_name).replace('(customer)', cu_name).replace('(sr)', SR_num).replace('(problem)', prob_description).rep...

首页 / PYTHON / 修复由另一种语言引起的Python Unicode错误

修复由另一种语言引起的Python Unicode错误

内容导读

内容图文

内容总结

内容备注

内容手机端

【修复由另一种语言引起的Python Unicode错误】教程文章相关的互联网学习教程文章

python中unicode的坑

python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multibyte sequence【代码】

PyQt QString 与 Python str&unicode【代码】【图】

Python报错：UnicodeDecodeError: ‘gbk‘ codec can‘t ...【代码】

python判断unicode是否是汉字，数字，英文，或者其他字符

python写文件时遇到UnicodeEncodeError: 'gbk' codec can't encode character...时处理办法

解决Python 2下的json.loads()导致的unicode编码问题,json数据转换前面带u,去掉字典类型前面的u

python 对Unicode解码【代码】

Python-正确使用Unicode

python读取csv,txt,excel类似文件出现UnicodeDecodeError错误

将python中的unicode字符串解析为字典【代码】

Python：在Ubuntu上覆盖os.path.supports_unicode_filenames【代码】

python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205:【代码】

python – TypeError：强制转换为Unicode：需要字符串或缓冲区,找到用户【代码】

python中的smtplib.server.sendmail函数引发了UnicodeEncodeError：’ascii’编解码器无法编码字符【代码】

UNICODE - 相关标签

PYTHON - 相关标签

错误 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程