【python – unicodedata.normalize(form,unistr)如何工作?】教程文章相关的互联网学习教程文章

从python中的xls读取unicode【代码】

我正在尝试使用Python读取.xls文件.该文件包含多个非ascii字符(即).我已经尝试过使用openpyxls和xlrd(我对xlrd寄予厚望,因为它无论如何都会读取unicode中的所有内容),但都没有工作. 我在尝试从xls打印信息时发现了多个处理编码/解码的答案,但我似乎无法达到那么远.只需尝试读取文件后,此脚本就会出错:import xlrd workbook = xlrd.open_workbook('export_data.xls')导致:Traceback (most recent call last):File "C:\Users\Admin...

python – Unicode SendKeys Alternative(任何编程语言)【代码】

在我得到实际问题之前,我会说尽管我目前正在使用Python,但我会接受任何语言的解决方案.我主要是一名Java程序员,但由于Java仅限于其JVM,我认为不可能用Java创建它. 目标: 我正在尝试制作一个拦截键盘事件的程序(我已经使用pyHook完成了这部分,这是我用Python编程的主要原因之一).基于这些事件和上下文,我需要将unicode字符(古希腊语)写入任何聚焦窗口(目前仅在Windows操作系统上,但是适用于所有操作系统的统一解决方案似乎是理想的...

python – Django不匹配url中的unicode【代码】

我有一个django 2.0的问题,其中包含unicode slug的url不匹配,我搜索了一个解决方案,但我找不到我的情况,这是我的代码的简化版本:// models.pyclass Level(models.Model):name = models.CharField(max_length=100)slug = models.SlugField(max_length=100, allow_unicode=True)在我的网址文件中我有这些模式:// urls.pyurlpatterns = [ path('', views.index, name='index'), path('level/<slug:level_slug>', views.level, name=...

如何在python中使用unicode组件计算字符串的数值?【代码】

根据我之前的问题How do I convert unicode characters to floats in Python?,我想找到一个更优雅的解决方案来计算包含unicode数值的字符串的值. 例如,取字符串“1?”和“1?”.我希望这些解决到1.2 我知道我可以逐个字符地迭代,检查每个字符的unicodedata.category(x)==“否”,并通过unicodedata.numeric(x)转换unicode字符.然后我必须拆分字符串并对值求和.然而,这似乎相当黑客和不稳定.在Python中有更优雅的解决方案吗?解决方法...

python3中的unicode和bytes,让编码更流畅!【代码】

最近写了一些python3程序,四处能看到bytes类型,而它并不存在于python2中,这也是python3和python2显著区别之一。 以前在写python2代码的时候,经常会遇到很多编码报错的异常,原因在于python2对unicode的支持不是特别理想。而在python3中,所有编写的代码都是unicode,python解析器在运行的时候,内部都转换(除非你显示定义为bytes类型)为unicode,减少了出错的可能性。Python学习交流群:1004391443 在python3中,有两种字符串...

python – App Engine上的金字塔获取“InvalidResponseError:标题值必须是str,得到’unicode’【代码】

我在OS X 10.7.3上使用Pyramid 1.3和AppEngine 1.6.4 SDK.我使用的是Python 2.7,并且app.yaml中的threadsafe为true.@view_config(route_name='manager_swms', permission='manager', renderer='manager/swms.jinja2') def manager_swms(request):"""Generates blobstore url and passes users swms in swms table"""# generate url for any form upload that may occurupload_url = blobstore.create_upload_url('/upload_swm')use...

Python使用Unicode参数请求URL【代码】

我目前正尝试使用请求库在python中使用日语字符和短语来搜索google tts url,http://translate.google.com/translate_tts. 这是一个例子: http://translate.google.com/translate_tts?tl=ja&q =ひとつ 但是,当我尝试使用python请求库下载端点返回的mp3时,生成的mp3为空.我已经验证我可以在使用非unicode字符(通过romanji)的请求中点击此URL并获得正确的响应. 这是我用来发出请求的代码的一部分langs = {'japanese': 'ja','english'...

什么是unicode()函数的python 2/3兼容替代品?【代码】

有没有python 2 unicode()函数的替代品,可以在兼容python 2和3的代码中使用,并且肯定会在python 2中产生unicode输出? > python 3中不存在unicode()函数> six.u(u’xyz’)在python 2中引发错误 我正在编写测试代码,我肯定想要生成unicode输出,因此如果它与执行路径中某处的非unicode字符串结合,它将在测试中爆炸 – 例如'stuff %s' % u'unistuff'对于一般情况我已经看到它建议只使用str(),但在python 2中不产生unicode. 我想我能做...

Python c-api和unicode字符串【代码】

我需要在python对象和各种编码的c字符串之间进行转换.使用PyUnicode_Decode从c字符串转到unicode对象相当简单,但我不知道如何走另一条路//char* can be a wchar_t or any other element size, just make sure it is correctly terminated for its encoding Unicode(const char *str, size_t bytes, const char *encoding="utf-16", const char *errors="strict"):Object(PyUnicode_Decode(str, bytes, encoding, errors)) {//check...

在python中将unicode文本输出到RTF文件【代码】

我试图从python脚本输出unicode文本到RTF文件.对于背景,Wikipedia说For a Unicode escape the control word \u is used, followed by a 16-bit signed decimal integer giving the Unicode UTF-16 code unit number. For the benefit of programs without Unicode support, this must be followed by the nearest representation of this character in the specified code page. For example, \u1576? would give the Arabic lette...

python – win32gui.AppendMenu中的Unicode字符呈现为问号【代码】

我有一个简单的Python应用程序,它位于Windows XP的系统托盘中.该应用程序使用pywin32(Build 218)作为其GUI并在Python 2.7.6上运行.一切顺利,直到我尝试创建具有Unicode值的菜单项:# -*- coding: utf-8 -*- import win32gui...menu = win32gui.CreatePopupMenu() win32gui.AppendMenu(menu, win32con.MF_STRING, 1, u'Выход')此菜单项呈现为五个问号(‘?????’),而ascii字符串工作正常. 如果我更改Python 3的字符串文字定义并...

有什么方法可以在python 3.x和2.x中统一区分str / unicode和bytes / str?【代码】

在python 2.x中,有一些名为unicode的unicode字符串和一个名为str的字节字符串,它们经常被误用于文本数据,因为它是默认值.幸运的是,python 3.x通过默认为py2 unicode并让用户在处理二进制数据或编码文本时选择了py2 str来解决这个问题.但它也将py2 unicode重命名为str,将py2 str重命名为bytes. 我知道有很多方法可以为3.x和2.x编写代码以区分它们但我想知道关于哪种方法最好的其他意见以及为什么并且可能了解我不知道的方法然而.我也...

python – scrapy:exceptions.AttributeError:’unicode’对象没有属性’dont_filter’【代码】

在scrapy中,我收到错误exception.AttributeError:’unicode’对象没有属性’dont_filter’.在搜索之后,我发现this答案(这是有意义的,因为它是我在获取错误之前修改的唯一代码),据此我修改了我的代码.我改变了start_request以在列表中产生值,而不是将它全部重新整理,但我仍然得到它.有任何想法吗?def start_requests(self):connection = pymongo.Connection(settings['MONGODB_SERVER'],settings['MONGODB_PORT'])db = connection...

Python Pandas DataFrame read_csv UnicodeDecodeError【代码】

我有一个129 MB的CSV文件,包含849,275行和18列.我正在尝试使用read_csv将CSV文件读入pandas DataFrame. 当我使用encoding =’cp1252’时:read_file = pd.read_csv('myfile.csv', encoding='cp1252')错误很长,但最终在底部说:UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 41:character maps to <undefined>当我指定:no encoding,encoding =’utf-8′,或encoding =’utf-8-sig’时,我得到:UnicodeDe...

python – UnicodeDecodeError:’utf8’编解码器无法解码位置0的字节0xc3:意外的数据结束【代码】

我正在编写一个用于阻止推文的代码,但我遇到了编码问题.当我尝试应用porter stemmer时显示错误.也许我无法正确地对其进行标记. 我的代码如下……import sys import pandas as pd import nltk import scipy as sp from nltk.classify import NaiveBayesClassifier from nltk.stem import PorterStemmer reload(sys) sys.setdefaultencoding('utf8')stemmer=nltk.stem.PorterStemmer()p_test = pd.read_csv('TestSA.csv') train = ...