【php系统,python和utf-8】教程文章相关的互联网学习教程文章

如何将Python中的双UTF-8解码器代码转换为Lua【代码】

我有这个旧代码片段,(显然)它将经过双重编码的UTF-8文本解码回普通的UTF-8:# Run with python3! import codecs import sys s=codecs.open('doubleutf8.dat', 'r', 'utf-8').read() sys.stdout.write(s.encode('raw_unicode_escape').decode('utf-8'))我需要将其翻译为Lua,并模仿所有可能的解码副作用(如果有). 局限性:我可以使用任何可用的Lua模块进行UTF-8处理,但最好使用稳定的模块,并带有LuaRocks支持.我不会使用Lupa或其他Lu...

Python强制dict条目为utf-8【代码】

我花了一个下午的大部分时间来尝试修补字典对象以utf-8编码代替unicode.我试图找到扩展词典对象的最快,性能最好的方法,并确保其条目,键和值均为utf-8. 这是我想出的,它可以完成工作,但是我想知道可以进行哪些改进.class UTF8Dict(dict):def __init__(self, *args, **kwargs):d = dict(*args, **kwargs)d = _decode_dict(d)super(UTF8Dict,self).__init__(d)def __setitem__(self,key,value):if isinstance(key,unicode):key = key....

Python:UTF-8十六进制到UTF-16十进制【代码】

我有一个汉字汉字“烷烃”(U 70F7),UTF-8(十六进制)-0xE7 0x83 0xB7(e783b7)的表示形式.(请参见http://www.fileformat.info/info/unicode/char/70f7/index.htm) 我需要将此字符串’e783b7’转换为十进制值28.919(UTF-16十进制). 我现在要花一个小时来解决这个问题,所以我认为对stackoverflow进行询问会更快 非常感谢 眼镜蛇博士解决方法:使用ord内置函数,如下所示:>>> print('\u70f7') 烷 >>> print(ord('\u70f7')) 28919如果只有...

如何在Python中将UTF-8加密成A-Z以外的形式?【代码】

许多年前,我在Windows上用C#编写了一个程序,该程序使用caeser chipher(我原本以为是)“加密”文本文件. 那时,我想要的字符不仅是A-Z,0-9,而且使之成为可能,但从未考虑过背后的实际理论. 查看一些文件,并将其与this website进行比较,看来UTF-8正在转移. 我启动了Windows VM(因为现在正在使用Linux)并输入了以下内容:abcdefghijklmnopqrstuvwxyz 它生成了一个类似于十六进制的文本(移位了15次):70 71 72 73 74 75 76 77 78 79 7a 7...

python%s格式说明符无法输入utf-8值【代码】

我有以下将数据推送到db的python代码:cursor.execute("INSERT INTO "+ DATA_TABLE + """ (fk_id, title, streetaddress,json) values (%(fk_id)s, %(title)s, %(address)s, %(json)s ) """ ,(result))但是我得到了错误:File "/usr/lib/pymodules/python2.6/MySQLdb/connections.py", line 185, in unicode_literalreturn db.literal(u.encode(unicode_literal.charset)) UnicodeEncodeError: 'latin-1' codec can't encode chara...

在Python 3中有没有更短或更快速的字节(str(some_variable),’utf-8′)替代方案?【代码】

例如,将5638463263这样的整数转换为“字节字符串化”版本的最佳方法是什么? b’5638463263’? 我可以写字节(str(5638463263),’utf-8′),但这对我来说有点冗长.有速记或标准库功能可以更好地做到这一点吗?解决方法: str(5638463263).encode()更短. 在Python 3.2和更高版本中,str.encode使用’utf-8’作为默认编码.

在Python 3中从utf-16转换为utf-8【代码】

我正在用Python 3编程,但遇到一个小问题,我在网上找不到任何引用. 据我了解默认字符串是utf-16,但我必须使用utf-8,我找不到将默认字符串转换为utf-8的命令.非常感谢您的帮助.解决方法:在Python 3中,使用字符串操作时,有两种重要的数据类型很重要.首先是字符串类,它是表示unicode代码点的对象.重要的是,该字符串不是字节,而是一个字符序列.其次,存在字节类,它只是字节序列,通常表示存储在编码中的字符串(如utf-8或iso-8859-15). 这对...

python – Pandas df.to_csv(“file.csv”encode =“utf-8”)仍为减号提供垃圾字符【代码】

我已经阅读了关于Pandas’to_csv(……等等)的Python 2限制的内容.我打了吗?我在使用Python 2.7.3 当它们出现在字符串中时,这会产生≥和 – 的垃圾字符.除此之外,出口是完美的.df.to_csv("file.csv", encoding="utf-8") 有没有解决方法? df.head()是这样的:demography Adults ≥49 yrs Adults 18?49 yrs at high risk|| state Alabama 32.7 ...

Python IMAP:=?utf-8?Q?在主题字符串中【代码】

我正在使用IMAP显示新电子邮件,一切看起来都很好,除了一个邮件主题显示为: =?UTF-8 Q +主题?= 我该如何解决?解决方法:在MIME术语中,那些编码的块称为编码字.您可以像这样解码它们:import email.Header text, encoding = email.Header.decode_header('=?utf-8?Q?Subject?=')[0]查看email.Header的文档以获取更多详细信息.

Python CGI – UTF-8不起作用【代码】

对于HTML5和Python CGI: 如果我写UTF-8元标记,我的代码不起作用.如果我不写,它就有效. 页面编码是UTF-8.print("Content-type:text/html") print() print("""<!doctype html><html><head><meta charset="UTF-8"></head><body>?????ü</body></html> """)此代码不起作用.print("Content-type:text/html")print()print("""<!doctype html><html><head></head><body>?????ü</body></html>""")但这个代码有效.解决方法:从https://ru.sta...

将Python列表编码为UTF-8【代码】

我有一个python列表,看起来像这样:list = [u'a', u'b', u'c']现在我想用UTF-8编码.因此,我应该使用:list = list[0].encode("utf-8")但打印列表只给出a意思是列表的第一个元素.甚至不再是列表了.我究竟做错了什么?解决方法: >>> items = [u'a', u'b', u'c'] >>> [x.encode('utf-8') for x in items] ['a', 'b', 'c']

为什么Python不识别我的utf-8编码源文件?【代码】

这是一个带有非ASCII字符的tmp.py:if __name__ == "__main__":s = '?'print(s)运行它我收到以下错误:Traceback (most recent call last):File ".\tmp.py", line 3, in <module>print(s)File "C:\Python32\lib\encodings\cp866.py", line 19, in encodereturn codecs.charmap_encode(input,self.errors,encoding_map)[0] UnicodeEncodeError: 'charmap' codec can't encode character '\xdf' in position 0: character maps to <u...

python – sys.setdefaultencoding(‘utf-8’)的危险【代码】

在Python 2中有一种令人沮丧的设置sys.setdefaultencoding(‘utf-8’)的趋势.任何人都可以列出问题的真实例子吗?这样的论点是有害的,或者隐藏错误听起来不是很有说服力. 更新:请注意,这个问题只是关于utf-8,它不是关于改变默认编码“一般情况下”. 如果可以,请举一些代码示例.解决方法:原始海报要求提供代码,证明交换机是有害的 – 除了它“隐藏”与交换机无关的错误. 结论摘要 根据我收集的经验和证据,以下是我得出的结论. >现在...

php系统,python和utf-8【代码】

我有一个运行得很好的python程序.它连接到多个网站并输出所需的信息.由于并非所有网站都使用utf-8进行编码,因此我从头部请求字符集并使用unicode(字符串,编码)方法进行解码(我不确定它是否适合这样做但是效果很好).当我运行python程序时,我没有收到???标记,它工作正常.但是当我使用php的系统函数运行程序时,我收到此错误:UnicodeEncodeError: 'ascii' codec can't encode character u'\u0131' in position 41: ordinal not in ran...

使用以utf-8编码的主题进行Python IMAP搜索【代码】

这个问题与问题Python IMAP search using a subject encoded with iso-8859-1有关,但那里给出的答复对我不起作用. 我在python中进行以下IMAP搜索:typ, data = self.M.search("utf-8", "(SUBJECT %s)" % u"réception".encode("utf-8"))我得到以下异常:...typ, data = self.M.search("utf-8", "(SUBJECT %s)" % u"réception".encode("utf-8"))File "/usr/local/python/2.7.2/lib/python2.7/imaplib.py", line 625, in searchtyp, d...