【python词典的编码指南】教程文章相关的互联网学习教程文章

使用python将所有csv文件从编码的ansi转换为utf8【代码】

我有如下的python代码:import os from os import listdirdef find_csv_filenames( path_to_dir, suffix=".csv" ):filenames = listdir(path_to_dir)return [ filename for filename in filenames if filename.endswith( suffix ) ]#always got the error this below code filenames = find_csv_filenames('C:\casperjs\project\teleservices\csv') for name in filenames:print name我遇到错误:filenames = find_csv_filenames('...

使用Python进行简单的ascii url编码【代码】

看那个:import urllib print urllib.urlencode(dict(bla='?'))输出是bla=%C3%BC我想要的很简单,我希望输出为ascii而不是utf-8,所以我需要输出:bla=%C3如果我尝试:urllib.urlencode(dict(bla='?'.decode('iso-8859-1')))不起作用(我所有的python文件都是utf-8编码的): ‘ascii’编解码器无法在位置0-1处编码字符:序数不在范围内(128) 在生产中,输入未编码.解决方法:看看unicode transliteration in python:from unidecode imp...

python – 标签编码具有相同类别的多个列【代码】

考虑以下数据帧:import pandas as pd from sklearn.preprocessing import LabelEncoderdf = pd.DataFrame(data=[["France", "Italy", "Belgium"], ["Italy", "France", "Belgium"]], columns=["a", "b", "c"]) df = df.apply(LabelEncoder().fit_transform) print(df)它目前输出:a b c 0 0 1 0 1 1 0 0我的目标是通过传递我想要共享分类值的列来使其输出类似的内容:a b c 0 0 1 2 1 1 0 2解决方法:传递axis=1为...

Python地理编码按距离过滤【代码】

我需要过滤近地点的地理编码到一个位置.例如,我想过滤餐馆地理编码列表,以识别距离我当前位置10英里范围内的餐馆. 有人能指出我将一个距离转换为纬度和功能的功能吗?经度三角洲?例如:class GeoCode(object):"""Simple class to store geocode as lat, lng attributes."""def __init__(self, lat=0, lng=0, tag=None):self.lat = latself.lng = lngself.tag = Nonedef distance_to_deltas(geocode, max_distance):"""Given a geo...

如何使用python解码和编码网页?【代码】

我使用Beautifulsoup和urllib2下载网页,但不同的网页有不同的编码方法,如utf-8,gb2312,gbk.我用urllib2获取sohu的主页,用gbk编码,但在我的代码中,我也用这种方式解码其网页:self.html_doc = self.html_doc.decode('gb2312','ignore')但是,在使用BeautifulSoup将它们解码为unicode之前,我如何知道页面使用的编码方法?在大多数中文网站中,http Header字段中没有内容类型.解决方法:使用BeautifulSoup,您可以解析HTML并访问original_...

Python:UnicodeEncodeError:’latin-1’编解码器不能编码字符【代码】

我正处于一个我打电话给api的场景,根据api的结果我为api中的每条记录调用数据库.我的api调用返回字符串,当我通过api为数据库调用返回的项时,对于某些元素,我得到以下错误.Traceback (most recent call last):File "TopLevelCategories.py", line 267, in <module>cursor.execute(categoryQuery, {'title': startCategory});File "/opt/ts/python/2.7/lib/python2.7/site-packages/MySQLdb/cursors.py", line 158, in executequery ...

一文透彻掌握 Python 编码问题【图】

一、当我说字符时,我在说什么? 当我们提起字符串时,每个程序员都能理解到,我们说的是一个字符序列。但是,当我们说字符时,很多人就困惑了。 写在纸上的字符很容易辨识,但是为了将不同的字符在计算机中标识出来,人类发明了unicode字符。简单讲,unicode可以看成是一个标准的函数,它将一个具体的字符映射成0-1114111之间的一个数字,这个数字叫做码位。通常,码位用十六进制表示,并且前面会加上“U+”的字样。例如,字母A的...

致命的Python错误:Py_Initialize:无法初始化sys标准流LookupError:未知编码:65001【代码】

当尝试使用pip安装某些软件包时,我遇到了一个错误. 即使切换Python环境,也会出现同样的错误.所以从我的角度来看,这不是我想要安装的软件包的问题,??可能是Python的环境有一些问题.任何人都可以帮助我吗? 环境: > Windows 10> Anaconda 4.5.2> Python3.6>点10.0.1 以下是命令中的消息:C:\WINDOWS\system32>activate py36_tfg(py36_tfg) C:\WINDOWS\system32>deactivate Fatal Python error: Py_Initialize: can't initialize sys...

Python中的离线反向地理编码

我正在编写一个Python脚本,它将纬度和经度传递给模块,并执行反向地理编码功能以返回该位置的地址.我一直在使用谷歌的PyGeoCoder来做这件事,但它需要访问互联网.我需要类似于PyGeoCoder的东西,但开源并完全脱机.解决方法:你考虑过使用OpenStreetMap吗?如果您需要特定区域,可以下载整个database (the “planet”)或extracts之一.之后,您可以filter addresses全部使用结果数据进行地理编码. OSM有几个search engines,最受欢迎的是Nom...

Python实时编码/调试【代码】

有没有办法在程序执行期间产生交互式python控制台(最好是iPython)而不会暂停主程序并能够检查和修改程序变量?类似于浏览器为JavaScript提供的东西. 我知道pdb.set_trace()和IPython.embed(),但它们都暂停程序执行并需要将它们放在程序源代码中的某个位置. 这对于python中的桌面游戏开发来说非常有用.解决方法:你可以通过线程自己滚动一下:#!/usr/bin/python3def _spawn_background_interpreter(*args,**kwargs):from threading i...

Python 常用编码规范【代码】

一、简明概述 1、编码 如无特殊情况, 文件一律使用 UTF-8 编码 如无特殊情况, 文件头部必须加入#-*-coding:utf-8-*-标识 2、代码格式 2.1、缩进 统一使用 4 个空格进行缩进 2.2、行宽 每行代码尽量不超过 80 个字符(在特殊情况下可以略微超过 80 ,但最长不得超过 120) 理由: 这在查看 side-by-side 的 diff 时很有帮助 方便在控制台下查看代码 太长可能是设计有缺陷 2.3、引号 简单说,自然语言使用双引号,机器标示使用单引号,...

python – 如何检测字符串字节编码?【代码】

我有大约1000个由os.listdir()读取的文件名,其中一些是用UTF8编码的,有些是CP1252. 我想将它们全部解码为Unicode,以便在我的脚本中进一步处理.有没有办法让源编码正确解码为Unicode? 例:for item in os.listdir(rootPath):#Convert to Unicodeif isinstance(item, str):item = item.decode('cp1252') # or item = item.decode('utf-8')print item解决方法:如果你的文件在cp1252和utf-8中,那么有一个简单的方法.import logging d...

python – Matplotlib:图例中的颜色编码文本而不是行【代码】

在某些LCD显示器上,图例中水平线的颜色很难区分. (见附图).因此,不是在图例中画一条线,是否可以只对文本本身进行颜色编码?换句话说,蓝色为“y = 0x”,绿色为“y = 1x”等…import matplotlib.pyplot as plt import numpy as npx = np.arange(10)fig = plt.figure() ax = plt.subplot(111)for i in xrange(5):ax.plot(x, i * x, label='$y = %ix$' % i)ax.legend()plt.show()PS.如果线条可以在图例中变厚,但在图表中没有,这也可以....

python运算符和编码初识【代码】【图】

1. 运算符 计算机可以进行的运算有很多种,可不只加减乘除这么简单,运算按种类可分为算数运算、比较运算、逻辑运算、赋值运算、成员运算、身份运算、位运算.算数运算以下假设变量:a=10,b=20比较运算以下假设变量:a=10,b=20赋值运算以下假设变量:a=10,b=20逻辑运算针对逻辑运算的进一步研究: 在没有()的情况下not 优先级高于 and,and优先级高于or,即优先级关系: ( )>not>and>or,同一优先级从左往右计算。 例题: 判断下列...

Python 2假定了不同的源代码编码【代码】

我注意到,如果没有源代码编码声明,Python 2解释器假定源代码使用脚本和标准输入以ASCII编码:$python test.py # where test.py holds the line: print u'é'File "test.py", line 1 SyntaxError: Non-ASCII character '\xc3' in file test.py on line 1, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details$echo "print u'é'" | pythonFile "/dev/fd/63", line 1 SyntaxError: Non-ASCII character ...