【python与编码】教程文章相关的互联网学习教程文章

Python:使用位.用零和1编码核苷酸【代码】

我想在Python中使用位编码来编码核苷酸’A’,’G’,’C’和’T’.例如:'A' = 00 'G' = 01 'C' = 10 'T' = 11为了建立一个包含k-mers的巨大词典,如:dic = { 'ATGACTGACT':231, 'AAATGACGGAC':500 ... }我认为这可以减少该字典所需的内存量,因为’ATGC’需要4个字节,但同一个字需要8位和位编码. 我不确定是否可以这样做,如果是这样,我怎么能用Python做到这一点 提前致谢! 编辑:对不起,我没有正确解释自己. 我想要的是通过一个由大...

python将字符编码更改为utf_8【代码】

实际数据:CN =用户名,OU = CompanyName,DC =公司,DC = intra(在MySQL数据库中看起来如何)以及当我获取此数据时,这就是python变量中的样子(从MySQL检索):CN = username ,OU =公司名称,DC =公司,DC =帧内 当我试着这个;truestr = unicode(str,'utf-8');使用此消息抛出异常:‘ascii’ codec can’t decode byte 0xc4 in position 4: ordinal not inrange(128)我该如何解决这个问题? (我使用python 2.6)解决方法:你可以通过以下方法...

如何使用Haxe编码的程序执行外部Python脚本?【代码】

我有一个Haxe程序,我需要从Wordnik API检索数据.以下是Wordnik中支持的平台列表:http://developer.wordnik.com/#!/libraries 我没有Wordnik支持的所有这些语言的经验.但是,我认为Python是将Wordnik API连接到我的Haxe程序最可行的方法,因为Python是一种脚本语言,可以从终端命令执行. 也许,像Haxe程序这样的东西用一些参数执行Python.然后Python脚本从Wordnik中检索数据,然后将其编译为JSON或.txt文件.最后返回Haxe程序来解析JSON或...

python基础之while循环及编码初识

while 条件: 循环体 死循环:没有终止条件(修改方法:1.改变条件2.使用break) break 终止当前循环 contiune:跳出本次循环,继续下次循环 break和contione必须在循环体里 while 条件: 循环体 else: 结果 当while循环中出现break,循环就不继续执行l 格式化输出: %s 字符串、数字都能用(比较常用,位置和填充要一一对应) %d 和%i 数字占位符 %%转义 f“{ 变量名(除了特殊字符}” format{} I love hao123.com >>> {a} love {...

python – 如何使用pandas对一系列值进行编码【代码】

我有一个pandas数据框,并且有一个列年龄.我想将其编码为由特定范围分隔的分类值,例如,15岁以下的年龄应为0,15到30之间应更改为1,依此类推. 我找到了这样做的方法(在经历了关于使用&和and的巨大混乱之后)age = X.loc[:, 'Age']age[ age<15 ] = 0 age[ (15<age) & (age<=30) ] = 1 age[ (30<age) & (age<=50) ] = 2 age[ (50<age) & (age<=80) ] = 3这是最好的方式吗?我可以这样做,例如使用LabelEncoder吗?解决方法:你可以使用cut:...

Python 3:CSV utf-8编码【代码】

我正在尝试使用Python 3编写一个带有非ascii字符的CSV.import csvwith open('sample.csv', 'w', newline='', encoding='utf-8') as csvfile:spamwriter = csv.writer(csvfile, delimiter=' ',quotechar='|', quoting=csv.QUOTE_MINIMAL)spamwriter.writerow("嗨")当我打开Excel文件时,请参阅-.我在这里做错了吗?解决方法:您需要向Excel指出这是一个UTF-8文件;它不会自动假设. 您可以通过在文件的开头放置一个Byte Order Mark (BOM...

Python,正则表达式邮政编码搜索【代码】

我正在尝试使用正则表达式在字符串中查找英国邮政编码. 我在RegexBuddy中有正则表达式,见下文:\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b我有一堆地址,想要从中获取邮政编码,例如:123 Some Road Name Town, City County PA23 6NH我将如何在Python中解决这个问题?我知道Python的re模块,但我很难让它工作. 干杯 EEF解决方法:重复你的地址3次邮政编码PA23 6NH,PA2 6NH和PA2Q 6NH作为你的模式测试和使用维基百科的正则...

python – 更正XML编码【代码】

我有一个xml,编码标签设置为’utf-8′.但是,它实际上是iso-8859-1. 以编程方式,我如何在perl和python中检测到这个?以及如何使用不同的编码进行解码? 在perl中,我试过了$xml = decode('iso-8859-1',$file)但是,这不起作用.解决方法:由于随机二进制数据通常代表许多编码中的有效字符串,因此检测错误是非常棘手的. 在Perl中,您可以尝试的最简单的方法是尝试将其解码为utf-8并检查故障. (它只能以这种方式工作; utf-8编码的西方文档几...

使用iso-8859-1编码的主题进行Python IMAP搜索【代码】

从另一个帐户,我给自己发了一封电子邮件,主题是测试版本.现在使用IMAP,我想找到按主题搜索的电子邮件. 在搜索ALL并在输出中查找电子邮件时,我看到:主题:=?ISO-8859-1?Q?Test_de_r = E9ception_en_local?= 现在,用imap搜索,我尝试:M = imaplib.IMAP4_SSL('imap.gmail.com', 993) M.login('user@gmail.com', 'password') M.select('[Gmail]/All Mail')subject = Header(email_model.subject, 'iso-8859-1').encode() #email_m...

python – ElementTree Unicode编码/解码错误【代码】

对于一个项目,我应该增强一些XML并将其存储在一个文件中.我遇到的问题是我不断收到以下错误:Traceback (most recent call last):File "C:\Python27\lib\multiprocessing\process.py", line 258, in _bootstrapself.run()File "C:\Python27\lib\multiprocessing\process.py", line 114, in runself._target(*self._args, **self._kwargs)File "C:\Users\Bart\Dropbox\Studie\2013-2014\BSc-KI\cite_parser\parser.py", line 193, i...

python – ‘charmap’编解码器不能编码字符【代码】

我正在使用tweepy并在屏幕上打印推文消息时出现此错误(Windows).#!/usr/bin/env pythonfrom tweepy import Stream from tweepy import OAuthHandler from tweepy.streaming import StreamListener import json#consumer key, consumer secret, access token, access secret. ckey = 'xyz' csecret = 'xyz' atoken = 'xyz' asecret = 'xyz'class Listener(StreamListener):def on_data(self, data):print json.loads(data)['text']r...

为什么在python中设置从具有不同字符编码的字符串列表中选择第一个元素?【代码】

为什么在Python中使用set()添加以设置具有不同字符编码(ASCII,Unicode)的第一个元素?例如list1, list2 = [u'string' , 'string'], ['string', u'string'] set1, set2 = set(list1), set(list2)当我打印set1和set2时,它们有不同的输出print(set1) (set([u'string'])print(set2) (set(['string']))解决方法:具有相同ASCII内容的Unicode和常规字符串获得相同的哈希并被视为相等:>>> hash(u'string') -9167918882415130555 >>> hash(...

python – Keras – 自动编码器精度为零【代码】

我正在尝试使用autoencoder和Keras检测欺诈.我将以下代码编写为Notebook:import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv) from sklearn.preprocessing import StandardScaler from keras.layers import Input, Dense from keras.models import Model import matplotlib.pyplot as pltdata = pd.read_csv('../input/creditcard.csv') data['normAmount'] = Standard...

002_python的in,while else,格式化输出,逻辑运算符,int与bool转换,编码【代码】

数据 1.什么是数据? x=10,10是我们要存储的数据 2.为何数据要分不同的类型 数据是用来表示状态的,不同的状态就应该用不同的类型的数据去表示 3.数据类型数字 字符串 列表 元组 字典 集合数据类型 1.数字int 数字主要是用于计算用的,使用方法并不是很多,就记住一种就可以:#bit_length() 当十进制用二进制表示时,最少使用的位数 v = 11 data = v.bit_length() print(data) 2.布尔值bool 布尔值就两种:True,False。就是反应条...

Python全栈之路---day03(编码常识、文件操作)【代码】【图】

PART ONE 编码常识 前两天已经初步了解了一下编码的知识,现在先简单进行回顾:ASCII码:包含英文字母,数字,特殊字符与01010101对应关系。 1个字符8位(1个字节) A 00000010 gbk:只包含本国文字(以及英文字母,数字,特殊字符)与0101010对应关系。 A 00001001 8位(1个字节) 中 00000001 00010010 16位(2个字节)Unicode:包含全世界所有的文字与二进制0101001的对应关系。A 00000000 00000000 00001000 1000...