【python – 按索引更新列表元素】教程文章相关的互联网学习教程文章

python – 对于存在的索引,我得到的List索引超出范围错误【代码】

我使用feed解析器来获取rss对象.我跑的时候live_leak.links我明白了[{'type': 'text/html', 'rel': 'alternate', 'href': 'http://www.liveleak.com/view?i=abf_1476121939'}, {'type': 'application/x-shockwave-flash', 'rel': 'enclosure', 'href':'http://www.liveleak.com/e/abf_1476121939'}]但是,当我尝试这个live_leak.links[1]我得到列表索引超出范围,请注意,这是在早些时候工作然后突然间这不起作用.我在我的代码中有这...

python – 如何确定在Pandas DataFrame中将哪些列设置为索引?

假设我有一个金融证券的数据框架,它通常有多个标识符:我应该只选择一列作为索引吗?我应该将所有潜在标识符设置为索引吗?我应该将所有文本数据设置为索引,并将所有数字数据保留为列吗?什么是最佳做法?解决方法:这更多是关于数据库设计而不是熊猫. 决策应基于数据框(关系数据库中的表)及其列的业务含义.例如,如果“内部安全ID”用于识别其业务中的此类数据,则应将其设置为索引. 但是,如果您不确定,请坚持使用默认的整数索引.

python – 使用单个索引项的numpy子矩阵3D【代码】

我有一个3D numpy数组:K = (np.arange(36)).reshape((4,3,3))+1 [[[ 1 2 3] [ 4 5 6] [ 7 8 9]][[10 11 12] [13 14 15] [16 17 18]][[19 20 21] [22 23 24] [25 26 27]][[28 29 30] [31 32 33] [34 35 36]]]其中K中的每个项目都是矩阵.现在,我想使用某个索引向量获取所有2D子矩阵 我知道这有可能:idx = np.s_[:,:2,:2] K_sub = K[idx] [[[ 1 2] [ 4 5]][[10 11] [13 14]][[19 20] [22 23]][[28 29] [31 32]]]问题是我想使...

python – Numpy沿轴应用并获取行索引【代码】

我有一个2D数组(它实际上非常大,另一个数组的视图):x = np.array([[0, 1, 2],[1, 2, 3],[2, 3, 4],[3, 4, 5]])我有一个处理数组的每一行的函数:def some_func(a):"""Some function that does something funky with a row of numbers"""return [a[2], a[0]] # This is not so funkynp.apply_along_axis(some_func, 1, x)我正在寻找的是调用np.apply_along_axis函数的一些方法,以便我可以访问行索引(对于正在处理的行),然后能够使...

python – 需要一个适当的数据结构或索引,以便根据3d点和重要性因素进行快速用户查找【代码】

我有大量的3D点与重要性因素配对. 每个用户有六分.例如:查理人有6分:(22,44,55)是他的第一个重要因子为3分,(10,0,0)是他的第二个向量,重要因子为2.8,一直到他的第六点是(100,300,200),重要性因子为0.4. 我想做的是找到与查理最相似的人,而不是遍历每一个人.基本上为每个用户最小化此功能(即,将该用户的正确六点与Charlie匹配):pythagoras(point, point2) * max(importance_factor, importance_factor2) * (abs(importance_facto...

python 索引+切片+步长

python 索引+切片+步长 # 索引+切片+步长 # [1] 索引:第几位数字 # [1:7] 切片:范围从几到几 # [::2] 步长:间隔几步 # 切片特点:顾头不顾尾最后一位不输出name = "0123456789" # 正数 从左往右 #无数字[::] 从开始到结尾=[0::](某个位置不指定的时候默认取最后或最前位置) print(name[:])# 取所有范围输出0123456789 print(name[0::])# 输出0123456789# 数字[1] 索引第二个 print(name[1])# 输...

python – 使用带有索引或解析行的readlines()吗?【代码】

我正在创建一个简单的测试函数,通过从文件读取要评估的表达式和预期结果来断言我正在开发的解释器的输出是正确的,就像python的doctest一样.这是针对方案的,因此输入文件的示例将是> 42 42> (+ 1 2 3) 6我第一次尝试解析这样一个文件的函数如下所示,它似乎按预期工作:def run_test(filename):interp = Interpreter()response_next = Falsenum_tests = 0with open(filename) as f:for line in f:if response_next:assert response =...

python – Numpy非零/ flatnonzero索引顺序;布尔索引中返回元素的顺序【代码】

我想知道numpy.nonzero / numpy.flatnonzero返回的索引的顺序. 我在文档中找不到任何关于它的内容.它只是说:A[nonzero(flag)] == A[flag]虽然在大多数情况下这已足够,但有些时候需要一个排序的索引列表.是否保证返回的索引在1-D的情况下排序,或者我需要明确地对它们进行排序? (类似的问题是简单地通过选择一个布尔数组(A [flag])返回的元素的顺序,根据文档必须相同.) 示例:查找标志中True元素之间的“间隙”:flag=np.array([Tr...

python – 对numpy中的分区索引进行分组argmax / argmin【代码】

Numpy的ufuncs有一个reduceat方法,它在一个数组中的连续分区上运行它们.所以不要写:import numpy as np a = np.array([4, 0, 6, 8, 0, 9, 8, 5, 4, 9]) split_at = [4, 5] maxima = [max(subarray for subarray in np.split(a, split_at)]我可以写:maxima = np.maximum.reduceat(a, np.hstack([0, split_at]))两者都将在切片a [0:4],[4:5],[5:10]中返回最大值,为[8,0,9]. 我想要一个类似的函数来执行argmax,注意我只想在每个分...

python – numpy多维索引和对角线对称【代码】

我有一个非常大的numpy阵列……power = ... print power.shape >>> (3, 10, 10, 19, 75, 10, 10)这是对称的w.r.t. 1010部分,即以下2-d矩阵是对称的power[i, :, :, j, k, l, m] power[i, j, k, l, m, :, :]对于i,j,k,l,m的所有值 我可以利用这个因子-4的增益吗?例如.将矩阵保存到文件时(使用savez_compressed 50 mb) 我的尝试:size = 10 row_idx, col_idx = np.tril_indices(size) zip_idx = zip(row_idx, col_idx) print len(zip...

如何创建带负索引的python列表【代码】

我是python的新手,需要创建一个负索引的列表,但到目前为止还没有成功. 我正在使用此代码:a = [] for i in xrange( -20, 0, -1 ):a[i] = -(i)log.info('a[{i}]={v}'.format(i=i, v=a[i])) else:log.info('end')并将日志输出作为end顺便说一句,我正在使用一个站点调用quantopian,所以log.info来自他们的基础设施,只是将输出打印到Web控制台. 我究竟做错了什么? 在此先感谢您的帮助.解决方法:如果您使用的是Quantopian,建议您熟悉nu...

python – DataFrame.stack()之后的新索引级别名称【代码】

(请注意,this SO question看起来很相似,但不同.) 我有一个MultiIndexed DataFrame,其中的列表示年度数据:>>> x = pd.DataFrame({'country': {0: 4.0, 1: 8.0, 2: 12.0},'series': {0: 553.0, 1: 553.0, 2: 553.0}, '2000': {0: '1100', 1: '28', 2: '120'},'2005': {0: '730', 1: '24', 2: '100'} }).set_index(['country', 'series']) >>> x2000 2005 country series 4 553 1100 730 8 553 28...

从ElasticSearch索引在Python中创建术语 – 文档矩阵

ElasticSearch新手在这里.我有一组文本文档,我通过Python ElasticSearch客户端使用ElasticSearch编制索引.现在我想用Python和scikit-learn对文档进行一些机器学习.我需要完成以下任务. >使用ElasticSearch分析器处理文本(词干,小写等)>从索引中检索已处理的文档(或分析的标记).>将处理后的文档转换为术语 – 文档矩阵进行分类(可能使用scikit-learn中的CountVectorizer).或者,也许有一些方法直接从ElasticSearch检索TDM. 我无法考虑...

python – 熊猫滚动总和与不均匀间隔索引【代码】

我有一个数据框,其中包含不同产品的每周销售额(a,b,c).如果某一周(例如第4周)的销售额为零,则该周没有记录:In[1] df = pd.DataFrame({'product': list('aaaabbbbcccc'),'week': [1, 2, 3, 5, 1, 2, 3, 5, 1, 2, 3, 4],'sales': np.power(2, range(12))}) Out[1]product sales week 0 a 1 1 1 a 2 2 2 a 4 3 3 a 8 5 4 b 16 1 5 b 3...

python – pandas多索引切片“级别类型不匹配”【代码】

我从0.13.1移动到pandas版本0.17,我在切片时遇到了一些新的错误.>>> dfdate int data 0 2014-01-01 0 0 1 2014-01-02 1 -1 2 2014-01-03 2 -2 3 2014-01-04 3 -3 4 2014-01-05 4 -4 5 2014-01-06 5 -5 >>> df.set_index("date").ix[datetime.date(2013,12,30):datetime.date(2014,1,3)]int data date 2014-01-01 0 0 2014-01-02 1 -1 2014-01-03 ...

元素 - 相关标签