首页 / PYTHON / python – 将列表转换为字典时的速度问题

python – 将列表转换为字典时的速度问题

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – 将列表转换为字典时的速度问题，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2813字，纯文字阅读大概需要5分钟。

内容图文

我有一些关于将列表转换为字典的速度问题,其中以下操作占用总运行时间的约90％：

def list2dict(list_):
    return_dict = {}

    for idx, word in enumerate(list_):
        if word in return_dict:
            raise ValueError("duplicate string found in list: %s" % (word))
        return_dict[word] = idx

    return return_dict

我有麻烦看到它究竟是什么导致了这一点.您是否在代码中看到了明显的瓶颈,或者有关如何加快速度的建议？

谢谢.

解决方法:

编辑：

想象一下,我把它放在首位,因为它更大 – 事实证明,对OP代码的一个小调整会给性能带来很大的提升.

def list2dict(list_):    # OLD
    return_dict = {}
    for idx, word in enumerate(list_):
        if word in return_dict: # this compare is happening every iteration!
            raise ValueError("duplicate string found in list: %s" % (word))
        return_dict[word] = idx
    return return_dict

def list2dictNEW(list_): #NEW HOTNESS
    return_dict = {}
    for idx, word in enumerate(list_):
        return_dict[word] = idx # overwrite if you want to, because...
    if len(return_dict) == len(list_): return return_dict
    # if the lengths aren't the same, something got overwritten so we
    # won't return. If they ARE the same, toss it back with only one
    # compare (rather than n compares in the original
    else: raise ValueError("There were duplicates in list {}".format(list_))

DEMO:
>>> timeit(lambda: list2dictNEW(TEST))
1.9117132451798682
>>> timeit(lambda: list2dict(TEST)):
2.2543816669587216
# gains of a third of a second per million iterations!
# that's a 15.2% speed bost

没有明显的答案,但你可以尝试类似的东西：

def list2dict(list_):
    return_dict = dict()
    for idx,word in enumerate(list_):
        return_dict.setdefault(word,idx)
    return return_dict

您也可以构建一个set并执行list.index,因为您说列表相当小,但我认为这样会比较慢而不是更快.这需要分析才能确定(使用timeit.timeit)

def list2dict(list_):
    set_ = set(list_)
    return {word:list_.index(word) for word in set_}

我冒昧地在一组测试数据上运行一些配置文件.结果如下：

TEST = ['a','b','c','d','e','f','g','h','i','j'] # 10 items

def list2dictA(list_): # build set and index word
    set_ = set(list_)
    return {word:list_.index(word) for word in set_}

def list2dictB(list_): # setdefault over enumerate(list)
    return_dict = dict()
    for idx,word in enumerate(list_):
        return_dict.setdefault(word,idx)
    return return_dict

def list2dictC(list_): # dict comp over enumerate(list)
    return_dict = {word:idx for idx,word in enumerate(list_)}
    if len(return_dict) == len(list_):
        return return_dict
    else:
        raise ValueError("Duplicate string found in list")

def list2dictD(list_): # Original example from Question
    return_dict = {}
    for idx, word in enumerate(list_):
        if word in return_dict:
            raise ValueError("duplicate string found in list: %s" % (word))
        return_dict[word] = idx
    return return_dict

>>> timeit(lambda: list2dictA(TEST))
5.336584700190931
>>> timeit(lambda: list2dictB(TEST))
2.7587691306531
>>> timeit(lambda: list2dictC(TEST))
2.1609074989233292
>>> timeit(lambda: list2dictD(TEST))
2.2543816669587216

内容总结

以上是互联网集市为您收集整理的python – 将列表转换为字典时的速度问题全部内容，希望文章能够帮你解决python – 将列表转换为字典时的速度问题所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/777928.html

来源：【匿名】

【上一篇】在python中搜索字符串中的模式【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python – 将列表转换为字典时的速度问题】教程文章相关的互联网学习教程文章

python文件编码转换流程【图】

python文件编码转换流程python默认字符创编码是unicodepython文件编码跟变量编码是两个东西exampl#-*- coding:utf-8 -*-ss = "你好" #这个变量的默认编码是unicode#此python文件的默认编码是utf-8 原文：https://www.cnblogs.com/hhjmessage/p/8302158.html

python中时间戳，datetime 和时间字符串之间得转换【代码】

# datetime时间转为字符串def Changestr(datetime1): str1 = datetime1.strftime(‘%Y-%m-%d %H:%M:%S‘) return str1# 字符串时间转为时间戳def Changetime(str1): Unixtime = time.mktime(time.strptime(str1, ‘%Y-%m-%d %H:%M:%S‘)) return Unixtime# datetime时间转为时间戳def Changestamp(dt1): Unixtime = time.mktime(time.strptime(dt1.strftime(‘%Y-%m-%d %H:%M:%S‘), ‘%Y-%m-%d %H:%M:%S‘)) re...

Python之xlsx文件与csv文件相互转换【代码】

1 xlsx文件转csv文件import xlrd import csvdef xlsx_to_csv():workbook = xlrd.open_workbook(‘1.xlsx‘)table = workbook.sheet_by_index(0)with codecs.open(‘1.csv‘, ‘w‘, encoding=‘utf-8‘) as f:write = csv.writer(f)for row_num in range(table.nrows):row_value = table.row_values(row_num)write.writerow(row_value)if __name__ == ‘__main__‘:xlsx_to_csv()2 使用第三方库pandas将xlsx文件转csv文件import pa...

Python 密文转换为明文【代码】【图】

需求输入一串字符如果碰到小写或大写字母，进行转换，a——z，b——y，c——x，大写字母也是如果是其他字符，就按原样输出判断逻辑小写字母　　cond_a_z大写字母　　cond_A_Z既不是小写，也不是大写　　else具体的判断，比如小写字母：（大写也类似） offset_a　　输入的字符跟a的距离，那么（倒退回来的那个跟z的距离 == 输入的字符跟a的距离），尤其可以得到，最终的那个字符的位置 offset_zoffset_z　　最终转换的字符的ASCII...

python 强制类型转换以及 try expect【代码】

强制类型转换：　　字符串 --> 整型：　　字符串第一个是 + 或者 - ，会直接去掉符号，返回数字　　　　如：1 a = ‘+123456‘2 s = int(a) 34print(s) 56 s = 123456 　　如果字符串非法，则返回 False 　　　　如：1 a = ‘+123+456‘2 s = int(a) 34print(s) 56 结果;ValueError: invalid literal for int() with base 10: ‘+123+456‘ 牛客网：题目：把字符串转化为整数题目描述将一个字符串转换成一个整数，...

python将url转换成二维码【图】

准备环境python生成二维码，需要依赖包qrcode和PIL（二维码的实质就是一个url。）python3安装PIL：pip install PILpython2安装PIL：pip install pillow 生成二维码的方法1.将url生成二维码的最简单的示例如下：import qrcodeimg=qrcode.make("www.zhuanzhuan.com")img.save("./test.png") 2.可以通过qrcode的一些配置项来更改生成二维码的样式，比如宽度、大小、容错系数qr=qrcode.QRCode( version=2, error_correction=qrco...

python数据类型之间的转换

对python内置的数据类型进行转换时，可以使用内置函数，常用的类型转换函数如下python常用类型转换函数函数格式使用示例描述int(x [,base])int("8") 可以转换的包括String类型和其他数字类型，但是会丢失精度 float(x) float(1)或者float("1") 可以转换String和其他数字类型，不足的位数用0补齐，例如1会变成1.0 complex(real ,imag) complex("1")或者complex(1,2) 第一个参数可以是String或者数字，第二个参数只能为数字类...

Python 时间字符串和时间戳之间的转换

1.将字符串的时间转换为时间戳方法: a = "2013-10-10 23:40:00" 将其转换为时间数组 import time timeArray = time.strptime(a, "%Y-%m-%d %H:%M:%S") 转换为时间戳: timeStamp = int(time.mktime(timeArray)) timeStamp == 13814196002.字符串格式更改如a = "2013-10-10 23:40:00",想改为 a = "2013/10/10 23:40:00" 方法:先转换为时间数组,然后转换为其他格式 timeArray = t...

gcj02,bd09,wgs 左边转换python,excel

# -*- coding: utf-8 -*-import jsonimport requestsimport mathimport xlrdimport xlwtfrom xlutils.copy import copyimport osx_pi = 3.14159265358979324 * 3000.0 / 180.0pi = 3.1415926535897932384626 # πa = 6378245.0 # 长半轴ee = 0.00669342162296594323 # 偏心率平方class Geocoding: def __init__(self, api_key): self.api_key = api_key def geocode(self, address): """ 利用高德ge...

SnowNLP：?中文分词?词性标准?提取文本摘要,?提取文本关键词,?转换成拼音?繁体转简体的处理中文文本的Python3 类库

SnowNLP是一个python写的类库，可以方便的处理中文文本内容，是受到了TextBlob的启发而写的，由于现在大部分的自然语言处理库基本都是针对英文的，于是写了一个方便处理中文的类库，并且和TextBlob不同的是，这里没有用NLTK，所有的算法都是自己实现的，并且自带了一些训练好的字典。Features ? 中文分词（Character-Based Generative Model） ? 词性标准（TnT 3-gram 隐马） ? 情感分析（现在训练数据主要是买卖东西时的评价，所以...

Python-OpenCV——Morphological Transformations(形态学转换)【代码】【图】

目标这一节我们将学习不同的形态学操作，如腐蚀、膨胀、开、闭......我们将看到不同的函数，如：cv2.erode()、cv2.dilate()、cv2.morphology()理论形态变换是基于图像形状的一些简单操作。它通常在二进制图像上执行。它需要两个输入，一个是我们的原始图像，第二个是称为结构元素或内核，它决定了操作的本质。两个基本的形态学运算符是侵蚀和膨胀。然后它的变体形式如Opening，Closing，Gradient等也发挥作用。我们将在以下图...

[Tips] python numpy 多维矩阵结构和一维结构的等价转换【代码】

假设aa是原始多维矩阵，bb是转换的一维向量，转换方式：bb=aa.reshape(-1) 将bb转换回aa的方法是：cc=bb.reshape(aa.shape) 验证：>>> aa array([[[ 8, 15],[ 0, 8],[-10, 0],[ -5, 2],[ -2, -4]],[[ 7, 4],[-14, 7],[ 20, -7],[ -7, -11],[-18, 8]],[[ 26, -3],[ 12, 0],[ -8, -19],[ 18, -12],[ 3, -5]]], dtype=int32) >>> aa.shape (3, 5, 2) >>> bb=aa.reshape(-1) >>> bb array([ 8, 15, 0, 8,...

首页 / PYTHON / python – 将列表转换为字典时的速度问题

python – 将列表转换为字典时的速度问题

内容导读

内容图文

内容总结

内容备注

内容手机端

【python – 将列表转换为字典时的速度问题】教程文章相关的互联网学习教程文章

python文件编码转换流程【图】

python中时间戳，datetime 和时间字符串之间得转换【代码】

Python之xlsx文件与csv文件相互转换【代码】

Python 密文转换为明文【代码】【图】

python 强制类型转换以及 try expect【代码】

python将url转换成二维码【图】

python数据类型之间的转换

Python 时间字符串和时间戳之间的转换

gcj02,bd09,wgs 左边转换python,excel

SnowNLP：?中文分词?词性标准?提取文本摘要,?提取文本关键词,?转换成拼音?繁体转简体的处理中文文本的Python3 类库

Python-OpenCV——Morphological Transformations(形态学转换)【代码】【图】

[Tips] python numpy 多维矩阵结构和一维结构的等价转换【代码】

python 使用eval() 可以将json格式的数据,转换为原始数据

Python练习【3】【罗马数字转换/查找公共前缀】【图】

python 将日期戳（五位数时间）转换为标准时间【代码】【图】

PYTHON - 相关标签

字典 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程