首页 / PYTHON / Python中包含一百万个元素的列表会占用多少内存？

Python中包含一百万个元素的列表会占用多少内存？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python中包含一百万个元素的列表会占用多少内存？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2885字，纯文字阅读大概需要5分钟。

内容图文

根据redditmetrics.com,Reddit上有超过一百万个子评价.

我写了一个脚本,反复查询this Reddit API endpoint,直到所有的subreddits都存储在一个数组all_subs中：

all_subs = []
for sub in <repeated request here>:
    all_subs.append({"name": display_name, "subscribers": subscriber_count})

该脚本已经运行了近十个小时,大约已经完成了一半(每三个或四个请求就会受到速率限制).当它完成后,我期待一个像这样的数组：

[
    { "name": "AskReddit", "subscribers", 16751677 },
    { "name": "news", "subscribers", 13860169 },
    { "name": "politics", "subscribers", 3350326 },
    ... # plus one million more entries
]

这个列表占用的内存空间大约是多少？

解决方法:

这取决于你的Python版本和你的系统,但我会帮你弄清楚它需要多少内存.首先,sys.getsizeof只返回表示容器的对象的内存使用,而不是容器中的所有元素.

Only the memory consumption directly attributed to the object is
accounted for, not the memory consumption of objects it refers to.

If given, default will be returned if the object does not provide
means to retrieve the size. Otherwise a TypeError will be raised.

getsizeof() calls the object’s __sizeof__ method and adds an
additional garbage collector overhead if the object is managed by the
garbage collector.

See 07001 for an example of using getsizeof()
recursively to find the size of containers and all their contents.

所以,我已经在交互式解释器会话中加载了该配方：

因此,CPython列表实际上是一个异构的,可调整大小的arraylist.底层数组只包含指向Py_Objects的指针.因此,指针占用了一个值得记忆的机器字.在64位系统上,这是64位,因此是8个字节.因此,对于容器而言,大小为1,000,000的列表将占用大约800万字节或8兆字节.建立一个包含1000000条目的列表可以解决这个问题：

In [6]: for i in range(1000000):
   ...:     x.append([])
   ...:

In [7]: import sys

In [8]: sys.getsizeof(x)
Out[8]: 8697464

额外的内存由python对象的开销和底层数组在末尾留下的额外空间来计算,以允许有效的.append操作.

现在,字典在Python中相当重要.只是容器：

In [10]: sys.getsizeof({})
Out[10]: 288

因此,100万个dicts大小的下限是：288000000字节.所以,粗略的下限：

In [12]: 1000000*288 + 1000000*8
Out[12]: 296000000

In [13]: 296000000 * 1e-9 # gigabytes
Out[13]: 0.29600000000000004

所以你可以期待大约0.3千兆字节的内存.使用recipie和更现实的字典：

In [16]: x = []
    ...: for i in range(1000000):
    ...:     x.append(dict(name="my name is what", subscribers=23456644))
    ...:

In [17]: total_size(x)
Out[17]: 296697669

In [18]:

所以,大约0.3演出.现在,这在现代系统上并不是很多.但是如果你想节省空间,你应该使用一个元组甚至更好,一个命名元组：

In [24]: from collections import namedtuple

In [25]: Record = namedtuple('Record', "name subscribers")

In [26]: x = []
    ...: for i in range(1000000):
    ...:     x.append(Record(name="my name is what", subscribers=23456644))
    ...:

In [27]: total_size(x)
Out[27]: 72697556

或者,以千兆字节为单位：

In [29]: total_size(x)*1e-9
Out[29]: 0.07269755600000001

namedtuple就像一个元组一样工作,但你可以访问带有名字的字段：

In [30]: r = x[0]

In [31]: r.name
Out[31]: 'my name is what'

In [32]: r.subscribers
Out[32]: 23456644

内容总结

以上是互联网集市为您收集整理的Python中包含一百万个元素的列表会占用多少内存？全部内容，希望文章能够帮你解决Python中包含一百万个元素的列表会占用多少内存？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/950743.html

来源：【匿名】

【上一篇】我可以使用Python将内存中的对象上传到FTP吗？【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【Python中包含一百万个元素的列表会占用多少内存？】教程文章相关的互联网学习教程文章

Python 获得对象内存占用内存大小 sys.getsizeof【代码】

from sys import getsizeofclass A(object): passclass B: passfor x in (None, 1, 1L, 1.2, ‘c‘, [], (), {}, set(), B, B(), A, A()):print"{0:20s}\t{1:d}".format(type(x).__name__, sys.getsizeof(x))NoneType 16 int 24 long 28 float 24 str 34 list 64 tuple 48 dict ...

零基础学python-3.5 内存管理【代码】

* 变量无需事先声明*?变量无需指定类型*?程序猿不用关系内存管理*?变量名会被回收*?del能够直接释放资源1.python使用的是引用调用，而不是值调用，他使用的回收算法是引用计数算法，我以下举两个样例x = 4 y = 4 aList = [1, 2, 3] bList = [1, 2, 3] print(x is y) print(x == y) print(aList is bList) print(aList == bList) a = 3.2 b = 3.2 print(a is b) print(a == b)输出结果：True True False True True True从输出结果分...

Python基础知识（五）—列表内存图【代码】【图】

# list01 是变量，存储列表对象的地址． #列表引用 list01 = ["张无忌","赵敏","周芷若"] # list02　得到的是列表对象地址 list02 = list01 # 修改的是列表第一个元素存储的对象地址 list01[0] = "老张"print(list02[0])# ?"老张"list01 = ["张无忌","赵敏","周芷若"] list02 = list01 # 修改的是变量存储的对象地址 list01 = "老张"print(list02[0])# ?"张无忌"list01 = ["张无忌","赵敏","周芷若"] # 通过切片复制新列表(拷贝了列...

Python-练习-统计获取脚本运行时长和内存占用【代码】

---练习用---作用：统计获取脚本运行时长和内存占用需要安装psuti模块：pip install psutil 1#!python 2 3import time4import psutil5import os6 7def show_info(start):8 pid = os.getpid()9 p = psutil.Process(pid) 10 info = p.memory_full_info() 11 memory = info.uss/1024 12return memory 1314def func(): 1516print(‘function‘) 171819if__name__ == "__main__": 2021 first = time.time() 22 ...

（一）Python入门-5函数：03函数也是对象-内存分析【代码】【图】

函数也是对象，内存底层分析：　　Python中，“一切都是对象”。实际上，执行def 定义函数后，系统就创建了相应的函数对象。我们执行如下程序，然后进行解释： 1#函数也是对象 2def print_star(n):3print(‘*‘*n)4 5 print_star(3)6 c = print_star7 c(3)8 9print(id(print_star)) 10print(id(c)) 11print(type(c))　　上面代码执行 def 时，系统中会创建函数对象，并通过print_star 这个变量进行引用：　　我们执行“c=print_st...

Python的内存机制

python的内存管理机制（转载）原文链接：作者：幽灵鬼手链接：https://www.jianshu.com/p/fb1d4dc8e367来源：简书著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。先从较浅的层面来说，Python的内存管理机制可以从三个方面来讲（1）垃圾回收（2）引用计数（3）内存池机制一、垃圾回收：python不像C++，Java等语言一样，他们可以不用事先声明变量类型而直接对变量进行赋值。对Python语言来讲，对象的类型和内...

Python StringIO实现内存缓冲区中读写数据

StringIO的行为与file对象非常像，但它不是磁盘上文件，而是一个内存里的“文件”，我们可以像操作磁盘文件那样来操作StringIO。这篇文章主要介绍了Python StringIO模块，此模块主要用于在内存缓冲区中读写数据。模块中只有一个StringIO类，所以它的可用方法都在类中，此类中的大部分函数都与对文件的操作方法类似。----------------------------------s=StringIO.StringIO([buf])此实例类似于open方法，不同的是它并不会在硬盘中生...

python内存管理机制

python内存管理机制:引用计数垃圾回收（引用计数，标记清除，分带回收）内存池1. 引用计数当一个python对象被引用时其引用计数增加 1 ; 当其不再被变量引用时引用计数减 1 ; 当对象引用计数等于 0 时, 对象被删除(引用计数是一种非常高效的内存管理机制)增加引用个数的情况：1.对象被创建p = Person()，增加1；2.对象被引用p1 = p，增加1；3.对象被当作参数传入函数func(object)，增加2，原因是函数中有两个属性在引用该对象；4....

Python使用稀疏矩阵节省内存实例

推荐系统中经常需要处理类似user_id, item_id, rating这样的数据，其实就是数学里面的稀疏矩阵，scipy中提供了sparse模块来解决这个问题，但scipy.sparse有很多问题不太合用：1、不能很好的同时支持data[i, ...]、data[..., j]、data[i, j]快速切片； 2、由于数据保存在内存中，不能很好的支持海量数据处理。要支持data[i, ...]、data[..., j]的快速切片，需要i或者j的数据集中存储；同时，为了保存海量的数据，也需要把数据的一部...

Python在计算内存时应该注意的问题？【代码】【图】

我之前的一篇文章，带大家揭晓了 Python 在给内置对象分配内存时的 5 个奇怪而有趣的小秘密。文中使用了sys.getsizeof()来计算内存，但是用这个方法计算时，可能会出现意料不到的问题。文档中关于这个方法的介绍有两层意思：该方法用于获取一个对象的字节大小（bytes）它只计算直接占用的内存，而不计算对象内所引用对象的内存也就是说，getsizeof() 并不是计算实际对象的字节大小，而是计算“占位对象”的大小。如果你想计算所有属...

说说 Python 的内存视图【代码】

Python 的内存视图（memoryview）是一个内置类，它能取出数组中的某一部分作为切片进行处理。切片的任何变化都会影响到数组。NumPy 的作者 Travis Oliphant 是这样看待内存视图的：内存视图其实是泛化和去数学化的 NumPy 数组。它让我们可以在不需要复制内容的前提下，实现在数据结构之间共享内存。其中数据结构可以是任何形式，比如 PIL 图片、SQLite 数据库和 NumPy 数组等等。对于处理大型数据集合的场景，这个功能非常重要。P...

【Python3】内存释放机制【图】

x、y、‘函数名’相当于门牌号（内存地址）当x、y都停止指向123时，123对应的内存被清空释放回收匿名函数没有门牌号，对应内存将被即刻回收原文：http://www.cnblogs.com/shengxinjack/p/7746492.html

Python：统计Apache进程占用的物理内存比【图】

前面介绍过怎么统计系统剩余内存：http://msiyuetian.blog.51cto.com/8637744/1772888下面这个主要是统计Apache进程占用的物理内存我们可以通过以下命令查看Apache有哪些进程及其PID1）ps aux |grep httpd650) this.width=650;" src="/upload/getfiles/default/2022/11/8/20221108020721967.jpg" title="1.png" />2）pidof httpd650) this.width=650;" src="/upload/getfiles/default/2022/11/8/20221108020722287.jpg" title="4.p...

Python for 循环中使用append()添加可变元素，前面的值被覆盖，循环中内存应用地址不变【代码】

在使用list.append(a), 添加动态改变的a（a = random.random()）时，发现循环中每一个新的循环改变的a会在list中把之前的值全部改变；查找后自了，Python是基于对象引用的，append添加的是一个“地址、引用”，当这个地址内的内容改变时，前面的同“地址”的内容都改变。查看“内存、应用”’使用 id(object).简单的就不啰嗦了网上关于地址内存都有介绍，经过测试后发现，一般情况下给变量一个新值时这个id就会改变，当然这...

python 中的变量内存以及关于is ==、堆栈、

在工作学习中会碰到一些python中变量与内存层面的问题理解，虽然是在不断的解决，但是并没有做过这方面的总结。变量：用来标识(identify)一块内存区域。为了方便表示内存，我们操作变量实质上是在操作变量指向的那块内存单元。编译器负责分配。我们可以使用Python内建函数id()来获取变量的地址变量名：是一个标识符(dientify)，用来代之一块内存空间，使用这个变量名，我们可以很方便的操作这块内存区域。内存：内存是我们电脑硬件...

首页 / PYTHON / Python中包含一百万个元素的列表会占用多少内存？

Python中包含一百万个元素的列表会占用多少内存？

内容导读

内容图文

内容总结

内容备注

内容手机端

【Python中包含一百万个元素的列表会占用多少内存？】教程文章相关的互联网学习教程文章

Python 获得对象内存占用内存大小 sys.getsizeof【代码】

零基础学python-3.5 内存管理【代码】

Python基础知识（五）—列表内存图【代码】【图】

Python-练习-统计获取脚本运行时长和内存占用【代码】

（一）Python入门-5函数：03函数也是对象-内存分析【代码】【图】

Python的内存机制

Python StringIO实现内存缓冲区中读写数据

python内存管理机制

Python使用稀疏矩阵节省内存实例

Python在计算内存时应该注意的问题？【代码】【图】

说说 Python 的内存视图【代码】

【Python3】内存释放机制【图】

Python：统计Apache进程占用的物理内存比【图】

Python for 循环中使用append()添加可变元素，前面的值被覆盖，循环中内存应用地址不变【代码】

python 中的变量内存以及关于is ==、堆栈、

PYTHON - 相关标签

内存 - 相关标签

元素 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程