首页 / PYTHON / 代码运行时的内存问题(Python,Networkx)

代码运行时的内存问题(Python,Networkx)

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了代码运行时的内存问题(Python,Networkx)，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2606字，纯文字阅读大概需要4分钟。

内容图文

我制作了一个生成带有379613734边的图的代码.

但由于内存的原因,代码无法完成.当它通过6200万行时,它占用了大约97％的服务器内存.所以我杀了它.

你有什么想法解决这个问题吗？

我的代码是这样的：

import os, sys
import time
import networkx as nx


G = nx.Graph()

ptime = time.time()
j = 1

for line in open("./US_Health_Links.txt", 'r'):
#for line in open("./test_network.txt", 'r'):
    follower = line.strip().split()[0]
    followee = line.strip().split()[1]

    G.add_edge(follower, followee)

    if j%1000000 == 0:
        print j*1.0/1000000, "million lines done", time.time() - ptime
        ptime = time.time()
    j += 1

DG = G.to_directed()
#       P = nx.path_graph(DG)
Nn_G = G.number_of_nodes()
N_CC = nx.number_connected_components(G)
LCC = nx.connected_component_subgraphs(G)[0]
n_LCC = LCC.nodes()
Nn_LCC = LCC.number_of_nodes()
inDegree = DG.in_degree()
outDegree = DG.out_degree()
Density = nx.density(G)
#       Diameter = nx.diameter(G)
#       Centrality = nx.betweenness_centrality(PDG, normalized=True, weighted_edges=False)
#       Clustering = nx.average_clustering(G)

print "number of nodes in G\t" + str(Nn_G) + '\n' + "number of CC in G\t" + str(N_CC) + '\n' + "number of nodes in LCC\t" + str(Nn_LCC) + '\n' + "Density of G\t" + str(Density) + '\n'
#       sys.exit()
#   j += 1

边数据是这样的：

1000    1001
1000245    1020191
1000    10267352
1000653    10957902
1000    11039092
1000    1118691
10346    11882
1000    1228281
1000    1247041
1000    12965332
121340    13027572
1000    13075072
1000    13183162
1000    13250162
1214    13326292
1000    13452672
1000    13844892
1000    14061830
12340    1406481
1000    14134703
1000    14216951
1000    14254402
12134   14258044
1000    14270791
1000    14278978
12134    14313332
1000    14392970
1000    14441172
1000    14497568
1000    14502775
1000    14595635
1000    14620544
1000    14632615
10234    14680596
1000    14956164
10230    14998341
112000    15132211
1000    15145450
100    15285998
1000    15288974
1000    15300187
1000    1532061
1000    15326300

最后,有没有人有经验来分析Twitter链接数据？我很难采用有向图并计算平均/中位数的indegree和outdegree节点.任何帮助或想法？

解决方法:

首先,您应该考虑是否可以添加更多RAM.通过基于您拥有的数据进行计算或通过读取各种大小的数据的子样本来衡量内存使用情况,以衡量内存使用情况.几GB RAM的适度成本可以为您节省大量时间和麻烦.

其次,考虑是否需要实际构建整个图.例如,您可以通过迭代文件并计算来确定顶点的数量及其度数 – 您只需要在内存中一次保留一行,加上计数,这将比图表小很多.知道度数,您可以在找到最大连通分量时省略图中第一级的任何顶点,然后在之后校正省略的节点.您正在进行数据分析,而不是实现一些通用算法：学习有关数据的简单信息以实现更复杂的分析.

内容总结

以上是互联网集市为您收集整理的代码运行时的内存问题(Python,Networkx)全部内容，希望文章能够帮你解决代码运行时的内存问题(Python,Networkx)所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/961288.html

来源：【匿名】

【上一篇】Windows 下 Python easy_install 的安装【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【代码运行时的内存问题(Python,Networkx)】教程文章相关的互联网学习教程文章

Python 获得对象内存占用内存大小 sys.getsizeof【代码】

from sys import getsizeofclass A(object): passclass B: passfor x in (None, 1, 1L, 1.2, ‘c‘, [], (), {}, set(), B, B(), A, A()):print"{0:20s}\t{1:d}".format(type(x).__name__, sys.getsizeof(x))NoneType 16 int 24 long 28 float 24 str 34 list 64 tuple 48 dict ...

零基础学python-3.5 内存管理【代码】

* 变量无需事先声明*?变量无需指定类型*?程序猿不用关系内存管理*?变量名会被回收*?del能够直接释放资源1.python使用的是引用调用，而不是值调用，他使用的回收算法是引用计数算法，我以下举两个样例x = 4 y = 4 aList = [1, 2, 3] bList = [1, 2, 3] print(x is y) print(x == y) print(aList is bList) print(aList == bList) a = 3.2 b = 3.2 print(a is b) print(a == b)输出结果：True True False True True True从输出结果分...

Python基础知识（五）—列表内存图【代码】【图】

# list01 是变量，存储列表对象的地址． #列表引用 list01 = ["张无忌","赵敏","周芷若"] # list02　得到的是列表对象地址 list02 = list01 # 修改的是列表第一个元素存储的对象地址 list01[0] = "老张"print(list02[0])# ?"老张"list01 = ["张无忌","赵敏","周芷若"] list02 = list01 # 修改的是变量存储的对象地址 list01 = "老张"print(list02[0])# ?"张无忌"list01 = ["张无忌","赵敏","周芷若"] # 通过切片复制新列表(拷贝了列...

Python-练习-统计获取脚本运行时长和内存占用【代码】

---练习用---作用：统计获取脚本运行时长和内存占用需要安装psuti模块：pip install psutil 1#!python 2 3import time4import psutil5import os6 7def show_info(start):8 pid = os.getpid()9 p = psutil.Process(pid) 10 info = p.memory_full_info() 11 memory = info.uss/1024 12return memory 1314def func(): 1516print(‘function‘) 171819if__name__ == "__main__": 2021 first = time.time() 22 ...

（一）Python入门-5函数：03函数也是对象-内存分析【代码】【图】

函数也是对象，内存底层分析：　　Python中，“一切都是对象”。实际上，执行def 定义函数后，系统就创建了相应的函数对象。我们执行如下程序，然后进行解释： 1#函数也是对象 2def print_star(n):3print(‘*‘*n)4 5 print_star(3)6 c = print_star7 c(3)8 9print(id(print_star)) 10print(id(c)) 11print(type(c))　　上面代码执行 def 时，系统中会创建函数对象，并通过print_star 这个变量进行引用：　　我们执行“c=print_st...

Python的内存机制

python的内存管理机制（转载）原文链接：作者：幽灵鬼手链接：https://www.jianshu.com/p/fb1d4dc8e367来源：简书著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。先从较浅的层面来说，Python的内存管理机制可以从三个方面来讲（1）垃圾回收（2）引用计数（3）内存池机制一、垃圾回收：python不像C++，Java等语言一样，他们可以不用事先声明变量类型而直接对变量进行赋值。对Python语言来讲，对象的类型和内...

Python StringIO实现内存缓冲区中读写数据

StringIO的行为与file对象非常像，但它不是磁盘上文件，而是一个内存里的“文件”，我们可以像操作磁盘文件那样来操作StringIO。这篇文章主要介绍了Python StringIO模块，此模块主要用于在内存缓冲区中读写数据。模块中只有一个StringIO类，所以它的可用方法都在类中，此类中的大部分函数都与对文件的操作方法类似。----------------------------------s=StringIO.StringIO([buf])此实例类似于open方法，不同的是它并不会在硬盘中生...

python内存管理机制

python内存管理机制:引用计数垃圾回收（引用计数，标记清除，分带回收）内存池1. 引用计数当一个python对象被引用时其引用计数增加 1 ; 当其不再被变量引用时引用计数减 1 ; 当对象引用计数等于 0 时, 对象被删除(引用计数是一种非常高效的内存管理机制)增加引用个数的情况：1.对象被创建p = Person()，增加1；2.对象被引用p1 = p，增加1；3.对象被当作参数传入函数func(object)，增加2，原因是函数中有两个属性在引用该对象；4....

Python使用稀疏矩阵节省内存实例

推荐系统中经常需要处理类似user_id, item_id, rating这样的数据，其实就是数学里面的稀疏矩阵，scipy中提供了sparse模块来解决这个问题，但scipy.sparse有很多问题不太合用：1、不能很好的同时支持data[i, ...]、data[..., j]、data[i, j]快速切片； 2、由于数据保存在内存中，不能很好的支持海量数据处理。要支持data[i, ...]、data[..., j]的快速切片，需要i或者j的数据集中存储；同时，为了保存海量的数据，也需要把数据的一部...

Python在计算内存时应该注意的问题？【代码】【图】

我之前的一篇文章，带大家揭晓了 Python 在给内置对象分配内存时的 5 个奇怪而有趣的小秘密。文中使用了sys.getsizeof()来计算内存，但是用这个方法计算时，可能会出现意料不到的问题。文档中关于这个方法的介绍有两层意思：该方法用于获取一个对象的字节大小（bytes）它只计算直接占用的内存，而不计算对象内所引用对象的内存也就是说，getsizeof() 并不是计算实际对象的字节大小，而是计算“占位对象”的大小。如果你想计算所有属...

说说 Python 的内存视图【代码】

Python 的内存视图（memoryview）是一个内置类，它能取出数组中的某一部分作为切片进行处理。切片的任何变化都会影响到数组。NumPy 的作者 Travis Oliphant 是这样看待内存视图的：内存视图其实是泛化和去数学化的 NumPy 数组。它让我们可以在不需要复制内容的前提下，实现在数据结构之间共享内存。其中数据结构可以是任何形式，比如 PIL 图片、SQLite 数据库和 NumPy 数组等等。对于处理大型数据集合的场景，这个功能非常重要。P...

【Python3】内存释放机制【图】

x、y、‘函数名’相当于门牌号（内存地址）当x、y都停止指向123时，123对应的内存被清空释放回收匿名函数没有门牌号，对应内存将被即刻回收原文：http://www.cnblogs.com/shengxinjack/p/7746492.html

Python：统计Apache进程占用的物理内存比【图】

前面介绍过怎么统计系统剩余内存：http://msiyuetian.blog.51cto.com/8637744/1772888下面这个主要是统计Apache进程占用的物理内存我们可以通过以下命令查看Apache有哪些进程及其PID1）ps aux |grep httpd650) this.width=650;" src="/upload/getfiles/default/2022/11/8/20221108020721967.jpg" title="1.png" />2）pidof httpd650) this.width=650;" src="/upload/getfiles/default/2022/11/8/20221108020722287.jpg" title="4.p...

Python for 循环中使用append()添加可变元素，前面的值被覆盖，循环中内存应用地址不变【代码】

在使用list.append(a), 添加动态改变的a（a = random.random()）时，发现循环中每一个新的循环改变的a会在list中把之前的值全部改变；查找后自了，Python是基于对象引用的，append添加的是一个“地址、引用”，当这个地址内的内容改变时，前面的同“地址”的内容都改变。查看“内存、应用”’使用 id(object).简单的就不啰嗦了网上关于地址内存都有介绍，经过测试后发现，一般情况下给变量一个新值时这个id就会改变，当然这...

python 中的变量内存以及关于is ==、堆栈、

在工作学习中会碰到一些python中变量与内存层面的问题理解，虽然是在不断的解决，但是并没有做过这方面的总结。变量：用来标识(identify)一块内存区域。为了方便表示内存，我们操作变量实质上是在操作变量指向的那块内存单元。编译器负责分配。我们可以使用Python内建函数id()来获取变量的地址变量名：是一个标识符(dientify)，用来代之一块内存空间，使用这个变量名，我们可以很方便的操作这块内存区域。内存：内存是我们电脑硬件...

首页 / PYTHON / 代码运行时的内存问题(Python,Networkx)

代码运行时的内存问题(Python,Networkx)

内容导读

内容图文

内容总结

内容备注

内容手机端

【代码运行时的内存问题(Python,Networkx)】教程文章相关的互联网学习教程文章

Python 获得对象内存占用内存大小 sys.getsizeof【代码】

零基础学python-3.5 内存管理【代码】

Python基础知识（五）—列表内存图【代码】【图】

Python-练习-统计获取脚本运行时长和内存占用【代码】

（一）Python入门-5函数：03函数也是对象-内存分析【代码】【图】

Python的内存机制

Python StringIO实现内存缓冲区中读写数据

python内存管理机制

Python使用稀疏矩阵节省内存实例

Python在计算内存时应该注意的问题？【代码】【图】

说说 Python 的内存视图【代码】

【Python3】内存释放机制【图】

Python：统计Apache进程占用的物理内存比【图】

Python for 循环中使用append()添加可变元素，前面的值被覆盖，循环中内存应用地址不变【代码】

python 中的变量内存以及关于is ==、堆栈、

NETWORK - 相关标签

PYTHON - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程