Python numpy 数组的内存使用情况

2025-03-18 08:54:00
admin
原创
54
摘要:问题描述:我正在使用 python 分析一些大型文件,但遇到了内存问题,因此我一直在使用 sys.getsizeof() 来尝试跟踪使用情况,但它对 numpy 数组的行为很奇怪。下面是一个涉及我必须打开的反照率图的示例:>>> import numpy as np >>>...

问题描述:

我正在使用 python 分析一些大型文件,但遇到了内存问题,因此我一直在使用 sys.getsizeof() 来尝试跟踪使用情况,但它对 numpy 数组的行为很奇怪。下面是一个涉及我必须打开的反照率图的示例:

>>> import numpy as np
>>> import struct
>>> from sys import getsizeof
>>> f = open('Albedo_map.assoc', 'rb')
>>> getsizeof(f)
144
>>> albedo = struct.unpack('%df' % (7200*3600), f.read(7200*3600*4))
>>> getsizeof(albedo)
207360056
>>> albedo = np.array(albedo).reshape(3600,7200)
>>> getsizeof(albedo)
80

好吧,数据仍然存在,但对象的大小(3600x7200 像素地图)已从约 200 Mb 变为 80 字节。我希望我的内存问题已经解决,只需将所有内容转换为 numpy 数组,但我觉得这种行为(如果属实)会在某种程度上违反信息论或热力学的某些定律,所以我倾向于相信 getsizeof() 不适用于 numpy 数组。有什么想法吗?


解决方案 1:

您可以使用array.nbytesnumpy 数组,例如:

import numpy as np
from sys import getsizeof
a = [0] * 1024
b = np.array(a)
print(getsizeof(a))
print(b.nbytes)

输出:

8264
8192

解决方案 2:

字段nbytes将为您提供数组中所有元素的字节大小numpy.array

size_in_bytes = my_numpy_array.nbytes

请注意,这并不测量“数组对象的非元素属性”,因此实际大小(以字节为单位)可能比这大几个字节。

解决方案 3:

为了给接受的答案添加更多内容,总结并提供更透明的内存示例(注意int8是一个字节):

import numpy as np
from sys import getsizeof
a = np.ones(shape=(1000, 1), dtype='int8')
b = a.T 
a.nbytes, getsizeof(a), b.nbytes, getsizeof(b), getsizeof(b.base)

将产生以下输出:

(1000, 1128, 1000, 128, 1128)
  • a.nbytes= 1000:给出数值元素的大小:1000 个数值元素。

  • getsizeof(a) = 1128:给出数值元素和参考机械的尺寸。

  • b.nbtyes:数值元素的大小与内存位置无关(不受b的视图状态影响)

  • getsizeof(b) = 128:仅计算参考机械的尺寸,它受到视图状态的影响。

  • getsizeof(b.base) = 1128:这将独立于视图状态计算数值元素加上参考机制的大小。

总结:如果您想知道数值元素的大小,array.nbytes那么无论是否有视图,它都可以正常工作。另一方面,如果您想要数值元素的大小加上整个参考机制,那么您需要使用它getsizeof(array.base)来获得可靠的估计值,而不管您的视图状态如何。

解决方案 4:

在 python 笔记本中,我经常想要过滤掉“悬空”的numpy.ndarray内容,特别是那些存储在_1、等中的_2、本来就不应该保留的内容。

我使用此代码来获取所有这些及其大小的列表。

不确定这里是否locals()更好globals()

import sys
import numpy
from humanize import naturalsize

for size, name in sorted(
    (value.nbytes, name)
    for name, value in locals().items()
    if isinstance(value, numpy.ndarray)):
  print("{:>30}: {:>8}".format(name, naturalsize(size)))
相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   2482  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1533  
  PLM(产品生命周期管理)项目对于企业优化产品研发流程、提升产品质量以及增强市场竞争力具有至关重要的意义。然而,在项目推进过程中,范围蔓延是一个常见且棘手的问题,它可能导致项目进度延迟、成本超支以及质量下降等一系列不良后果。因此,有效避免PLM项目范围蔓延成为项目成功的关键因素之一。以下将详细阐述三大管控策略,助力企业...
plm系统   0  
  PLM(产品生命周期管理)项目管理在企业产品研发与管理过程中扮演着至关重要的角色。随着市场竞争的加剧和产品复杂度的提升,PLM项目面临着诸多风险。准确量化风险优先级并采取有效措施应对,是确保项目成功的关键。五维评估矩阵作为一种有效的风险评估工具,能帮助项目管理者全面、系统地评估风险,为决策提供有力支持。五维评估矩阵概述...
免费plm软件   0  
  引言PLM(产品生命周期管理)开发流程对于企业产品的全生命周期管控至关重要。它涵盖了从产品概念设计到退役的各个阶段,直接影响着产品质量、开发周期以及企业的市场竞争力。在当今快速发展的科技环境下,客户对产品质量的要求日益提高,市场竞争也愈发激烈,这就使得优化PLM开发流程成为企业的必然选择。缺陷管理工具和六西格玛方法作为...
plm产品全生命周期管理   0  
热门文章
项目管理软件有哪些?
曾咪二维码

扫码咨询,免费领取项目管理大礼包!

云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用