为什么 NumPy 数组如此快?

2025-02-18 09:23:00
admin
原创
87
摘要:问题描述:由于遇到了性能问题,我刚刚将正在编写的程序改为将数据保存为 numpy 数组,效果令人难以置信。它原本需要 30 分钟才能运行,现在只需 2.5 秒!我想知道它是如何做到的。我猜是因为它消除了for循环的需要,但除此之外我感到很困惑。解决方案 1:Numpy 数组是密集的同类数组。相比之下,Pyth...

问题描述:

由于遇到了性能问题,我刚刚将正在编写的程序改为将数据保存为 numpy 数组,效果令人难以置信。它原本需要 30 分钟才能运行,现在只需 2.5 秒!

我想知道它是如何做到的。我猜是因为它消除了for循环的需要,但除此之外我感到很困惑。


解决方案 1:

Numpy 数组是密集的同类数组。相比之下,Python 列表是指向对象的指针数组,即使它们都是同一类型。因此,您可以获得引用局部性的好处。

此外,许多 Numpy 操作都是用 C 实现的,从而避免了 Python 中循环、指针间接寻址和每个元素动态类型检查的一般成本。速度提升取决于您正在执行的操作,但在数字运算程序中,几个数量级的提升并不罕见。

解决方案 2:

numpy 数组是专门的数据结构。这意味着您不仅可以获得高效的内存表示,还可以获得高效的专门实现。

例如,如果要对两个数组求和,则将使用专门的CPU 矢量运算来执行加法,而不是在循环中调用 int 加法的 python 实现。

解决方案 3:

考虑以下代码:

import numpy as np
import time

a = np.random.rand(1000000)
b = np.random.rand(1000000)

tic = time.time()
c = np.dot(a, b)
toc = time.time()

print("Vectorised version: " + str(1000*(toc-tic)) + "ms")

c = 0
tic = time.time()
for i in range(1000000):
    c += a[i] * b[i]
toc = time.time()

print("For loop: " + str(1000*(toc-tic)) + "ms")

输出:

Vectorised version: 2.011537551879883ms
For loop: 539.8685932159424ms

这里 Numpy 的速度更快,因为它利用了并行性(单指令多数据 (SIMD) 的情况),而传统的 for 循环无法利用它。

解决方案 4:

Numpy 数组在内存中以连续的内存块形式存储,而 python 列表则以分散在内存中的小块形式存储,因此在 numpy 数组中访问内存很容易且很快,而在 python 列表中访问内存则很困难且很慢。

来源:https ://algorithmdotcpp.blogspot.com/2022/01/prove-numpy-is-faster-than-normal-list.html

解决方案 5:

Numpy 数组与“普通”数组(例如 c 中的数组)极其相似。请注意,每个元素都必须是同一类型。加速效果非常好,因为您可以利用预取功能,并且可以通过索引立即访问数组中的任何元素。

解决方案 6:

您仍然有 for 循环,但它们是在 c 中完成的。Numpy 基于 Atlas,它是一个线性代数运算库。

http://math-atlas.sourceforge.net/

当面对大型计算时,它将使用几种实现运行测试,以找出目前我们计算机上最快的实现。使用某些 numpy 构建,计算可以在多个 CPU 上并行化。因此,您将拥有在连续内存块上运行的高度优化的 c。

相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   2679  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1614  
  在产品生命周期管理(PLM)系统的应用中,需求优先级排序是至关重要的环节。它直接关系到资源的合理分配、项目的推进效率以及最终产品能否精准满足市场需求。决策矩阵作为一种有效的工具,能够在PLM系统中为需求优先级排序提供有力支持,帮助企业做出更明智、更科学的决策。PLM系统与需求优先级排序的重要性PLM系统涵盖了产品从概念...
plm项目管理   0  
  产品生命周期管理(PLM)作为企业管理产品全生命周期的关键手段,在数字化时代正经历着深刻变革。随着技术的飞速发展和市场需求的不断变化,2025 年 PLM 行业将呈现出一系列引人注目的数字化转型方向。这些趋势不仅将重塑企业管理产品的方式,还将为企业在激烈的市场竞争中赢得优势。深入了解这些趋势,对于企业制定战略、优化流程...
plm软件   0  
  PLM(产品生命周期管理)系统在现代企业的产品研发、生产与管理过程中扮演着至关重要的角色。它涵盖了从产品概念设计到退役的全生命周期,整合了人员、流程和数据,助力企业提升效率、降低成本并增强创新能力。然而,企业在引入PLM系统时,需要进行全面且深入的评估,以确保所选系统能够满足自身业务需求,并带来可观的投资回报率(ROI...
plm系统的作用   0  
热门文章
项目管理软件有哪些?
曾咪二维码

扫码咨询,免费领取项目管理大礼包!

云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用