按多个轴对二维 numpy 数组进行排序

2025-03-17 09:10:00
admin
原创
56
摘要:问题描述:我有一个形状为 (N,2) 的 2D numpy 数组,其中包含 N 个点(x 和 y 坐标)。例如:array([[3, 2], [6, 2], [3, 6], [3, 4], [5, 3]]) 我想对它进行排序,使我的点按 x 坐标排序,然...

问题描述:

我有一个形状为 (N,2) 的 2D numpy 数组,其中包含 N 个点(x 和 y 坐标)。例如:

array([[3, 2],
       [6, 2],
       [3, 6],
       [3, 4],
       [5, 3]])

我想对它进行排序,使我的点按 x 坐标排序,然后当 x 坐标相同时按 y 坐标排序。因此上面的数组应如下所示:

array([[3, 2],
       [3, 4],
       [3, 6],
       [5, 3],
       [6, 2]])

如果这是一个普通的 Python 列表,我会简单地定义一个比较器来执行我想要的操作,但据我所知,numpy 的排序函数不接受用户定义的比较器。有什么想法吗?


编辑:感谢您的想法!我设置了一个包含 1000000 个随机整数点的快速测试用例,并对我可以运行的整数点进行了基准测试(抱歉,目前无法升级 numpy)。

Mine:   4.078 secs 
mtrw:   7.046 secs
unutbu: 0.453 secs

解决方案 1:

使用lexsort:

import numpy as np    
a = np.array([(3, 2), (6, 2), (3, 6), (3, 4), (5, 3)])

ind = np.lexsort((a[:,1],a[:,0]))    

a[ind]
# array([[3, 2],
#       [3, 4],
#       [3, 6],
#       [5, 3],
#       [6, 2]])

a.ravel()`a如果是,则返回一个视图C_CONTIGUOUS`。如果这是真的,
@ars 的方法(通过使用ravel而不是稍作修改)flatten会产生一种很好的a 就地排序方法:

a = np.array([(3, 2), (6, 2), (3, 6), (3, 4), (5, 3)])
dt = [('col1', a.dtype),('col2', a.dtype)]
assert a.flags['C_CONTIGUOUS']
b = a.ravel().view(dt)
b.sort(order=['col1','col2'])

由于b是的视图a,因此排序也同样b排序:a

print(a)
# [[3 2]
#  [3 4]
#  [3 6]
#  [5 3]
#  [6 2]]

解决方案 2:

标题写着“对二维数组进行排序”。虽然提问者使用的是(N,2)形数组,但可以将 unutbu 的解决方案推广到任何(N,M)数组,因为这可能是人们真正想要的。

可以transpose使用带有负数的切片符号step将所有列按lexsort相反的顺序传递:

>>> import numpy as np
>>> a = np.random.randint(1, 6, (10, 3))
>>> a
array([[4, 2, 3],
       [4, 2, 5],
       [3, 5, 5],
       [1, 5, 5],
       [3, 2, 1],
       [5, 2, 2],
       [3, 2, 3],
       [4, 3, 4],
       [3, 4, 1],
       [5, 3, 4]])

>>> a[np.lexsort(np.transpose(a)[::-1])]
array([[1, 5, 5],
       [3, 2, 1],
       [3, 2, 3],
       [3, 4, 1],
       [3, 5, 5],
       [4, 2, 3],
       [4, 2, 5],
       [4, 3, 4],
       [5, 2, 2],
       [5, 3, 4]])

解决方案 3:

numpy_indexed包(免责声明:我是它的作者)可用于以高效的完全矢量化方式解决这些类型的对 nd 数组的处理问题:

import numpy_indexed as npi
npi.sort(a)  # by default along axis=0, but configurable

解决方案 4:

您可以使用np.complex_sort。这会产生将数据更改为浮点数的副作用,我希望这不是问题:

>>> a = np.array([[3, 2], [6, 2], [3, 6], [3, 4], [5, 3]])
>>> atmp = np.sort_complex(a[:,0] + a[:,1]*1j)
>>> b = np.array([[np.real(x), np.imag(x)] for x in atmp])
>>> b
array([[ 3.,  2.],
       [ 3.,  4.],
       [ 3.,  6.],
       [ 5.,  3.],
       [ 6.,  2.]])

解决方案 5:

我也遇到过同样的问题,最后得到了帮助并解决了问题。如果您的数组有列名(结构化数组),它就可以顺利运行,我认为这是一种使用与 excel 相同的逻辑进行排序的非常简单的方法:

array_name[array_name[['colname1','colname2']].argsort()]

请注意排序条件用双括号括起来。当然,您可以使用 2 列以上的列作为排序条件。

解决方案 6:

编辑:删除了错误的答案。

以下是使用中间结构化数组实现此目的的一种方法:

from numpy import array

a = array([[3, 2], [6, 2], [3, 6], [3, 4], [5, 3]])

b = a.flatten()
b.dtype = [('x', '<i4'), ('y', '<i4')]
b.sort()
b.dtype = '<i4'
b.shape = a.shape

print b

给出所需的输出:

[[3 2]
 [3 4]
 [3 6]
 [5 3]
 [6 2]]

但不确定这是否是最好的解决方法。

解决方案 7:

我找到了一种方法来做到这一点:

from numpy import array
a = array([(3,2),(6,2),(3,6),(3,4),(5,3)])
array(sorted(sorted(a,key=lambda e:e[1]),key=lambda e:e[0]))

必须进行两次排序(并使用普通的 pythonsorted函数而不是更快的 numpy 排序)这是非常糟糕的,但它确实可以很好地放在一行上。

相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   2482  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1533  
  PLM(产品生命周期管理)项目对于企业优化产品研发流程、提升产品质量以及增强市场竞争力具有至关重要的意义。然而,在项目推进过程中,范围蔓延是一个常见且棘手的问题,它可能导致项目进度延迟、成本超支以及质量下降等一系列不良后果。因此,有效避免PLM项目范围蔓延成为项目成功的关键因素之一。以下将详细阐述三大管控策略,助力企业...
plm系统   0  
  PLM(产品生命周期管理)项目管理在企业产品研发与管理过程中扮演着至关重要的角色。随着市场竞争的加剧和产品复杂度的提升,PLM项目面临着诸多风险。准确量化风险优先级并采取有效措施应对,是确保项目成功的关键。五维评估矩阵作为一种有效的风险评估工具,能帮助项目管理者全面、系统地评估风险,为决策提供有力支持。五维评估矩阵概述...
免费plm软件   0  
  引言PLM(产品生命周期管理)开发流程对于企业产品的全生命周期管控至关重要。它涵盖了从产品概念设计到退役的各个阶段,直接影响着产品质量、开发周期以及企业的市场竞争力。在当今快速发展的科技环境下,客户对产品质量的要求日益提高,市场竞争也愈发激烈,这就使得优化PLM开发流程成为企业的必然选择。缺陷管理工具和六西格玛方法作为...
plm产品全生命周期管理   0  
热门文章
项目管理软件有哪些?
曾咪二维码

扫码咨询,免费领取项目管理大礼包!

云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用