查找一个数组相对于另一个数组中的所有值的最近索引 - Python / NumPy
- 2025-04-10 09:45:00
- admin 原创
- 16
问题描述:
我有一个复数列表,我想在另一个复数列表中找到最接近的值。
我目前使用numpy的方法:
import numpy as np
refArray = np.random.random(16);
myArray = np.random.random(1000);
def find_nearest(array, value):
idx = (np.abs(array-value)).argmin()
return idx;
for value in np.nditer(myArray):
index = find_nearest(refArray, value);
print(index);
不幸的是,对于大量的值,这需要很长时间。有没有更快或更“pythonian”的方法将 myArray 中的每个值与 refArray 中最接近的值进行匹配?
仅供参考:我的脚本中不一定需要 numpy。
重要提示: myArray 和 refArray 的顺序都很重要,不应更改。如果要应用排序,则应以某种方式保留原始索引。
解决方案 1:
np.searchsorted
以下是基于以下方法的矢量化方法this post
-
def closest_argmin(A, B):
L = B.size
sidx_B = B.argsort()
sorted_B = B[sidx_B]
sorted_idx = np.searchsorted(sorted_B, A)
sorted_idx[sorted_idx==L] = L-1
mask = (sorted_idx > 0) & \n ((np.abs(A - sorted_B[sorted_idx-1]) < np.abs(A - sorted_B[sorted_idx])) )
return sidx_B[sorted_idx-mask]
简要说明:
获取左侧位置的排序索引。我们使用 -
np.searchsorted(arr1, arr2, side='left')
或 来执行此操作np.searchsorted(arr1, arr2)
。现在,searchsorted
需要将排序后的数组作为第一个输入,因此我们需要在那里进行一些准备工作。将左侧位置的值与紧邻右侧位置的值进行比较
(left + 1)
,看看哪一个最接近。我们在计算 的步骤中执行此操作mask
。根据左侧的还是其右侧的最近,选择相应的。这是通过减去索引来完成的,其中
mask
值作为要转换为的偏移量ints
。
基准测试
原始方法 -
def org_app(myArray, refArray):
out1 = np.empty(myArray.size, dtype=int)
for i, value in enumerate(myArray):
# find_nearest from posted question
index = find_nearest(refArray, value)
out1[i] = index
return out1
计时和验证 -
In [188]: refArray = np.random.random(16)
...: myArray = np.random.random(1000)
...:
In [189]: %timeit org_app(myArray, refArray)
100 loops, best of 3: 1.95 ms per loop
In [190]: %timeit closest_argmin(myArray, refArray)
10000 loops, best of 3: 36.6 µs per loop
In [191]: np.allclose(closest_argmin(myArray, refArray), org_app(myArray, refArray))
Out[191]: True
50x+
加速发布的样本,并希望更大的数据集能有更大的加速!
解决方案 2:
答案比@Divakar 的答案短得多,也使用广播,甚至更快一些:
abs(myArray[:, None] - refArray[None, :]).argmin(axis=-1)
相关推荐
热门文章
项目管理软件有哪些?
热门标签
曾咪二维码
扫码咨询,免费领取项目管理大礼包!
云禅道AD