如何将 NumPy 数组规范化到一定范围内？-IT科技

如何将 NumPy 数组规范化到一定范围内？

2025-03-10 08:52:00

admin

原创

摘要：问题描述：对音频或图像数组进行一些处理后，需要在一定范围内对其进行规范化，然后才能将其写回文件。可以这样做：# Normalize audio channels to between -1.0 and +1.0 audio[:,0] = audio[:,0]/abs(audio[:,0]).max() aud...

问题描述：

对音频或图像数组进行一些处理后，需要在一定范围内对其进行规范化，然后才能将其写回文件。可以这样做：

# Normalize audio channels to between -1.0 and +1.0
audio[:,0] = audio[:,0]/abs(audio[:,0]).max()
audio[:,1] = audio[:,1]/abs(audio[:,1]).max()

# Normalize image to between 0 and 255
image = image/(image.max()/255.0)

有没有一种不太冗长、方便的方法来做到这一点？matplotlib.colors.Normalize()似乎没有相关。

解决方案 1：

# Normalize audio channels to between -1.0 and +1.0
audio /= np.max(np.abs(audio),axis=0)
# Normalize image to between 0 and 255
image *= (255.0/image.max())

使用/=和*=可以消除中间临时数组，从而节省一些内存。乘法比除法成本低，因此

image *= 255.0/image.max()    # Uses 1 division and image.size multiplications

略快于

image /= image.max()/255.0    # Uses 1+image.size divisions

由于我们在这里使用基本的 numpy 方法，我认为这是 numpy 中最有效的解决方案。

就地操作不会改变容器数组的数据类型。由于所需的规范化值是浮点数，因此在执行就地操作之前，audio和image数组需要具有浮点数据类型。如果它们还不是浮点数据类型，则需要使用进行转换。astype例如，

image = image.astype('float64')

解决方案 2：

如果数组同时包含正数据和负数据，我会选择：

import numpy as np

a = np.random.rand(3,2)

# Normalised [0,1]
b = (a - np.min(a))/np.ptp(a)

# Normalised [0,255] as integer: don't forget the parenthesis before astype(int)
c = (255*(a - np.min(a))/np.ptp(a)).astype(int)        

# Normalised [-1,1]
d = 2.*(a - np.min(a))/np.ptp(a)-1

如果数组包含nan，则一个解决方案可能是将其删除，如下所示：

def nan_ptp(a):
    return np.ptp(a[np.isfinite(a)])

b = (a - np.nanmin(a))/nan_ptp(a)

但是，根据具体情况，您可能需要采取nan不同的处理方式。例如，插入值、用 0 替换，或者引发错误。

最后，即使这不是 OP 的问题，也值得一提的是标准化：

e = (a - np.mean(a)) / np.std(a)

解决方案 3：

您还可以使用重新缩放sklearn.preprocessing.scale。优点是，除了对数据进行均值中心化之外，您还可以调整标准偏差的标准化，并且可以在任一轴、按特征或按记录执行此操作。

from sklearn.preprocessing import scale
X = scale(X, axis=0, with_mean=True, with_std=True, copy=True)

关键字参数axis、with_mean、with_std是不言自明的，并以默认状态显示。copy如果将参数设置为，则它会就地执行操作False。

解决方案 4：

audio您正在尝试对 -1 到 +1 之间以及image0 到 255 之间的值进行最小-最大缩放。

使用sklearn.preprocessing.minmax_scale，应该可以轻松解决您的问题。

例如：

audio_scaled = minmax_scale(audio, feature_range=(-1,1))

和

shape = image.shape
image_scaled = minmax_scale(image.ravel(), feature_range=(0,255)).reshape(shape)

注意：不要与将向量范数（长度）缩放到某个值（通常为 1）的操作相混淆，后者通常也称为规范化。

解决方案 5：

对类似问题的回答为我解决了这个问题

np.interp(a, (a.min(), a.max()), (-1, +1))

解决方案 6：

您可以使用“i”（如 idiv、imul..）版本，而且看起来还不错：

image /= (image.max()/255.0)

对于另一种情况，你可以编写一个函数来按列对 n 维数组进行规范化：

def normalize_columns(arr):
    rows, cols = arr.shape
    for col in xrange(cols):
        arr[:,col] /= abs(arr[:,col]).max()

解决方案 7：

一个简单的解决方案是使用 sklearn.preprocessing 库提供的缩放器。

scaler = sk.MinMaxScaler(feature_range=(0, 250))
scaler = scaler.fit(X)
X_scaled = scaler.transform(X)
# Checking reconstruction
X_rec = scaler.inverse_transform(X_scaled)

误差 X_rec-X 将为零。您可以根据需要调整 feature_range，甚至可以使用标准缩放器 sk.StandardScaler()

解决方案 8：

我尝试按照此操作，但出现错误

TypeError: ufunc 'true_divide' output (typecode 'd') could not be coerced to provided output parameter (typecode 'l') according to the casting rule ''same_kind''

numpy我尝试规范化的数组是一个数组integer。似乎它们在版本 > 中弃用了类型转换1.10，您必须使用numpy.true_divide()来解决这个问题。

arr = np.array(img)
arr = np.true_divide(arr,[255.0],out=None)

img是一个PIL.Image物体。