sklearn StandardScaler返回全零
问题内容:
我StandardScaler
从以前的模型中保存了一个sklearn ,并尝试将其应用于新数据
scaler = myOldStandardScaler
print("ORIG:", X)
print("CLASS:", X.__class__)
X = scaler.fit_transform(X)
print("SCALED:", X)
我有三个观测值,每个观测值都具有2000个功能。如果我分别运行每个观察值,我将得到全零的输出。
ORIG: [[ 3.19029839e-04 0.00000000e+00 1.90985485e-06 ..., 0.00000000e+00
0.00000000e+00 0.00000000e+00]]
CLASS: <class 'numpy.matrixlib.defmatrix.matrix'>
SCALED: [[ 0. 0. 0. ..., 0. 0. 0.]]
但是,如果我将所有三个观察结果附加到一个数组中,我将得到想要的结果
ORIG: [[ 0.00000000e+00 8.69737728e-08 7.53361877e-06 ..., 0.00000000e+00
0.00000000e+00 0.00000000e+00]
[ 9.49627142e-04 0.00000000e+00 0.00000000e+00 ..., 0.00000000e+00
0.00000000e+00 0.00000000e+00]
[ 3.19029839e-04 0.00000000e+00 1.90985485e-06 ..., 0.00000000e+00
0.00000000e+00 0.00000000e+00]]
CLASS: <class 'numpy.matrixlib.defmatrix.matrix'>
SCALED: [[-1.07174217 1.41421356 1.37153077 ..., 0. 0. 0. ]
[ 1.33494964 -0.70710678 -0.98439142 ..., 0. 0. 0. ]
[-0.26320747 -0.70710678 -0.38713935 ..., 0. 0. 0. ]]
我看过以下两个问题:
两者都没有一个可接受的答案。
我试过了:
- 从(1,n)重塑为(n,1)(这会给出错误的结果)
- 将数组转换为
np.float32
andnp.float64
(仍然全为零) - 创建一个数组的数组(再次为全零)
- 再创建一个
np.matrix
(全零)
我想念什么?输入的fit_transform
是相同的类型,只是大小不同。
如何让StandardScaler进行单个观察?
问题答案:
当您尝试将对象的fit_transform
方法应用于StandardScaler
大小为(1,n)的数组时,您显然会得到全零,因为对于数组的每个数字,您要从中减去该数字的均值,该均值等于number并除以std数。如果要正确缩放数组,则应将其转换为大小为(n,1)的数组。您可以这样进行:
import numpy as np
X = np.array([1, -4, 5, 6, -8, 5]) # here should be your X in np.array format
X_transformed = scaler.fit_transform(X[:, np.newaxis])
在这种情况下,您将通过对象的功能获得一个对象的标准缩放比例,这不是您要找的。
如果要按3个对象的一个要素进行缩放,则应将fit_transform
大小为(3,1)的方法数组传递给每个对象对应的特定要素的值。
X = np.array([0.00000000e+00, 9.49627142e-04, 3.19029839e-04])
X_transformed = scaler.fit_transform(X[:, np.newaxis]) # you should get
# array([[-1.07174217], [1.33494964], [-0.26320747]]) you're looking for
而且,如果要使用已经安装的StandardScaler对象,则不应该使用fit_transform
method,因为它会用新数据重新调整对象。StandardScaler
具有transform
方法,可用于单次观察:
X = np.array([1, -4, 5, 6, -8, 5]) # here should be your X in np.array format
X_transformed = scaler.transform(X.reshape(1, -1))