机器学习：特征缩放

为了应对不同特征尺度差异的问题，我们通常在模型训练前进行归一化（Normalization）或标准化（Standardization）处理。这样可以提升模型的收敛速度与性能，特别是在距离敏感型算法中如 KNN、SVM、梯度下降优化等。

将特征值压缩到 $[0, 1]$ 区间内，计算公式为：

$$
x’ = \frac{x - x_{\min}}{x_{\max} - x_{\min}}
$$

特点：

也称为零均值归一化，使特征具有均值为 0、标准差为 1 的分布：

$$
x’ = \frac{x - \mu}{\sigma}
$$

特点：

方法	是否受异常值影响	常用于
Min-Max 归一化	敏感	图像像素、神经网络输入层
Z-score 标准化	稳健	线性回归、SVM、KNN、PCA