机器学习：贝叶斯

核心假设：在类别y给定的条件下，特征之间是条件独立的

推理过程：

例题：

我们要预测：新样本Gender=Female，它的类别是Yes or No

优点：

局限：

对于缺失值：朴素贝叶斯天然适用于缺失值时，因为它假设特征条件独立，所以可以跳过缺失的特征，仅用已知的特征计算联合概率

判别准则：

$$
likelihood Ratio = \frac{P(X|Y=1)}{P(X|Y=0)}
$$

关注某一个特征组合在不同列别下的相对可能性

$$
posterior Odds = \frac{P(Y=1|X)}{P(Y=0|X)} = \frac{P(X|Y=1)P(Y=1)}{P(X|Y=0)P(Y=0)}
$$

零频率问题：当某个类别在训练集中没有出现时，直接计算条件概率会导致零概率，影响分类结果

解决方法：

$$
P(X_i|Y) = \frac{count(X_i, Y) + 1}{count(Y) + |X|}
$$

其中$|X|$为特征总数

在给定特征X的情况下，选择后验概率最大的类别Y作为预测结果

$$
Y^* = \arg\max_Y P(Y|X) = \arg\max_Y P(X|Y)P(Y)
$$

其中$P(Y)$是先验概率，$P(X|Y)$是似然函数

贝叶斯最优分类器是理论上最优的分类器，在所有可能的分类器中具有最低的错误率

朴素贝叶斯是贝叶斯最优分类器的一种近似实现，假设特征条件独立