泛化误差

训练误差与测试误差之间的差异,衡量模型从训练数据推广到新数据的能力。

  • 可约误差

    • 偏差:指模型预测的期望与真实值之间的偏离,衡量模型预测能力,偏差高表示模型过于简单,不能很好地拟合数据。

    • 方差:指不同数据集下模型预测结果的波动性,衡量模型的稳定性,方差高表示模型对数据扰动敏感,容易过拟合。

  • 不可约误差

    • 由系统固有的不确定性或噪声造成

    • 无法通过任何建模手段降低

过拟合和欠拟合

  • 过拟合:模型在训练集上表现很好,但在测试集上误差很大,原因是模型复杂度太高,高方差

    解决策略:

    • 简化模型

    • 增加数据量

    • 正则化:岭回归、Lasso回归、Dropout

  • 欠拟合:模型在训练集和测试集上表现都不好,无法捕捉数据的基本结构,原因是模型太简单,偏差太高

    解决策略:

    • 增加模型复杂度

    • 使用更强的模型(加隐藏层,非线性激活)

    • 减少正则化力度