线性判别分析 scikit-learn 进行线性判别分析 调整 LDA 超参数
线性判别分析 简称 LDA 是一种线性分类机器学习算法。 该算法涉及根据每个输入变量的观测值的特定分布为每个类别开发一个概率模型。然后通过计算它属于每个类的条件概率并选择具有最高概率的类来对新示例进行分类。因此,它是一个相对简单的概率分类模型,它对每个输入变量的分布做出强有力的假设,尽管即使违反这些预期(例如预测错误),还是可以做出有效的预测。
线性判别分析通过按类标签计算输入特征的汇总统计数据来工作,例如均值和标准差。这些统计数据代表从训练数据中学习到的模型。在实践中,线性代数运算用于通过矩阵分解有效地计算所需数量。
通过基于每个输入特征的值估计新示例属于每个类标签的概率来进行预测。然后将导致最大概率的类分配给示例。因此,LDA 可以被认为是贝叶斯定理的简单分类应用。
LDA 假设输入变量是数值型且正态分布,并且它们具有相同的方差(分布)。如果不是这种情况,