文档

使用判别分析模型进行预测

预测使用三个量来分类观察:后验概率先验概率,成本

预测进行分类,以使期望的分类成本最小化:

y 参数 最小值 y 1 ... K k 1 K P k | x C y | k

在哪里

  • y 是预测的分类。

  • K是类的数量。

  • P k | x 是类的后验概率吗k为观察x

  • C y | k 将观察结果分类的成本是y当它真正的阶级是k

空间X值划分为区域,其中进行分类Y是一个特定的值。区域用直线进行线性判别分析,用圆锥截面(椭圆、双曲线或抛物线)进行二次判别分析。有关这些区域的可视化,请参见创建并可视化判别分析分类器

后验概率

后验概率即为一点x属于班级k是产品的先验概率还有多元法向密度。多元正态分布的密度函数μk协方差Σk在某种程度上x

P x | k 1 2 π | Σ k | 1 / 2 经验值 1 2 x μ k T Σ k 1 x μ k

在哪里 | Σ k | 是Σ的行列式吗k, Σ k 1 是逆矩阵。

Pk)表示类的先验概率k.那么后验概率就是一个观测值x是一流的k

P k | x P x | k P k P x

在哪里Px)为归一化常数,即对kPx|kPk).

先验概率

先验概率是三种选择之一:

  • “统一”-类的先验概率k等于1除以类的总数。

  • “经验”-类的先验概率k班级训练样本的数量是多少k除以训练样本的总数。

  • 一个数字向量-类的先验概率kj的第Th元素之前向量。看到fitcdiscr

创建分类器之后obj,你可以使用点表示法设置先验:

obj。Prior = v;

在哪里v是正元素的向量,表示每个元素出现的频率。当你设置一个新的先验时,你不需要重新训练分类器。

成本

与判别分析分类相关的成本有两种:每一类的真实错误分类成本和每观察的预期错误分类成本。

每类错误分类成本

成本(i, j)将观测数据分类的成本是多少j如果它真正的阶级是.默认情况下,成本(i, j) = 1如果我~ = j,成本(i, j) = 0如果我=我.换句话说,成本是0为了正确的分类,和1不正确的分类。

在创建分类器时,您可以设置您喜欢的任何成本矩阵。中传递成本矩阵成本名称-值对fitcdiscr

在创建分类器之后obj,您可以使用点符号设置自定义成本:

obj。成本=B;

B方阵的大小是多少K——- - - - - -K当有K类。当你设置一个新的代价时,你不需要重新训练分类器。

每次观察的预期错误分类成本

假设你有脑袋你想用训练好的鉴别分析分类器分类的观察结果obj.假设你有K类。你把观察结果放入一个矩阵中Xnew每行有一个观察值。命令

[label,score,cost] = predict(obj,Xnew)

在其他输出中,返回一个大小的成本矩阵脑袋——- - - - - -K.成本矩阵的每一行都包含将观测数据分类到每个类别的预期(平均)成本K类。成本(n, k)

1 K P | X n e w n C k |

在哪里

  • K是类的数量。

  • P | X n e w n 后验概率类的为观察Xnewn).

  • C k | 成本将观察结果归类为k当它真正的阶级是

另请参阅

功能

对象

相关的话题