使用判别分析模型进行预测
预测
进行分类,以使期望的分类成本最小化:
在哪里
是预测的分类。
K是类的数量。
是类的后验概率吗k为观察x.
将观察结果分类的成本是y当它真正的阶级是k.
空间X
值划分为区域,其中进行分类Y
是一个特定的值。区域用直线进行线性判别分析,用圆锥截面(椭圆、双曲线或抛物线)进行二次判别分析。有关这些区域的可视化,请参见创建并可视化判别分析分类器.
后验概率
后验概率即为一点x属于班级k是产品的先验概率还有多元法向密度。多元正态分布的密度函数μk协方差Σk在某种程度上x是
在哪里 是Σ的行列式吗k, 是逆矩阵。
让P(k)表示类的先验概率k.那么后验概率就是一个观测值x是一流的k是
在哪里P(x)为归一化常数,即对k的P(x|k)P(k).
先验概率
先验概率是三种选择之一:
“统一”
-类的先验概率k
等于1除以类的总数。“经验”
-类的先验概率k
班级训练样本的数量是多少k
除以训练样本的总数。一个数字向量-类的先验概率
k
是j
的第Th元素之前
向量。看到fitcdiscr
.
创建分类器之后obj
,你可以使用点表示法设置先验:
obj。Prior = v;
在哪里v
是正元素的向量,表示每个元素出现的频率。当你设置一个新的先验时,你不需要重新训练分类器。
成本
与判别分析分类相关的成本有两种:每一类的真实错误分类成本和每观察的预期错误分类成本。
每类错误分类成本
成本(i, j)
将观测数据分类的成本是多少j
如果它真正的阶级是我
.默认情况下,成本(i, j) = 1
如果我~ = j
,成本(i, j) = 0
如果我=我
.换句话说,成本是0
为了正确的分类,和1
不正确的分类。
在创建分类器时,您可以设置您喜欢的任何成本矩阵。中传递成本矩阵成本
名称-值对fitcdiscr
.
在创建分类器之后obj
,您可以使用点符号设置自定义成本:
obj。成本=B;
B
方阵的大小是多少K
——- - - - - -K
当有K
类。当你设置一个新的代价时,你不需要重新训练分类器。
每次观察的预期错误分类成本
假设你有脑袋
你想用训练好的鉴别分析分类器分类的观察结果obj
.假设你有K
类。你把观察结果放入一个矩阵中Xnew
每行有一个观察值。命令
[label,score,cost] = predict(obj,Xnew)
在其他输出中,返回一个大小的成本矩阵脑袋
——- - - - - -K
.成本矩阵的每一行都包含将观测数据分类到每个类别的预期(平均)成本K
类。成本(n, k)
是
在哪里