主要内容

ClassificationDiscriminant类

超类:CompactClassificationDiscriminant

判别分析分类

描述

一个ClassificationDiscriminant对象封装了一个判别分析分类器,它是一个用于数据生成的高斯混合模型。一个ClassificationDiscriminant对象可以预测新数据的响应预测方法。该对象包含用于训练的数据,因此可以计算再替代预测。

建设

创建一个ClassificationDiscriminant对象,使用fitcdiscr

属性

BetweenSigma

p——- - - - - -p矩阵,类间协方差,其中p是预测因子的数量。

CategoricalPredictors

分类预测器索引,始终为空([])。

一会

训练数据中的元素列表Y删除副本。一会可以是分类数组、字符向量的单元格数组、字符数组、逻辑向量或数字向量。一会与实参中的数据类型相同Y(该软件将字符串数组视为字符向量的单元格数组。)

多项式系数

k——- - - - - -k系数矩阵的结构,其中k是类的数量。多项式系数(i, j)包含类之间线性或二次边界的系数而且j.字段多项式系数(i, j)

  • DiscrimType

  • Class1- - - - - -一会(我)

  • 类别2- - - - - -一会(j)

  • 常量—标量

  • 线性-矢量p组件,p列的数量是多少X

  • 二次- - - - - -p——- - - - - -p矩阵,对于二次元存在DiscrimType

类与类之间的边界方程和类j

常量+线性*x+x '*二次*x=0

在哪里x列向量是长度吗p

如果fitcdiscrFillCoeffs名称-值对设置为“关闭”在构造分类器时,多项式系数为空([])。

成本

方阵,其中成本(i, j)将一个点分类的成本是多少j如果它真正的阶级是(即行对应真实的类,列对应预测的类)。的行和列的顺序成本中类的顺序对应一会.中的行数和列数成本响应中唯一类的数量。

改变一个成本使用点表示法的矩阵:obj。成本=成本Matrix

δ

线性判别模型的Delta阈值,非负标量。如果的系数obj大小小于δobj将这个系数设为0,这样你就可以从模型中消除相应的预测器。集δ到更高的值,以消除更多的预测因素。

δ必须0对于二次判别模型。

改变δ使用点符号:obj。Delta = newDelta

DeltaPredictor

行向量的长度等于中的预测数obj.如果deltappredictor (i) < Delta然后系数模型的特点是0

如果obj是二次判别模型,所有元素的DeltaPredictor0

DiscrimType

指定鉴别类型的字符向量。之一:

  • “线性”

  • “二次”

  • “diagLinear”

  • “diagQuadratic”

  • “pseudoLinear”

  • “pseudoQuadratic”

改变DiscrimType使用点符号:obj。D我scrimType = newDiscrimType

您可以在线性类型之间或二次类型之间进行更改,但不能在线性和二次类型之间进行更改。

γ

Gamma正则化参数的值,从的标量01.改变γ使用点符号:obj。= newGamma

  • 如果你设置1对于线性判别式,判别式将其类型设置为“diagLinear”

  • 如果你设置一个值MinGamma而且1对于线性判别式,判别式将其类型设置为“线性”

  • 属性的值以下不能设置值MinGamma财产。

  • 对于二次判别,你可以任意设置0(DiscrimType“二次”)或1(DiscrimType“diagQuadratic”)。

HyperparameterOptimizationResults

超参数的交叉验证优化的描述,存储为BayesianOptimization对象或超参数及相关值的表。当OptimizeHyperparameters名称-值对在创建时是非空的。属性的设置HyperparameterOptimizationOptions创建时的名称-值对:

  • “bayesopt”(默认)-类的对象BayesianOptimization

  • “gridsearch”“randomsearch”-使用的超参数表,观察到的目标函数值(交叉验证损失),以及从最低(最好)到最高(最差)的观察值排序

LogDetSigma

类内协方差矩阵行列式的对数。的类型LogDetSigma取决于判别类型:

  • 线性判别分析的标量

  • 长度向量K对于二次判别分析,其中K是课程的数量吗

MinGamma

非负标量,参数的最小值,使相关矩阵是可逆的。如果相关矩阵不是奇异的,MinGamma0

ModelParameters

训练参数obj

μ

类的意思是,指定为K——- - - - - -p矩阵的标量值类大小的平均数。K是班级的数量,和p是预测因子的数量。每行μ表示对应类的多元正态分布的均值。类索引在一会属性。

NumObservations

训练数据中的观察数,一个数值标量。NumObservations可以小于输入数据的行数吗X中缺少值时X或响应Y

PredictorNames

预测变量名称的单元格数组,按照它们在训练数据中出现的顺序X

之前

每个类的先验概率的数字向量。元素的顺序之前中类的顺序对应一会

添加或更改之前用点表示的向量:obj。Prior = priorVector

ResponseName

描述响应变量的特征向量Y

ScoreTransform

表示内置转换函数的字符向量,或用于转换分数的函数句柄。“没有”表示没有变换;同样,“没有”意味着@ x (x).有关内置转换函数的列表和自定义转换函数的语法,请参见fitcdiscr

实现点表示法来添加或更改ScoreTransform使用以下方法之一函数:

  • cobj。ScoreTransform = '函数

  • cobj。ScoreTransform = @函数

σ

类内协方差矩阵或矩阵。维度取决于DiscrimType

  • “线性”(默认)-大小矩阵p——- - - - - -p,在那里p预测因子的数量是多少

  • “二次”-大小数组p——- - - - - -p——- - - - - -K,在那里K是课程的数量吗

  • “diagLinear”-长度的行向量p

  • “diagQuadratic”-大小数组1——- - - - - -p——- - - - - -K

  • “pseudoLinear”-大小矩阵p——- - - - - -p

  • “pseudoQuadratic”-大小数组p——- - - - - -p——- - - - - -K

W

按比例缩小的权重,一个有长度的向量n的行数X

X

预测值矩阵。的每一列X表示一个预测器(变量),每一行表示一个观察结果。

Xcentered

X减去类均值的数据。如果Y(我)是一流的j

Xcentered(我,:)=X(我,:)- - - - - -μ(j,:)

在哪里μ是类的均值属性。

Y

类别数组、字符向量的单元格数组、字符数组、逻辑向量或具有相同行数的数字向量X.每行Y的对应行的分类X

对象的功能

紧凑的 紧凑判别分析分类器
crossval 交叉验证判别分析分类器
cvshrink 线性判别的交叉验证正则化
边缘 分类的优势
logp 对数无条件概率密度用于判别分析分类器
损失 分类错误
泰姬陵 马氏距离类均值
保证金 分类的利润率
nLinearCoeffs 非零线性系数的个数
partialDependence 计算部分依赖关系
plotPartialDependence 创建部分依赖图(PDP)和个别条件期望图(ICE)
预测 使用判别分析分类模型预测标签
resubEdge 通过置换分类边缘
resubLoss 再置换导致的分类错误
resubMargin 再置换分类边际
resubPredict 预测判别分析分类模型的再置换标签

复制语义

价值。要了解值类如何影响复制操作,请参见复制对象

例子

全部折叠

加载费雪的虹膜数据集。

负载fisheriris

使用整个数据集训练判别分析模型。

Mdl = fitcdiscr(meas,species)
Mdl = ClassificationDiscriminant ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'setosa' 'versicolor' 'virginica'} ScoreTransform: 'none' NumObservations: 150 discritype: 'linear' Mu: [3x4 double] Coeffs: [3x3 struct]属性,方法

Mdl是一个ClassificationDiscriminant模型。要访问其属性,请使用点表示法。例如,显示每个预测器的组均值。

Mdl。μ
ans =3×45.0060 3.4280 1.4620 0.2460 5.9360 2.7700 4.2600 1.3260 6.5880 2.9740 5.5520 2.0260

要预测新观测值的标签,请通过Mdl预测数据预测

更多关于

全部展开

参考文献

[1]郭,Y., T.哈斯蒂,R.蒂布谢拉尼。正则化线性判别分析及其在微阵列中的应用。《生物统计学》第8卷第1期,第86-100页,2007。

扩展功能

在R2011b中引入