CompactGeneralizedLinearModel
紧凑的广义线性回归模型类
描述
CompactGeneralizedLinearModel
一个完整的广义线性回归模型的紧凑版本是对象吗GeneralizedLinearModel
.由于紧凑模型不存储用于拟合模型的输入数据或与拟合过程相关的信息,因此可以使用CompactGeneralizedLinearModel
对象消耗的内存小于GeneralizedLinearModel
对象。你可以使用一个紧凑的模型来预测使用新的输入数据的响应,但是有些GeneralizedLinearModel
对象函数不适用于紧凑模型。
创建
创建一个CompactGeneralizedLinearModel
模特出身丰满,训练有素GeneralizedLinearModel
通过使用紧凑的
.
fitglm
返回CompactGeneralizedLinearModel
当您使用高数组时,并返回GeneralizedLinearModel
当您使用内存中的表和数组时。
属性
系数估计
CoefficientCovariance
- - - - - -系数估计的协方差矩阵
数字矩阵
CoefficientNames
- - - - - -系数的名字
字符向量的单元格数组
此属性是只读的。
系数名,指定为字符向量的单元格数组,每个单元格包含相应项的名称。
数据类型:细胞
系数
- - - - - -系数值
表格
此属性是只读的。
系数值,指定为表格。系数
每个系数包含一行,这些列:
估计
-估计系数值SE
-估算的标准误差tStat
- - - - - -t-statistic用于测试系数为零的情况pValue
- - - - - -p-valuet统计
使用方差分析
(仅适用于线性回归模型)或coefTest
对系数进行其他测试。使用coefCI
求系数估计的置信区间。
若要以向量的形式获取这些列,请使用点表示法将其索引到属性中。例如,得到模型中估计的系数向量mdl
:
beta = mdl.系数。估计
数据类型:表格
NumCoefficients
- - - - - -模型系数数
正整数
此属性是只读的。
模型系数的数目,指定为正整数。NumCoefficients
包括当模型项秩亏时设置为零的系数。
数据类型:双
NumEstimatedCoefficients
- - - - - -估计系数数
正整数
此属性是只读的。
模型中估计的系数数,指定为正整数。NumEstimatedCoefficients
不包括当模型项秩亏时设置为零的系数。NumEstimatedCoefficients
是回归的自由度。
数据类型:双
摘要统计信息
异常
- - - - - -配合偏差
数值
此属性是只读的。
配合的偏差,用数值表示。当一个模型是另一个模型的特殊情况时,偏差对于比较两个模型是有用的。两种模型的偏差值之差呈卡方分布,其自由度等于两种模型估计参数数量之差。有关更多信息,请参见异常.
数据类型:单
|双
教育部
- - - - - -误差的自由度
正整数
此属性是只读的。
误差(残差)的自由度,等于观测数减去估计系数数,指定为正整数。
数据类型:双
分散
- - - - - -反应方差的比例因子
数字标量
此属性是只读的。
响应方差的比例因子,指定为数值标量。
如果“DispersionFlag”
的名称-值对参数fitglm
或stepwiseglm
是真正的
,则该函数估计分散
计算响应方差的比例因子。响应的方差等于理论方差乘以比例因子。例如,二项分布的方差函数为p(1 -p) /n,在那里p概率参数是和吗n是样本大小参数。如果分散
近了1
,数据的方差似乎与二项分布的理论方差一致。如果分散
大于1
时,数据集相对于二项分布是“过度分散”的。
数据类型:双
DispersionEstimated
- - - - - -标志表示使用了分散比例因子
逻辑值
此属性是只读的。
标志,指示是否fitglm
使用了分散
比例因子用于计算系数的标准误差系数。SE
,指定为逻辑值。如果DispersionEstimated
是假
,fitglm
采用了理论值的方差。
DispersionEstimated
可以假
只适用于二项分布和泊松分布。集
DispersionEstimated
通过设置“DispersionFlag”
的名称-值对参数fitglm
或stepwiseglm
.
数据类型:逻辑
LogLikelihood
- - - - - -Loglikelihood
数值
此属性是只读的。
模型分布在响应值处的对数似然,指定为数值。均值从模型中拟合,其他参数作为模型拟合的一部分进行估计。
数据类型:单
|双
ModelCriterion
- - - - - -模型比较准则
结构
此属性是只读的。
模型比较的标准,指定为具有以下字段的结构:
另类投资会议
-赤池信息准则。AIC = -2 *logL + 2*m
,在那里logL
loglikelihood和米
是估计参数的个数。AICc
-赤池信息标准校正样本量。AICc = AIC + (2*m*(m + 1))/(n - m - 1)
,在那里n
是观测的数量。BIC
-贝叶斯信息准则。BIC = -2 *logL + m*log(n)
.中安集团经贸
—一致赤池信息标准。CAIC = -2 *logL + m*(log(n) + 1)
.
信息标准是模型选择工具,您可以使用它来比较适合相同数据的多个模型。这些标准是基于可能性的模型拟合度量,包括对复杂性的惩罚(具体地说,参数的数量)。不同的信息标准通过处罚的形式来区分。
当对多个模型进行比较时,信息准则值最低的模型为最佳拟合模型。最佳拟合模型可以根据用于模型比较的标准而变化。
若要以标量形式获取任何标准值,请使用点表示法将其索引到属性中。例如,获取AIC值另类投资会议
在模型中mdl
:
aic = mdl.ModelCriterion.AIC
数据类型:结构体
Rsquared
- - - - - -模型的r平方值
结构
此属性是只读的。
模型的r平方值,指定为具有五个字段的结构:
普通的
-普通(未经调整)r平方调整
- r平方调整系数的数量LLR
-对数似然比异常
——异常AdjGeneralized
-调整广义r平方
r平方值是由模型解释的总平方和的比例。普通的r平方值与苏维埃社会主义共和国
而且风场
属性:
r平方= SSR/SST
若要以标量形式获取这些值,请使用点表示法将其索引到属性中。例如,得到模型中调整后的r平方值mdl
:
r2 = mll . rsquared .已调整
数据类型:结构体
上交所
- - - - - -误差平方和
数值
此属性是只读的。
误差平方和(残差),用数值表示。
数据类型:单
|双
苏维埃社会主义共和国
- - - - - -回归平方和
数值
此属性是只读的。
回归平方和,指定为数值。回归平方和等于拟合值与其平均值的偏差平方和。
数据类型:单
|双
风场
- - - - - -总平方和
数值
此属性是只读的。
总平方和,指定为数值。总平方和等于响应向量偏差的平方和y
从意思是(y)
.
数据类型:单
|双
输入数据
分布
- - - - - -广义分布信息
结构
此属性是只读的。
广义分布信息,指定为具有本表中所述字段的结构。
场 | 描述 |
---|---|
的名字 |
发行版名称:“正常” ,“二” ,“泊松” ,“伽马” ,或逆高斯分布的 |
DevianceFunction |
作为拟合参数值和响应值的函数计算偏差分量的函数 |
VarianceFunction |
作为拟合参数值的函数计算分布的理论方差的函数。当DispersionEstimated 是真正的 ,分散 乘方差函数计算系数标准误差。 |
数据类型:结构体
公式
- - - - - -模型信息
LinearFormula
对象
此属性是只读的。
模型信息,指定为LinearFormula
对象。
显示拟合模型的公式mdl
使用点符号:
mdl。F或米ula
链接
- - - - - -链接功能
结构
此属性是只读的。
链接函数,指定为具有本表中所述字段的结构。
场 | 描述 |
---|---|
的名字 |
链接函数的名称,指定为字符向量。如果使用函数句柄指定链接函数,则的名字 是” . |
LinkFunction |
函数f它定义链接函数,指定为函数句柄 |
DevianceFunction |
的导数f,指定为函数句柄 |
VarianceFunction |
逆的f,指定为函数句柄 |
link函数是一个函数f链接分布参数μ到拟合的线性组合Xb预测因素:
f(μ) =Xb.
数据类型:结构体
NumObservations
- - - - - -观察次数
正整数
此属性是只读的。
拟合函数在拟合中使用的观察数,以正整数指定。NumObservations
原始表、数据集或矩阵中提供的观察数是否减去任何排除的行(用“排除”
名称-值对参数)或缺少值的行。
数据类型:双
NumPredictors
- - - - - -预测变量数量
正整数
此属性是只读的。
用于拟合模型的预测变量数,指定为正整数。
数据类型:双
NumVariables
- - - - - -变量数量
正整数
此属性是只读的。
输入数据中的变量数,指定为正整数。NumVariables
是原始表或数据集中的变量数,或预测器矩阵和响应向量中的列总数。
NumVariables
还包括不用于拟合模型作为预测因子或响应的任何变量。
数据类型:双
PredictorNames
- - - - - -用于拟合模型的预测因子名称
字符向量的单元格数组
此属性是只读的。
用于拟合模型的预测器名称,指定为字符向量的单元格数组。
数据类型:细胞
ResponseName
- - - - - -响应变量名
特征向量
此属性是只读的。
响应变量名,指定为字符向量。
数据类型:字符
VariableInfo
- - - - - -关于变量的信息
表格
此属性是只读的。
中包含的变量的信息变量
,指定为一个表,每个变量有一行,该表中描述的列。
列 | 描述 |
---|---|
类 |
变量类,指定为字符向量的单元格数组,例如“双” 而且“分类” |
范围 |
变量范围,指定为单元格向量数组
|
InModel |
拟合模型中变量的指示器,指定为逻辑向量。取值为真正的 如果模型包含变量。 |
IsCategorical |
类别变量的指示符,指定为逻辑向量。取值为真正的 如果变量是分类的。 |
VariableInfo
还包括不用于拟合模型作为预测因子或响应的任何变量。
数据类型:表格
VariableNames
- - - - - -变量名
字符向量的单元格数组
此属性是只读的。
变量的名称,指定为字符向量的单元格数组。
如果拟合基于表或数据集,则此属性提供表或数据集中变量的名称。
如果拟合是基于预测矩阵和响应向量,
VariableNames
属性指定的值“VarNames”
拟合方法的名称-值对参数。的默认值“VarNames”
是{x1, x2,…,‘xn’,‘y’}
.
VariableNames
还包括不用于拟合模型作为预测因子或响应的任何变量。
数据类型:细胞
对象的功能
评价广义线性模型
coefCI |
广义线性回归模型系数估计的置信区间 |
coefTest |
广义线性回归模型系数的线性假设检验 |
devianceTest |
广义线性回归模型的偏差分析 |
partialDependence |
计算部分依赖关系 |
可视化广义线性模型和汇总统计
plotPartialDependence |
创建部分依赖图(PDP)和个别条件期望图(ICE) |
plotSlice |
通过拟合的广义线性回归曲面绘制切片图 |
广义线性模型的集合性质
收集 |
收集线性或广义线性回归模型的性质 |
例子
紧凑广义线性回归模型
将广义线性回归模型与数据拟合,并通过丢弃样本数据和一些与拟合过程相关的信息来减小完整拟合模型的大小。
加载largedata4reg
数据集,其中包含15,000个观测值和45个预测变量。
负载largedata4reg
使用前15个预测变量拟合数据的广义线性回归模型。
mdl = fitglm(X(:,1:15),Y);
压缩模型。
compactMdl = compact(mdl);
紧凑模型丢弃了原始样本数据和一些与拟合过程相关的信息,因此它比完整模型使用更少的内存。
比较完整模型的大小mdl
以及紧凑的模型compactMdl
.
Vars = whoos (“compactMdl”,“mdl”);(var (1) .bytes一样,var (2) .bytes]
ans =1×215518 4382502
紧凑模型比完整模型消耗的内存更少。
更多关于
异常
模型的偏差米1两倍是模型对数似然的差值吗米1饱和模型米年代.饱和模型是具有您可以估计的最大参数数量的模型。
例如,如果你有n观察(y我,我= 1, 2,…n的值可能不同X我T,则可以定义一个饱和模型n参数。让l(b,y)表示具有参数的模型的似然函数的最大值b.然后是模型的偏差米1是
在哪里b1而且b年代包含模型的估计参数米1和饱和模型。的偏差呈卡方分布n- - - - - -p自由度,其中n饱和模型中参数的数量和p模型中参数的数量是多少米1.
假设你有两个不同的广义线性回归模型米1而且米2,米1有一个子集的术语米2.您可以通过比较偏差来评估模型的拟合性D1而且D2在这两个模型中。偏差的差值是
渐近地,差值D有自由度的卡方分布吗v等于中估计的参数数目之差米1而且米2.您可以获取p-value通过使用1 - chi2cdf(D,v)
.
一般来说,你检查D使用模型米2是常数项,没有预测因子。因此,D卡方分布p- 1自由度。如果估计了离散度,则差值除以估计的离散度有一个F分布与p- 1分子自由度和n- - - - - -p分母自由度。
扩展功能
C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。
使用注意事项和限制:
当你用
fitglm
或stepwiseglm
,则适用以下限制。代码生成不支持分类预测器。金宝app不能在包含逻辑向量、字符数组、分类数组、字符串数组或字符向量单元格数组的表中提供训练数据。而且,不能使用
“CategoricalVars”
名称-值对参数。若要在模型中包含分类预测器,请使用dummyvar
在拟合模型之前。的
链接
,导数
,逆
字段“链接”
名称-值对参数不能为匿名函数。也就是说,您不能使用使用匿名函数为链接创建的广义线性模型来生成代码。相反,应该为链接组件定义函数。
有关更多信息,请参见代码生成简介.
GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。
使用注意事项和限制:
以下对象函数完全支持GPU阵列:金宝app
下面的对象函数支持用GPU数组输入参数拟合的模型对象:金宝app
有关更多信息,请参见在图形处理器上运行MATLAB函数(并行计算工具箱).
MATLAB命令
你点击了一个对应于这个MATLAB命令的链接:
在MATLAB命令窗口中输入该命令来运行该命令。Web浏览器不支持MATLAB命令。金宝app
您也可以从以下列表中选择一个网站:
如何获得最佳的网站性能
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。