主要内容

CompactGeneralizedLinearModel

紧凑的广义线性回归模型类

描述

CompactGeneralizedLinearModel一个完整的广义线性回归模型的紧凑版本是对象吗GeneralizedLinearModel.由于紧凑模型不存储用于拟合模型的输入数据或与拟合过程相关的信息,因此可以使用CompactGeneralizedLinearModel对象消耗的内存小于GeneralizedLinearModel对象。你可以使用一个紧凑的模型来预测使用新的输入数据的响应,但是有些GeneralizedLinearModel对象函数不适用于紧凑模型。

创建

创建一个CompactGeneralizedLinearModel模特出身丰满,训练有素GeneralizedLinearModel通过使用紧凑的

fitglm返回CompactGeneralizedLinearModel当您使用高数组时,并返回GeneralizedLinearModel当您使用内存中的表和数组时。

属性

全部展开

系数估计

此属性是只读的。

系数估计的协方差矩阵,用a表示p——- - - - - -p数值矩阵。p为拟合模型中的系数数。

详细信息请参见系数、标准误差和置信区间

数据类型:|

此属性是只读的。

系数名,指定为字符向量的单元格数组,每个单元格包含相应项的名称。

数据类型:细胞

此属性是只读的。

系数值,指定为表格。系数每个系数包含一行,这些列:

  • 估计-估计系数值

  • SE-估算的标准误差

  • tStat- - - - - -t-statistic用于测试系数为零的情况

  • pValue- - - - - -p-valuet统计

使用方差分析(仅适用于线性回归模型)或coefTest对系数进行其他测试。使用coefCI求系数估计的置信区间。

若要以向量的形式获取这些列,请使用点表示法将其索引到属性中。例如,得到模型中估计的系数向量mdl

beta = mdl.系数。估计

数据类型:表格

此属性是只读的。

模型系数的数目,指定为正整数。NumCoefficients包括当模型项秩亏时设置为零的系数。

数据类型:

此属性是只读的。

模型中估计的系数数,指定为正整数。NumEstimatedCoefficients不包括当模型项秩亏时设置为零的系数。NumEstimatedCoefficients是回归的自由度。

数据类型:

摘要统计信息

此属性是只读的。

配合的偏差,用数值表示。当一个模型是另一个模型的特殊情况时,偏差对于比较两个模型是有用的。两种模型的偏差值之差呈卡方分布,其自由度等于两种模型估计参数数量之差。有关更多信息,请参见异常

数据类型:|

此属性是只读的。

误差(残差)的自由度,等于观测数减去估计系数数,指定为正整数。

数据类型:

此属性是只读的。

响应方差的比例因子,指定为数值标量。

如果“DispersionFlag”的名称-值对参数fitglmstepwiseglm真正的,则该函数估计分散计算响应方差的比例因子。响应的方差等于理论方差乘以比例因子。例如,二项分布的方差函数为p(1 -p) /n,在那里p概率参数是和吗n是样本大小参数。如果分散近了1,数据的方差似乎与二项分布的理论方差一致。如果分散大于1时,数据集相对于二项分布是“过度分散”的。

数据类型:

此属性是只读的。

标志,指示是否fitglm使用了分散比例因子用于计算系数的标准误差系数。SE,指定为逻辑值。如果DispersionEstimatedfitglm采用了理论值的方差。

  • DispersionEstimated可以只适用于二项分布和泊松分布。

  • DispersionEstimated通过设置“DispersionFlag”的名称-值对参数fitglmstepwiseglm

数据类型:逻辑

此属性是只读的。

模型分布在响应值处的对数似然,指定为数值。均值从模型中拟合,其他参数作为模型拟合的一部分进行估计。

数据类型:|

此属性是只读的。

模型比较的标准,指定为具有以下字段的结构:

  • 另类投资会议-赤池信息准则。AIC = -2 *logL + 2*m,在那里logLloglikelihood和是估计参数的个数。

  • AICc-赤池信息标准校正样本量。AICc = AIC + (2*m*(m + 1))/(n - m - 1),在那里n是观测的数量。

  • BIC-贝叶斯信息准则。BIC = -2 *logL + m*log(n)

  • 中安集团经贸—一致赤池信息标准。CAIC = -2 *logL + m*(log(n) + 1)

信息标准是模型选择工具,您可以使用它来比较适合相同数据的多个模型。这些标准是基于可能性的模型拟合度量,包括对复杂性的惩罚(具体地说,参数的数量)。不同的信息标准通过处罚的形式来区分。

当对多个模型进行比较时,信息准则值最低的模型为最佳拟合模型。最佳拟合模型可以根据用于模型比较的标准而变化。

若要以标量形式获取任何标准值,请使用点表示法将其索引到属性中。例如,获取AIC值另类投资会议在模型中mdl

aic = mdl.ModelCriterion.AIC

数据类型:结构体

此属性是只读的。

模型的r平方值,指定为具有五个字段的结构:

  • 普通的-普通(未经调整)r平方

  • 调整- r平方调整系数的数量

  • LLR-对数似然比

  • 异常——异常

  • AdjGeneralized-调整广义r平方

r平方值是由模型解释的总平方和的比例。普通的r平方值与苏维埃社会主义共和国而且风场属性:

r平方= SSR/SST

若要以标量形式获取这些值,请使用点表示法将其索引到属性中。例如,得到模型中调整后的r平方值mdl

r2 = mll . rsquared .已调整

数据类型:结构体

此属性是只读的。

误差平方和(残差),用数值表示。

数据类型:|

此属性是只读的。

回归平方和,指定为数值。回归平方和等于拟合值与其平均值的偏差平方和。

数据类型:|

此属性是只读的。

总平方和,指定为数值。总平方和等于响应向量偏差的平方和y意思是(y)

数据类型:|

输入数据

此属性是只读的。

广义分布信息,指定为具有本表中所述字段的结构。

描述
的名字 发行版名称:“正常”“二”“泊松”“伽马”,或逆高斯分布的
DevianceFunction 作为拟合参数值和响应值的函数计算偏差分量的函数
VarianceFunction 作为拟合参数值的函数计算分布的理论方差的函数。当DispersionEstimated真正的分散乘方差函数计算系数标准误差。

数据类型:结构体

此属性是只读的。

模型信息,指定为LinearFormula对象。

显示拟合模型的公式mdl使用点符号:

mdl。F或米ula

此属性是只读的。

拟合函数在拟合中使用的观察数,以正整数指定。NumObservations原始表、数据集或矩阵中提供的观察数是否减去任何排除的行(用“排除”名称-值对参数)或缺少值的行。

数据类型:

此属性是只读的。

用于拟合模型的预测变量数,指定为正整数。

数据类型:

此属性是只读的。

输入数据中的变量数,指定为正整数。NumVariables是原始表或数据集中的变量数,或预测器矩阵和响应向量中的列总数。

NumVariables还包括不用于拟合模型作为预测因子或响应的任何变量。

数据类型:

此属性是只读的。

用于拟合模型的预测器名称,指定为字符向量的单元格数组。

数据类型:细胞

此属性是只读的。

响应变量名,指定为字符向量。

数据类型:字符

此属性是只读的。

中包含的变量的信息变量,指定为一个表,每个变量有一行,该表中描述的列。

描述
变量类,指定为字符向量的单元格数组,例如“双”而且“分类”
范围

变量范围,指定为单元格向量数组

  • 连续变量-两元向量最小值马克斯]为最小值和最大值

  • 分类变量-不同变量值的向量

InModel 拟合模型中变量的指示器,指定为逻辑向量。取值为真正的如果模型包含变量。
IsCategorical 类别变量的指示符,指定为逻辑向量。取值为真正的如果变量是分类的。

VariableInfo还包括不用于拟合模型作为预测因子或响应的任何变量。

数据类型:表格

此属性是只读的。

变量的名称,指定为字符向量的单元格数组。

  • 如果拟合基于表或数据集,则此属性提供表或数据集中变量的名称。

  • 如果拟合是基于预测矩阵和响应向量,VariableNames属性指定的值“VarNames”拟合方法的名称-值对参数。的默认值“VarNames”{x1, x2,…,‘xn’,‘y’}

VariableNames还包括不用于拟合模型作为预测因子或响应的任何变量。

数据类型:细胞

对象的功能

全部展开

函数宏指令 对每个预测器使用一个输入来预测广义线性回归模型的响应
预测 预测广义线性回归模型的响应
随机 用随机噪声模拟广义线性回归模型的响应
coefCI 广义线性回归模型系数估计的置信区间
coefTest 广义线性回归模型系数的线性假设检验
devianceTest 广义线性回归模型的偏差分析
partialDependence 计算部分依赖关系
plotPartialDependence 创建部分依赖图(PDP)和个别条件期望图(ICE)
plotSlice 通过拟合的广义线性回归曲面绘制切片图
收集 收集线性或广义线性回归模型的性质

例子

全部折叠

将广义线性回归模型与数据拟合,并通过丢弃样本数据和一些与拟合过程相关的信息来减小完整拟合模型的大小。

加载largedata4reg数据集,其中包含15,000个观测值和45个预测变量。

负载largedata4reg

使用前15个预测变量拟合数据的广义线性回归模型。

mdl = fitglm(X(:,1:15),Y);

压缩模型。

compactMdl = compact(mdl);

紧凑模型丢弃了原始样本数据和一些与拟合过程相关的信息,因此它比完整模型使用更少的内存。

比较完整模型的大小mdl以及紧凑的模型compactMdl

Vars = whoos (“compactMdl”“mdl”);(var (1) .bytes一样,var (2) .bytes]
ans =1×215518 4382502

紧凑模型比完整模型消耗的内存更少。

更多关于

全部展开

扩展功能

在R2016b中引入