主要内容

fitdist

合适的概率分布对象的数据

描述

例子

pd= fitdist (x,distname)创建一个概率分布对象由指定的分布distname数据的列向量x

例子

pd= fitdist (x,distname,名称,值)创建概率分布对象与附加选项指定一个或多个名称-值对参数。例如,您可以显示数据审查或指定迭代匹配算法的控制参数。

例子

(pdca,gn,gl)= fitdist (x,distname“通过”,groupvar)创建概率分布对象由指定的分布distname的数据x基于分组变量groupvar。它返回一个合适的概率分布对象的单元阵列,pdca单元阵列的标签,gn和一个单元阵列分组变量的水平,gl

例子

(pdca,gn,gl)= fitdist (x,distname“通过”,groupvar,名称,值)上面返回输出参数使用由一个或多个指定附加选项名称-值对参数。例如,您可以显示数据审查或指定迭代匹配算法的控制参数。

例子

全部折叠

加载示例数据。创建一个包含病人的体重数据的向量。

负载医院x = hospital.Weight;

创建一个正态分布对象通过拟合数据。

pd = fitdist (x,“正常”)
pd = NormalDistribution正态分布μ= 154[148.728,159.272]σ= 26.5714 (23.3299,30.8674)

旁边的间隔参数估计的95%置信区间的分布参数。

情节的pdf分布。

x_values = 50:1:250;y = pdf (pd, x_values);情节(x_values y“线宽”,2)

加载示例数据。创建一个包含病人的体重数据的向量。

负载医院x = hospital.Weight;

创建一个内核对象通过拟合的数据分布。使用Epanechnikov内核函数。

pd = fitdist (x,“内核”,“内核”,“epanechnikov”)
pd = KernelDistribution内核= = 14.3792支持=无限epanechnikov带宽金宝app

情节的pdf分布。

x_values = 50:1:250;y = pdf (pd, x_values);情节(x_values, y)

加载示例数据。创建一个包含病人的体重数据的向量。

负载医院x = hospital.Weight;

创建正态分布对象通过拟合的数据,按病人性别分组。

性别= hospital.Sex;(pdca gn, gl) = fitdist (x,“正常”,“通过”、性别)
pdca =1×2单元阵列{1 x1概率。x1 prob.NormalDistribution NormalDistribution} {1}
gn =2 x1细胞{'女'}{‘男性’}
gl =2 x1细胞{'女'}{‘男性’}

细胞数组pdca包含两个概率分布的对象,一个用于每个性别组。细胞数组gn包含两组标签。细胞数组gl包含两个集团的水平。

查看每个单元阵列的分布pdca比较的意思,μ和标准偏差,σ,按病人性别分组。

女= pdca {1}%分布雌性
女= NormalDistribution正态分布μ= 130.472[128.183,132.76]σ= 8.30339 (6.96947,10.2736)
男= pdca {2}%分布男性
男= NormalDistribution正态分布μ= 180.532[177.833,183.231]σ= 9.19322 (7.63933,11.5466)

计算每个分布的pdf。

x_values = 50:1:250;femalepdf = pdf(女,x_values);malepdf = pdf(男,x_values);

情节的pdf视觉比较性别的重量分布。

图绘制(x_values femalepdf,“线宽”,2)情节(x_values malepdf,“颜色”,“r”,“线型”,“:”,“线宽”2)传说(gn,“位置”,“东北”)举行

加载示例数据。创建一个包含病人的体重数据的向量。

负载医院x = hospital.Weight;

创建内核对象通过拟合的数据分布,按病人性别分组。使用一个三角形的内核函数。

性别= hospital.Sex;(pdca gn, gl) = fitdist (x,“内核”,“通过”、性别、“内核”,“三角形”);

查看每个单元阵列的分布pdca每个性别的内核发行版。

女= pdca {1}%分布雌性
女= KernelDistribution内核=三角形带宽= 4.25894 =无限的支持金宝app
男= pdca {2}%分布男性
男= KernelDistribution内核=三角形带宽= 5.08961 =无限的支持金宝app

计算每个分布的pdf。

x_values = 50:1:250;femalepdf = pdf(女,x_values);malepdf = pdf(男,x_values);

情节的pdf视觉比较性别的重量分布。

图绘制(x_values femalepdf,“线宽”,2)情节(x_values malepdf,“颜色”,“r”,“线型”,“:”,“线宽”2)传说(gn,“位置”,“东北”)举行

输入参数

全部折叠

输入数据,指定为一个列向量。fitdist忽略了x。此外,任何审查向量或频率向量中的值的原因fitdist忽略相应的值x

数据类型:

分布的名字,指定为以下特征向量或字符串标量之一。指定的分布distname确定返回的概率分布对象的类型。

分布的名字 描述 分布对象
“β” 贝塔分布 BetaDistribution
“二” 二项分布 BinomialDistribution
“BirnbaumSaunders” Birnbaum-Saunders分布 BirnbaumSaundersDistribution
“毛刺” 毛刺分布 BurrDistribution
“指数” 指数分布 ExponentialDistribution
“ExtremeValue” 极端值分布 ExtremeValueDistribution
“伽马” 伽马分布 GammaDistribution
“GeneralizedExtremeValue” 广义极值分布 GeneralizedExtremeValueDistribution
“GeneralizedPareto” 广义帕累托分布 GeneralizedParetoDistribution
“HalfNormal” Half-normal分布 HalfNormalDistribution
“InverseGaussian” 逆高斯分布 InverseGaussianDistribution
“内核” 内核分配 KernelDistribution
“物流” 物流配送 LogisticDistribution
“Loglogistic” Loglogistic分布 LoglogisticDistribution
对数正态的 对数正态分布 LognormalDistribution
“Nakagami” Nakagami分布 NakagamiDistribution
“NegativeBinomial” 负二项分布 NegativeBinomialDistribution
“正常” 正态分布 NormalDistribution
“泊松” 泊松分布 PoissonDistribution
“瑞利” 瑞利分布 RayleighDistribution
“Rician” Rician分布 RicianDistribution
“稳定” 稳定分布 StableDistribution
“tLocationScale” tLocation-Scale分布 tLocationScaleDistribution
“威布尔” 威布尔分布 WeibullDistribution

分组变量,数组指定为一个分类、逻辑或数值向量,字符数组,字符串数组或单元阵列特征向量。每个分组变量定义了一组独特的价值。

例如,如果性别是一个单元阵列特征向量的值“男”“女”,你可以使用性别作为分组变量符合性别分布数据。

可以使用多个分组变量指定一个单元阵列的分组变量。观察被放在同一组如果他们有所有指定的分组变量的共同价值观。

例如,如果吸烟者是一个逻辑向量和价值观0对于不吸烟者和1对于吸烟者,然后指定单元阵列{性别、吸烟}观察分为四组:男性吸烟者,男性不抽烟的人,女性吸烟者,女不抽烟的人。

例子:{性别、吸烟}

数据类型:分类|逻辑|||字符|字符串|细胞

名称-值对的观点

指定可选的逗号分隔条名称,值参数。的名字参数名称和吗价值相应的价值。的名字必须出现在引号。您可以指定几个名称和值对参数在任何顺序Name1, Value1,…,的家

例子:fitdist (x,“仁”,“仁”,“三角形”)适合一个内核分配对象中的数据x使用一个三角形的内核函数。

审查的逻辑信号数据,指定为逗号分隔组成的“审查”和一个向量的逻辑值是相同的大小作为输入向量x。这个值是1当相应的元素x是right-censored观察和0当相应的元素是一个精确的观察。默认是一个向量的0年代,表明所有的观察都是恰当的。

fitdist忽略任何一个这个审查向量中的值。此外,任何x或频率向量的原因fitdist忽略相应的审查向量中的值。

这个论点是有效的前提distname“BirnbaumSaunders”,“毛刺”,“指数”,“ExtremeValue”,“伽马”,“InverseGaussian”,“内核”,“物流”,“Loglogistic”,对数正态的,“Nakagami”,“正常”,“Rician”,“tLocationScale”,或“威布尔”

数据类型:逻辑

观察频率,指定为逗号分隔组成的“频率”和一个向量的非负整数的值是相同的大小作为输入向量x。频率向量的每个元素指定的频率对应的元素x。默认是一个向量的1年代,表明每个值x只出现一次。

fitdist忽略任何一个在这个频率值向量。此外,任何x或审查向量的原因fitdist忽略相应的频率向量中的值。

数据类型:|

迭代匹配算法的控制参数,指定为逗号分隔组成的“选项”创建使用和结构statset

数据类型:结构体

二项分布的试验数量,指定为逗号分隔组成的“NTrials”和一个正整数价值。您必须指定distname作为“二”使用这个选项。

数据类型:|

广义帕累托分布阈值参数,指定为逗号分隔组成的“θ”和一个标量值。您必须指定distname作为“GeneralizedPareto”使用这个选项。

数据类型:|

half-normal分布位置参数,指定为逗号分隔组成的“亩”和一个标量值。您必须指定distname作为“HalfNormal”使用这个选项。

数据类型:|

内核平滑类型,指定为逗号分隔组成的“内核”和下列之一:

  • “正常”

  • “盒子”

  • “三角形”

  • “epanechnikov”

您必须指定distname作为“内核”使用这个选项。

核密度的支持,指定为逗号分隔组金宝app成的“金宝app支持”“无限”,“积极”或双元素向量。

“无限” 密度可以扩展到整个实线。
“积极” 密度是局限于积极的价值观。

此外,您可以指定一个双元素向量给有限的上下极限密度的支持。金宝app

您必须指定distname作为“内核”使用这个选项。

数据类型:||字符|字符串

内核的带宽平滑窗口中,指定为逗号分隔组成的“宽度”和一个标量值。使用的默认值fitdist最佳估算正常密度,但您可能想要选择一个较小的值显示特性,比如多个模式。您必须指定distname作为“内核”使用这个选项。

数据类型:|

输出参数

全部折叠

概率分布,作为一个概率分布对象返回。指定的分布distname确定返回的概率分布的类类型对象。的列表distname值和相应的概率分布对象,明白了distname

概率分布的对象指定的类型distname,作为一个细胞返回数组。的列表distname值和相应的概率分布对象,明白了distname

组标签,作为特征向量的单元阵列返回。

分组变量的水平,作为细胞返回数组的性格为每个分组变量向量包含一个列。

算法

fitdist使用最大似然估计函数符合大多数发行版。两个例外与未经审查的数据是正常和对数正态分布。

  • 未经审查的正态分布,估计σ值参数是根方差的无偏估计。

  • 未经审查的对数正态分布,估计σ值参数无偏估计的方差的平方根的日志数据。

选择功能

应用程序

分布更健康应用程序打开一个图形用户界面从工作区导入数据,并交互式地对你适合这些数据的概率分布。然后您可以节省工作空间的分布作为概率分布对象。打开分布健康应用程序使用distributionFitter或单击应用程序选项卡上的分布更健康。

引用

[1]约翰逊:L。,S. Kotz, and N. Balakrishnan.连续单变量分布。1卷,霍博肯,新泽西:Wiley-Interscience, 1993年。

[2]约翰逊:L。,S. Kotz, and N. Balakrishnan.连续单变量分布。2卷,霍博肯,新泽西:Wiley-Interscience, 1994年。

[3]鲍曼,a·W。,A. Azzalini.应用平滑技术进行数据分析。纽约:牛津大学出版社,1997年版。

扩展功能

介绍了R2009a