主要内容

负二项分分布

定义

当。。。的时候R.参数是一个整数,负二项式pdf是

y = F X | R. P. 的) = R. + X - 1 X 的) P. R. 问: X 一世 0. 1 ...... 的) X 的)

在哪里问:= 1 -P.。什么时候R.不是整数,PDF定义中的二项式系数由等效的表达式替换

Γ R. + X 的) Γ R. 的) Γ X + 1 的)

背景

在最简单的形式(何时R.是一个整数),负二项式分布模拟失败的数量X在一系列独立的、相同的试验达到一定数量的成功之前。它的参数是一次试验成功的概率,P.和成功的数量,R.。负二项分布的一种特殊情况R.= 1,是几何分布,它模拟了第一次成功之前的失败次数。

更普遍的是,R.可以采用非整数值。这种形式的负二项分布在重复的试验方面没有解释,但是泊松分销,它可用于建模计数数据。负二项份分布比泊松分布更通用,因为它具有比其平均值大的方差,使其适用于不符合泊松分布的假设的计数数据。在极限中,如R.增加到无穷大,负二项分布接近泊松分布。

参数

假设您正在收集有关繁忙高速公路上的汽车事故数量的数据,并希望能够塑造每天的事故数量。因为这些都是数量的数据,因为有很多车辆和任何特定车的事故的概率很小,你可能会认为使用泊松分布。然而,由于天气和交通变化的天气和数量,因此发生了意外的可能性可能因日常生活而变化,因此不满足泊松分布所需的假设。特别地,这种类型计数数据的方差有时超过平均值大量。下面的数据表现出这种效果:大多数日子有很少或没有意外,几天有很多。

事故= [2 3 4 2 3 11 12 8 14 31 23 111 10 7 0];m =均值(意外)
m = 8.0667
v = var(事故)
v = 79.3524

负二项式分布比泊松更普遍,并且当泊松时,通常适合计数数据。功能nbinfit返回负二项式分布参数的最大似然估计(MLES)和置信区间。以下是拟合的结果事故数据:

(太好了,pci) = nbinfit(事故)
phat =1×21.0060 0.1109
PCI =2×20.2152 0.0171 1.7968 0.2046

在这种情况下难以在这种情况下给予个体参数。然而,估计的参数可以用于日常事故的数量的模型中。例如,估计的累积概率函数的曲线表明,虽然估计在给定日内没有意外的10%的意外,但也有20%或更多的意外情况。

图(0:50,Nbincdf(0:50,Phat(1),Phat(2)),'.-');Xlabel(“每天事故”) ylabel ('累积概率'的)

例子

计算和绘图负二项式分布PDF

使用四个不同的参数值计算和绘制PDFR.,所期望的成功次数:.113.,6.。在每种情况下,成功的概率P.5

x = 0:10;情节(x, nbinpdf (x。1。5),“s -”......x,nbinpdf(x,1,.5),'o-'......x,nbinpdf(x,3,.5),“d -”......x,nbinpdf(x,6,.5),'^  - ');传奇({'r = .1'“r = 1”' r = 3 ''r = 6'})包含('X') ylabel ('f(x | r,p)'的)

图中显示负二项分布可以呈现出各种形状,从非常倾斜到几乎对称,这取决于的值R.

也可以看看

相关的话题