正态分布,有时称为高斯分布,是一个双参数曲线族。使用正态分布进行建模的通常理由是中心极限定理,该定理(大致)表明,任何具有有限均值和方差的分布的独立样本之和在样本容量趋于无穷时收敛于正态分布。
统计和机器学习工具箱™ 提供了几种使用正态分布的方法。
创建一个概率分布对象NormalDistribution通过拟合样本数据的概率分布(健身师)或者通过指定参数值(制造者).然后,使用对象函数来评估分布,生成随机数,等等。
NormalDistribution
健身师
制造者
与正态分布交互地使用分布更健康应用。您可以从应用导出对象并使用对象函数。
使用特定于分发的功能(normcdf,normpdf,正常投资,normlike,标准状态,正常的,正常的)具有指定的分布参数。特定于分布的函数可以接受多个正态分布的参数。
normcdf
normpdf
正常投资
normlike
标准状态
正常的
使用通用分布函数(cdf,icdf,pdf,随机的),并使用指定的发行版名称(“正常”)和参数。
cdf
icdf
pdf
随机的
“正常”
正态分布使用这些参数。
μ
西格玛
标准正态分布的均值为零,标准差为单位。如果Z那么,标准是正常的吗σZ+µ平均值也是正常的µ和标准偏差σ. 相反,如果x平均值是正常的µ和标准偏差σ那么Z= (x–µ) /σ这是正常的。
这个最大似然估计(MLEs)是使似然函数最大化的参数估计。的极大似然估计μ和σ2.对于正态分布,分别为
x ¯ = ∑ 我 = 1. N x 我 N
和
s 大中型企业 2. = 1. N ∑ 我 = 1. N ( x 我 − x ¯ ) 2. .
x ¯ 是样本的平均值吗x1.,x2., …,xN.样本均值是参数的无偏估计量μ.然而,s2.大中型企业是参数的有偏估计σ2.,表示其预期值不等于参数。
这个最小方差无偏估计(MVUE)通常用于估计正态分布的参数。MVUE是一个参数的所有无偏估计量的方差最小的估计量。参数的MVUEμ和σ2.对于正态分布,为样本平均值x̄和样本方差s2.分别地
s 2. = 1. N − 1. ∑ 我 = 1. N ( x 我 − x ¯ ) 2.
为了拟合数据的正态分布并找到参数估计,使用正常的,健身师,或大中型企业.
大中型企业
对于未经审查的数据,正常的和健身师找到无偏估计,以及大中型企业找到最大似然估计。
对于经过审查的数据,正常的,健身师,大中型企业找到最大似然估计。
不像正常的和大中型企业,返回参数估计值,健身师返回拟合的概率分布对象NormalDistribution.对象属性μ和西格玛存储参数估计值。
例如,请参见拟合正态分布对象.
正态概率密度函数(pdf)为
Y = F ( x | μ , σ ) = 1. σ 2. π E − ( x − μ ) 2. 2. σ 2. , 对于 x ∈ ℝ .
这个似然函数是pdf被视为参数的函数。最大似然估计(MLE)是将参数的固定值的似然函数最大化的参数估计x.
x
例如,请参见计算和绘制正态分布pdf.
正态累积分布函数(cdf)为
P = F ( x | μ , σ ) = 1. σ 2. π ∫ − ∞ x E − ( T − μ ) 2. 2. σ 2. D T , 对于 x ∈ ℝ .
P一个有参数的正态分布的单个观测值的概率是多少μ和σ间歇下降(-∞,x].
标准正态累积分布函数Φ(x)在功能上与错误函数相关小块土地.
小块土地
Φ ( x ) = 1. 2. ( 1. − 小块土地 ( − x 2. ) )
在哪里
小块土地 ( x ) = 2. π ∫ 0 x E D − T 2. T = 2. Φ ( 2. x ) − 1.
例如,请参见绘制标准正态分布cdf
加载示例数据并创建包含第一列学生考试成绩数据的向量。
负载examgradesx =成绩(:1);
通过拟合数据来创建一个正态分布对象。
pd = fitdist (x,“正常”)
pd=正态分布正态分布μ=75.0083[73.4321,76.5846]西格玛=8.7202[7.7391,9.98843]
参数估计旁边的区间是分布参数的95%置信区间。
用参数计算标准正态分布的pdf μ 等于0 σ 等于1。
x = [3: .1:3];y = normpdf (x 0 1);
绘制pdf文件。
绘图(x,y)
创建标准正态分布对象。
pd=makedist(“正常”)
pd=正态分布正态分布mu=0σ=1
指定x值,并计算cdf。
x = 3: .1:3;p = cdf (pd, x);
绘制标准正态分布的cdf。
情节(x, p)
伽马分布具有形状参数 A. 尺度参数 B .为了一大笔钱 A. ,伽马分布与平均值的正态分布非常接近 μ = ab 和方差 σ 2. = A. B 2. .
使用参数计算伽马分布的pdf一个= 100和b=5.
一个= 100
b=5
a=100;b=5;x=250:750;y_gam=gampdf(x,a,b);
为了进行比较,计算gamma近似的正态分布的平均值、标准偏差和pdf。
mu=a*b
mu=500
西格玛=sqrt(a*b^2)
西格玛=50
y_norm=normpdf(x,mu,sigma);
在同一图上绘制伽马分布和正态分布的PDF。
图(x,y_gam,'-',x,y_范数,'-.')头衔('Gamma and Normal pdf ')包含(“观察”) ylabel (“概率密度”)传说(“伽马分布”,“正态分布”)
正态分布的pdf近似于伽马分布的pdf。
如果X参数服从对数正态分布µ和σ,然后日志(X)平均值服从正态分布µ和标准偏差σ.使用分布对象检查正态分布和对数正态分布之间的关系。
通过指定参数值来创建一个对数正态分布对象。
pd=makedist(“对数正态”,“亩”5.“西格玛”,2)
pd=对数正态分布对数正态分布μ=5西格玛=2
计算对数正态分布的平均值。
意思是(pd)
ans=1.0966e+03
对数正态分布的平均值不等于μ参数。对数值的均值等于μ.通过生成随机数来确认这种关系。
从对数正态分布中生成随机数并计算它们的对数值。
rng(“默认”);%为了再现性x=随机(pd,10000,1);logx=log(x);
计算对数值的平均值。
m=平均值(logx)
m=5.0033
对数平均值x就在附近μ参数的x,因为x具有对数正态分布。
构造一个直方图计算lnx正态分布拟合。
计算lnx
histfit(计算lnx)
这张图显示了x是正态分布的。
histfit使用健身师使分布适合数据。使用健身师获取拟合所用的参数。
histfit
pd_normal = fitdist(计算lnx,“正常”)
pd_正态=正态分布正态分布mu=5.00332[4.96445,5.04219]西格玛=1.98296[1.95585,2.01083]
估计的正态分布参数接近对数正态分布参数5和2。
T
学生的T分布是一系列依赖于单个参数的曲线ν(自由度)。作为自由度ν接近无穷大T分布接近标准正态分布。
计算学生的pdf文件T带参数的分布nu=5和学生的T带参数的分布nu=15.
nu=5
nu=15
x=[-5:0.1:5];y1=tpdf(x,5);y2=tpdf(x,15);
计算标准正态分布的pdf。
z = normpdf (x 0 1);
学生的情节TPDF与标准普通PDF上的图形相同。
图(x,y1,'-.', x, y2,'--',x,z,'-')传说('学生的t分布与\nu=5',...'Student' st Distribution with \nu=15',...“标准正态分布”,“位置”,“最好的”)包含(“观察”) ylabel (“概率密度”)头衔(“学生t和标准正常PDF”)
标准的普通pdf的尾部比学生的短TPDF。
二项分布-二项分布模型中成功的总数N有可能成功的重复试验P.作为N增加,二项分布可以近似为正态分布µ=NP和σ2.=NP(1–P)看见比较二项分布和正态分布pdf.
Birnbaum-Saunders分布——如果x有参数的Birnbaum-Saunders分布β和γ那么
( x β − β x ) γ
具有标准正态分布。
卡方分布-卡方分布是平方的、独立的、标准正态随机变量之和的分布N观测值服从方差正态分布σ2.,s2.那么样本方差是多少(N–1)s2./σ2.具有卡方分布,与N1的自由度。这个正常的函数使用此关系计算正态参数估计的置信区间σ2..
极值分布-极值分布适用于建模尾部指数衰减快的分布(如正态分布)中的最小值或最大值。
伽马分布-伽马分布具有形状参数A.尺度参数B.为了一大笔钱A.,伽马分布与平均值的正态分布非常接近μ=A.B和方差σ2.=A.B2..伽马分布仅对正实数具有密度。请参阅比较伽马分布和正态分布PDF.
半正态分布-半正态分布是折叠正态分布和截断正态分布的特例Z是标准正态分布吗 X = μ + σ | Z | 具有参数的半正态分布μ和σ.
Z
物流配送-logistic分布用于增长模型和logistic回归。它比正态分布具有更长的尾部和更高的峰度。
对数正态分布——如果X参数服从对数正态分布µ和σ,然后日志(X)平均值服从正态分布µ和标准偏差σ看见正态分布与对数正态分布的关系.
多元正态分布-多元正态分布是一元正态分布对两个或多个变量的推广。它是相关变量的随机向量的分布,其中每个元素具有一元正态分布。在最简单的情况下,变量之间没有相关性,向量的元素是独立的单变量正态随机变量。
泊松分布-泊松分布是采用非负整数值的单参数离散分布,λ,是分布的均值和方差。作为λ增加,泊松分布可以近似为正态分布µ=λ和σ2.=λ.
瑞利分布-瑞利分布是威布尔分布的一个特例,在通信理论中有应用。如果粒子在x和Y方向是两个均值为零、方差相等的独立正态随机变量,则粒子在单位时间内移动的距离遵循瑞利分布。
稳定分布正态分布是稳定分布的一种特殊情况。具有第一个形状参数的稳定分布α= 2符合正态分布。
N ( μ , σ 2. ) = s ( 2. , 0 , σ 2. , μ ) .
学生t分布-学生的T分布是一系列依赖于单个参数的曲线ν(自由度)。作为自由度ν到了无穷远的地方T分布接近标准正态分布。看见比较Student t分布和正态分布PDF.
如果x这是一个随机样本的大小N从均值正态分布μ,然后是统计
T = x ¯ − μ s / N
在哪里 x ¯ 样本的平均值是多少s是样本标准差,有学生的吗T分发N1的自由度。
位置尺度分布- - -T与正态分布相比,位置-尺度分布有助于建模尾部较重(更容易出现异常值)的数据分布。它接近正态分布作为形状参数ν趋向于无穷。
[1] Abramowitz,M.和I.A.Stegun。数学函数手册纽约:多佛,1964年。
[2] 埃文斯,M.,N.黑斯廷斯和B.皮科克。统计分布第二版,霍博肯,新泽西州:约翰·威利父子公司,1993年。
[3] 无法无天,J.F。生命周期数据的统计模型和方法新泽西州霍博肯:威利国际科学出版社,1982年。
Marsaglia G.和w.w. Tsang。从减少或对称单峰密度函数中取样的快速、容易实现的方法。科学与统计计算杂志.1984年第5卷第2期,349-359页。
[5] 米克尔、W.Q.和L.A.埃斯科瓦尔。可靠性数据的统计方法. 新泽西州霍博肯:约翰·威利父子公司,1998年。
小块土地|NormalDistribution|normcdf|正常的|正常投资|normlike|normpdf|正常的|标准状态
您的系统上存在此示例的修改版本。是否要打开此版本?
您单击了与此MATLAB命令对应的链接:
通过在MATLAB命令窗口中输入命令来运行该命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家/地区站点不适合您所在位置的访问。
联系当地办事处
现在受审