文档

mvksdensity

内核为多元数据平滑函数估计

描述

例子

f= mvksdensity (x,“带宽”,bw)计算概率密度估计的样本数据n——- - - - - -d矩阵x点的评估使用所需的名称-值对参数值bw的带宽值。估计是基于高斯核函数的产品。

一元或二元数据,使用ksdensity代替。

例子

f= mvksdensity (x,“带宽”,bw,名称,值)返回之前的任何输出参数,使用由一个或多个指定附加选项名称,值对参数。例如,您可以定义的函数类型mvksdensity累积概率评估,如概率密度,或幸存者功能。您还可以输入值分配权重。

例子

全部折叠

加载哈尔德水泥数据。

负载哈尔德

数据测量13个不同的热硬化水泥成分。预测矩阵成分包含每个四个水泥的成分百分比成分。响应矩阵包含热硬化(cal \ g)后180天。

的核密度估计前三个观察成分

ξ=成分(1:3,:);f = mvksdensity(成分,习“带宽”,0.8);

加载哈尔德水泥数据。

负载哈尔德

数据测量13个不同的热硬化水泥成分。预测矩阵成分包含每个四个水泥的成分百分比成分。响应矩阵包含热硬化(cal / g)后180天。

创建一个数组来估计密度的点。首先,定义为每个变量范围和间距,在每个维度使用同样数量的点。

gridx1 = 0:2:22;gridx2 = 20:5:80;gridx3 = 0:2:24;gridx4 = 5:5:65;

下一步,使用ndgrid来生成一个完整的使用范围和定义网格点的间距。

(x1, x2, x3, x4) = ndgrid (gridx1, gridx2, gridx3 gridx4);

最后,转换和连接创建一个数组,其中包含的点估计的密度。这对每个变量数组一列。

x1 = x1 (:,);x2 = x2 (:,);x3 = x3 (:,);x4 = x4 (:,);ξ= [x1 (:) x2 (:) x3 (:) x4 (:));

估计的密度。

f = mvksdensity(成分,习“带宽”(4.0579 - 10.7345 4.4185 - 11.5466),“内核”,“normpdf”);

视图的大小f确认mvksdensity计算每个点的密度

size_xi =大小(xi)
size_xi =1×226364年4
size_f =大小(f)
size_f =1×226364年1

输入参数

全部折叠

样本数据的mvksdensity返回指定的概率密度估计,作为一个n——- - - - - -d矩阵的数值。n是数据点的数量(行)x,d是尺寸的数量(列)。

数据类型:|

点评估概率密度的估计f,指定为一个矩阵与相同数量的列x。返回的估计f有相同的行数。

数据类型:|

值的带宽kernel-smoothing窗口中,指定为一个标量值或d元向量。d是尺寸的数量(列)在样本数据x。如果bw是一个标量值,它适用于所有尺寸。

如果您指定“BoundaryCorrection”作为“日志”(默认),“金宝app支持”作为“积极”或一个棱矩阵,mvksdensity将有界无界使用对数转换数据。的价值bw在转换后的值的规模。

西尔弗曼对带宽的经验法则

b = σ { 4 ( d + 2 ) n } 1 ( d + 4 ) , = 1 , 2 , , d ,

在哪里d是尺寸的数量,n是观测的数量,和 σ 的标准偏差th变量[4]

例子:“带宽”,0.8

数据类型:|

名称-值对的观点

指定可选的逗号分隔条名称,值参数。的名字参数名称和吗价值相应的价值。的名字必须出现在引号。您可以指定几个名称和值对参数在任何顺序Name1, Value1,…,的家

例子:“内核”、“三角形”、“函数”,提供“指定mvksdensity估计样本数据的提供利用核函数的三角。

边界修正方法,指定为逗号分隔组成的“BoundaryCorrection”,要么“日志”“反射”

价值 描述
“日志”

mvksdensity将有界无界使用数据的转换。然后,它将回到原来的有界规模后密度估计。

  • 如果您指定“金宝app支持”,“积极”,然后mvksdensity适用于日志(xj)每个维度,xjj列的输入参数x

  • 如果您指定“金宝app支持”作为一个棱矩阵组成的每个维度的上下极限,mvksdensity适用于日志((xj- - - - - -lj)/ (Uj- - - - - -xj))每个维度,ljUj上下极限的吗j分别th维度。

的价值bw在转换后的值的规模。

“反射”

mvksdensity增加有限的数据通过添加反射边界附近的数据,然后它返回估计对应于原始的支持。金宝app有关详细信息,请参见反射法

mvksdensity只有当你指定适用边界修正“金宝app支持”除了作为一个值“无限”

例子:“BoundaryCorrection”、“反射”

函数来估计,指定为逗号分隔组成的“函数”和一个以下。

价值 描述
“pdf” 概率密度函数
“提供” 累积分布函数
“幸存者” 幸存者函数

例子:“函数”,“提供”

类型的内核平滑,指定为逗号分隔组成的“内核”和一个以下。

价值 描述
“正常” 正常(高斯)内核
“盒子” 盒子的内核
“三角形” 三角形的内核
“epanechnikov” Epanechnikov内核

您还可以指定一个内核函数,是一个自定义或内置函数。指定函数作为函数处理(例如,@myfunction@normpdf)或作为特征向量或字符串标量(例如,“myfunction”“normpdf”)。软件调用指定的函数有一个参数是一个数组的数据值之间的距离和位置的密度是评价,规范化维度的带宽。同样大小的函数必须返回一个数组包含相应的内核函数的值。

mvksdensity同样的内核适用于每个维度。

例子:“内核”、“盒子”

金宝app支持密度,指定为逗号分隔组成的“金宝app支持”和一个以下。

价值 描述
“无限” 允许密度扩展在整个实线
“积极” 将密度限制在积极的价值观
2 -d矩阵 指定的有限的上下边界密度的支持。金宝app第一行包含下限和第二行包含了上限。每一列包含一维的限制x

“金宝app支持”也可以积极的组合,无限,和有界变量指定为[0负无穷到L;正正U]

例子:“金宝app支持”,“积极”

数据类型:||字符|字符串

权重为样本数据,指定为逗号分隔组成的“重量”和一个向量的长度大小(x, 1),在那里x示例数据。

例子:“重量”,xw

数据类型:|

输出参数

全部折叠

估计函数值,作为一个向量返回。f有相同的行数。

更多关于

全部折叠

多元内核分布

一个多元的内核分布的非参数表示一个随机向量的概率密度函数(pdf)。您可以使用一个内核分布参数时不能正确描述数据,或者当你想避免对数据的分布进行假设。多元内核分布定义为一个平滑函数和矩阵的带宽,控制产生的密度曲线的平滑度。

多变量核密度估计量是一个随机向量的估计pdf。让x= (x1,x2、…xd)”是一个d维随机向量的密度函数f,让y= (yi1,yi2、…yid)”是一个随机样本来自f= 1,2,…n,在那里n是随机抽样的数量。任何真正的向量x,给出了多变量核密度估计量

f ^ H ( x ) = 1 n = 1 n K H ( x y ) ,

在哪里 K H ( x ) = | H | 1 / 2 K ( H 1 / 2 x ) , K ( · ) 是内核平滑函数,Hd——- - - - - -d带宽矩阵。

mvksdensity使用一个对角线带宽矩阵和产品的内核。也就是说,H1/2是一个正方形对角矩阵与向量的元素(h1,h2、…hd)在主对角线上。K (x)以产品的形式K (x)=k(x1)k(x2)⋯k(xd),在那里 k ( · ) 是一个一维核平滑函数。然后,多变量核密度估计

f ^ H ( x ) = 1 n = 1 n K H ( x y ) = 1 n h 1 h 2 h d = 1 n K ( x 1 y 1 h 1 , x 2 y 2 h 2 , , x d y d h d ) = 1 n h 1 h 2 h d = 1 n j = 1 d k ( x j y j h j )

累积分布函数的核估计量(cdf),任何真正的向量x的话,是

F ^ H ( x ) = x 1 x 2 x d f ^ H ( t ) d t d d t 2 d t 1 = 1 n = 1 n j = 1 d G ( x j y j h j ) ,

在哪里 G ( x j ) = x j k ( t j ) d t j

反射法

反射法是一个边界修正法,准确地发现核密度估计当随机变量有界的支持。金宝app如果您指定“BoundaryCorrection”、“反射”,mvksdensity使用反射法。

如果您另外指定“金宝app支持”作为一个棱矩阵组成的每个维度的上下极限,mvksdensity发现内核估计如下。

  • 如果“函数”“pdf”,核密度估计

    f ^ H ( x ) = 1 n h 1 h 2 h d = 1 n j = 1 d ( k ( x j y j h j ) + k ( x j y j h j ) + k ( x j y j + h j ) ] ljxjUj,

    在哪里 y j = 2 l j y j , y j + = 2 U j y j ,yijj的th元素样本数据对应x (i, j)的输入参数xljUj上下极限的吗j分别th维度。

  • 如果“函数”“提供”,那么内核对cdf实验组的估计量

    F ^ H ( x ) = 1 n = 1 n j = 1 d ( G ( x j y j h j ) + G ( x j y j h j ) + G ( x j y j + h j ) G ( l j y j h j ) G ( l j y j h j ) G ( l j y j + h j ) ] ljxjUj

  • 获得一个内核函数(当幸存者估计量“函数”“幸存者”),mvksdensity使用两种 f ^ H ( x ) F ^ H ( x )

如果您另外指定“金宝app支持”作为“积极”或一个矩阵包括[0正],然后mvksdensity找到替代的核密度估计量(ljUj][0正]在上面的方程。

引用

[1]鲍曼,a·W。,A. Azzalini.应用平滑技术进行数据分析。纽约:牛津大学出版社有限公司,1997年。

[2],p·d·“内核分布函数的估计。”通信在统计理论和方法。问题3卷14日,1985年,页605 - 620。

琼斯[3],m . c .“简单边界修正核密度估计。”统计和计算。3卷,第三期,1993年,页135 - 146。

[4]西尔弗曼,b . W。密度估计的统计和数据分析。查普曼&大厅/ CRC, 1986。

[5]斯科特,d . W。多元密度估计:理论、实践和可视化。约翰威利& Sons, 2015。

扩展功能

介绍了R2016a