pdist2

两组之间两两距离观察

所有的页面崩溃

语法

D = pdist2 (X, Y,距离)

D = pdist2 (X, Y,距离,DistParameter)

D = pdist2 (___、名称、值)

[D,我]= pdist2 (___、名称、值)

描述

例子

D= pdist2 (X, Y,距离)返回每一对观测之间的距离X和Y使用指定的度量距离。

例子

D= pdist2 (X, Y,距离,DistParameter)返回指定的距离使用公制距离和DistParameter。您可以指定DistParameter只有当距离是“seuclidean”,闵可夫斯基的,或“mahalanobis”。

D= pdist2 (___,名称,值)指定一个附加选项使用一个名称-值对的参数“最小”或“最大”除了任何参数在前面的语法。

例如,

D = pdist2 (X, Y,距离,“最小”,K)使用指定的度量计算的距离距离并返回K最小的两两距离观察X为每一个观察Y以升序排序。
D = pdist2 (X, Y,距离,DistParameter,“最大”,K)使用指定的度量计算的距离距离和DistParameter并返回K最大的两两距离降序排序。

例子

(D,我)= pdist2 (___,名称,值)还返回矩阵我。矩阵我包含了指标的观察X对应的距离D。

例子

全部折叠

计算欧氏距离

打开生活的脚本

创建两个矩阵和三个观察和两个变量。

rng (“默认”)%的再现性X =兰德(3 2);Y =兰德(3 2);

计算欧氏距离。输入参数的默认值距离是“欧几里得”。当计算欧氏距离不使用一个名称-值对的论点,你不需要指定距离。

D = pdist2 (X, Y)

D =3×30.5387 0.8018 0.1538 0.7100 0.5951 0.3422 0.8805 0.4242 1.2050

D (i, j)对应于两两之间的距离观察我在X和观察j在Y。

计算闵可夫斯基距离

打开生活的脚本

创建两个矩阵和三个观察和两个变量。

rng (“默认”)%的再现性X =兰德(3 2);Y =兰德(3 2);

使用默认计算闵可夫斯基距离指数2。

D1 = pdist2 (X, Y,闵可夫斯基的)

D1 =3×30.5387 0.8018 0.1538 0.7100 0.5951 0.3422 0.8805 0.4242 1.2050

计算闵可夫斯基距离指数为1,等于该街区距离。

D2 = pdist2 (X, Y,闵可夫斯基的,1)

D2 =3×30.5877 1.0236 0.2000 0.9598 0.8337 0.3899 1.0189 0.4800 1.7036

D3 = pdist2 (X, Y,“cityblock”)

D3 =3×30.5877 1.0236 0.2000 0.9598 0.8337 0.3899 1.0189 0.4800 1.7036

找到两个最小的两两距离

打开生活的脚本

创建两个矩阵和三个观察和两个变量。

rng (“默认”)%的再现性X =兰德(3 2);Y =兰德(3 2);

找到两个最小的成对欧几里得距离观察X为每一个观察Y。

[D,我]= pdist2 (X, Y,“欧几里得”,“最小”,2)

D =2×30.5387 0.4242 0.1538 0.7100 0.5951 0.3422

我=2×31 3 1 2 2 2

为每一个观察Y,pdist2发现两个最小距离通过计算和比较值的所有观测的距离X。函数类型的距离在每一列的D以升序排序。我包含了指标的观察X对应的距离D。

计算两两距离缺失的元素使用一个自定义距离函数

打开脚本

定义一个自定义距离函数忽略了坐标南值,计算两两距离通过使用自定义距离函数。

创建两个矩阵和三个观察和三个变量。

rng (“默认”)%的再现性X =兰德(3、3)Y = [X(: 1:2)兰德(3,1)]

X = Y 0.8147 0.9134 0.2785 0.9058 0.6324 0.5469 0.1270 0.0975 0.9575 = 0.8147 0.9134 0.9649 0.9058 0.6324 0.1576 0.1270 0.0975 0.9706

前两列的X和Y是相同的。假设X (1,1)不见了。

X (1, 1) = NaN

X =南0.9134 0.2785 0.9058 0.6324 0.5469 0.1270 0.0975 0.9575

计算出汉明距离。

D1 = pdist2 (X, Y,“汉明”)

D1 =南南南1.0000 0.3333 1.0000 1.0000 1.0000 0.3333

如果观察我在X或观察j在Y包含南值,函数pdist2返回南两两之间的距离我和j。因此,D1 (1, 1), D1(1、2),和D1 (1、3)南值。

定义一个自定义距离函数nanhamdist忽略了坐标,南汉明距离值和计算。在处理大量的观察,可以通过循环计算距离更快的坐标数据。

函数D2 = nanhamdist (XI, XJ)% NANHAMDIST汉明距离忽略坐标nan[m p] =大小(XJ);nesum = 0 (m, 1);pstar = 0 (m, 1);为q = 1: p notnan = ~ (isnan(ξ(q)) | isnan (XJ (:, q)));nesum = nesum + (XI (q) ~ = XJ (:, q) & notnan);pstar = pstar + notnan;结束D2 = nesum. / pstar;

计算距离nanhamdist通过传递函数的句柄作为输入参数pdist2。

@nanhamdist D2 = pdist2 (X, Y)

D2 = 0.5000 1.0000 1.0000 1.0000 0.3333 1.0000 1.0000 1.0000 0.3333

将新数据分配给现有的集群和生成C / c++代码

这个示例使用:

打开生活的脚本

kmeans执行k——集群分区的数据k集群。当你有一个集群的新数据集,您可以创建新集群,包括通过使用现有的数据和新的数据kmeans。的kmeans函数支持C / c金宝app++代码生成,可以生成代码接受训练数据并返回聚类结果,然后将代码部署到设备。在这个工作流程中,您必须通过训练数据,可以相当大的规模。节省内存的设备,您可以通过使用单独的训练和预测kmeans和pdist2,分别。

使用kmeans在MATLAB®创建集群和使用pdist2在生成的代码将新数据分配给现有的集群。代码生成,定义一个入口点函数接受集群质心位置和新的数据集,并返回该指数最近的集群。然后,生成代码的入口点函数。

生成C / c++代码需要MATLAB®编码器™。

执行k聚类则

使用三个生成一个训练数据集分布。

rng (“默认”)%的再现性X = [randn(100 2) * 0.75 +(100 2)的;randn(100 2) * 0.5的(100 2);randn (100 2) * 0.75);

通过使用训练数据分割成三个集群kmeans。

[idx C] = kmeans (X, 3);

集群和集群质心的阴谋。

图gscatter (X (: 1), (:, 2), idx,“bgm”)举行在情节(C (: 1), C (:, 2),“kx”)传说(“集群1”,《集群2》,“集群3”,聚类质心的)

将新数据分配给现有的集群

生成测试数据集。

Xtest = [randn(10, 2) * 0.75 +的(10,2);randn(10, 2) * 0.5的(10,2);randn (10, 2) * 0.75);

使用现有的集群测试数据集进行分类。找到最近的重心从每个测试数据点用pdist2。

[~,idx_test] = pdist2 (C Xtest“欧几里得”,“最小”1);

情节的测试数据和标签使用的测试数据idx_test通过使用gscatter。

gscatter (Xtest (: 1) Xtest (:, 2), idx_test,“bgm”,“哦”)传说(“集群1”,《集群2》,“集群3”,聚类质心的,…集群的数据分类1 ',集群的数据分类2》,…集群的数据分类3 ')

生成代码

生成C代码,将新数据赋给现有的集群。注意,生成C / c++代码需要MATLAB®编码器™。

定义一个入口点函数命名findNearestCentroid接受质心位置和新数据,然后找到最近的集群使用pdist2。

添加% # codegen编译器指令(或编译指示)的入口点函数函数签名后,表明您打算为MATLAB算法生成代码。添加这个指令指示MATLAB代码分析器来帮助您诊断和解决违规,将导致错误在代码生成。

类型findNearestCentroid%显示findNearestCentroid.m内容

函数idx = findNearestCentroid (C、X) % # codegen [~, idx] = pdist2 (C、X、“欧几里得”、“最小”,1);%找到最近的重心

注意:如果单击按钮位于这个页面的右上角部分并在MATLAB®开设这个例子,然后用MATLAB®打开示例文件夹。这个文件夹包含的入口点函数文件。

通过使用生成代码codegen。因为C和c++静态类型语言中,您必须确定所有变量的属性在编译时的入口点函数。指定的数据类型和数组大小的输入findNearestCentroid,通过MATLAB表达式表示的值和一定的数据类型和数组大小使用arg游戏选择。有关详细信息,请参见为代码生成指定适应可变参数。

codegenfindNearestCentroidarg游戏{C, Xtest}

codegen生成墨西哥人的功能findNearestCentroid_mex与平台相关的扩展。

验证所生成的代码。

myIndx = findNearestCentroid (C, Xtest);myIndex_mex = findNearestCentroid_mex (C, Xtest);verifyMEX = isequal (idx_test myIndx myIndex_mex)

verifyMEX =逻辑1

isequal返回逻辑1 (真正的),这意味着所有的输入都是平等的。确认进行了比较pdist2函数,findNearestCentroid功能,墨西哥人返回相同的指数函数。

你还可以生成优化的CUDA®代码使用GPU编码器™。

cfg = coder.gpuConfig (墨西哥人的);codegen配置cfgfindNearestCentroidarg游戏{C, Xtest}

代码生成的更多信息,请参阅通用代码生成工作流。GPU编码器的更多信息,请参阅开始使用GPU编码器(GPU编码器)和金宝app支持功能(GPU编码器)。

输入参数

全部折叠

`X, Y`- - - - - -输入数据
数字矩阵

输入数据,指定为一个数字矩阵。X是一个mx——- - - - - -n矩阵和Y是一个我的——- - - - - -n矩阵。行对应于个人观察,列对应单个变量。

数据类型:单|双

`距离`- - - - - -距离度量
特征向量|字符串标量|函数处理

距离度量,指定为一个特征向量,字符串标量,或函数处理,如下表所述。

价值	描述
`“欧几里得”`	欧氏距离(默认)。
`“squaredeuclidean”`	平方欧氏距离。(此选项仅供效率。它不满足三角不等式)。
`“seuclidean”`	标准化的欧氏距离。每个坐标差异观察是通过除以相应的扩展元素的标准差,`S =nanstd(X)`。使用`DistParameter`指定一个值`年代`。
`“mahalanobis”`	而使用的样本协方差距离`X`,`C =nancov(X)`。使用`DistParameter`指定一个值`C`,矩阵`C`是对称的正定。
`“cityblock”`	城市街区的距离。
`闵可夫斯基的`	闵可夫斯基距离。默认的指数是2。使用`DistParameter`指定一个不同的指数`P`,在那里`P`是一个积极的标量值的指数。
`“chebychev”`	Chebychev距离(最大坐标差异)。
`的余弦`	1 -之间的夹角的余弦值点(视为向量)。
`“相关”`	1 -样本点之间的相关性(作为序列的值)。
`“汉明”`	汉明距离,协调不同的百分比。
`“jaccard”`	1 - Jaccard系数,非零坐标不同的百分比。
`“枪兵”`	1 -样本之间的斯皮尔曼等级相关的观察(作为序列的值)。
`@distfun`	自定义距离函数处理。距离函数的形式函数ZJ D2 = distfun(子)%计算距离… 在哪里 `子`是一个`1`——- - - - - -`n`向量包含一个观察。 `ZJ`是一个`平方米`——- - - - - -`n`包含多个观测矩阵。`distfun`必须接受一个矩阵`ZJ`与任意数量的观察。 `D2`是一个`平方米`——- - - - - -`1`距离向量,`D2 (k)`是观察之间的距离`子`和`ZJ (k,:)`。如果你的数据不是稀疏的,你可以通过使用一个内置的通常更快的计算距离的距离而不是一个函数处理。

定义,请参阅距离度量。

当你使用“seuclidean”,闵可夫斯基的,或“mahalanobis”,您可以指定一个额外的输入参数DistParameter控制这些指标。你也可以以同样的方式使用这些指标作为默认值的其他指标DistParameter。

例子:闵可夫斯基的

`DistParameter`- - - - - -距离度量参数值
积极的标量|数值向量|数字矩阵

距离度量参数值,指定为一个积极的标量,数值向量,或数字矩阵。这个论证是有效的只有当你指定距离作为“seuclidean”,闵可夫斯基的,或“mahalanobis”。

如果距离是“seuclidean”,DistParameter为每个维度是一个向量扩展因素,指定为一个积极的向量。默认值是nanstd (X)。
如果距离是闵可夫斯基的,DistParameter的指数是闵可夫斯基距离,指定为一个积极的标量。默认值是2。
如果距离是“mahalanobis”,DistParameter协方差矩阵,指定为一个数字矩阵。默认值是nancov (X)。DistParameter必须是对称的,正定。

例子:闵可夫斯基,3

数据类型:单|双

名称-值对的观点

指定可选的逗号分隔条名称,值参数。的名字参数名称和吗价值相应的价值。的名字必须出现在引号。您可以指定几个名称和值对参数在任何顺序Name1, Value1,…,的家。

例子:要么“最小”,K或“最大”,K。你不能同时使用“最小”和“最大”。

`“最小”`- - - - - -数量的最小距离
正整数

数量的最小距离,指定为逗号分隔组成的“最小”和一个正整数。如果您指定“最小”,然后pdist2每一列的距离D以升序排序。

例子:“最小”,3

数据类型:单|双

`“最大”`- - - - - -的最大距离
正整数

的最大距离,指定为逗号分隔组成的“最大”和一个正整数。如果您指定“最大”,然后pdist2每一列的距离D在降序排列。

例子:“最大”,3

数据类型:单|双

输出参数

全部折叠

`D`——两两距离
数字矩阵

两两距离,作为一个数字矩阵返回。

如果你不指定“最小”或“最大”,然后D是一个mx——- - - - - -我的矩阵,mx和我的观察的数量吗X和Y,分别。D (i, j)是观察之间的距离我在X和观察j在Y。如果观察我在X或观察j在Y包含南,然后D (i, j)是南内置的距离函数。

如果您指定“最小”或“最大”作为K,然后D是一个K——- - - - - -我的矩阵。D包含的K最小的或K最大的两两距离观察X为每一个观察Y。为每一个观察Y,pdist2找到了K最小或最大距离通过计算和比较值的所有观测的距离X。如果K大于mx,pdist2返回一个mx——- - - - - -我的矩阵。

`我`分类指数
正整数矩阵

指数,作为一个正整数返回矩阵。我一样的尺寸吗D。我包含了指标的观察X对应的距离D。

扩展功能

高大的数组
计算和数组的行比装入内存。

使用笔记和限制:

第一个输入X必须是一个高大的数组。输入Y不能被一个高大的数组。

有关更多信息,请参见高大的数组(MATLAB)。

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

使用笔记和限制:

输入参数的距离值(距离)必须是一个编译时常量。例如,使用闵可夫斯基距离,包括coder.Constant(闵可夫斯基)在arg游戏的价值codegen。
输入参数的距离值(距离不能自定义距离函数)。
名字必须编译时常量参数名称-值对。例如,使用“最小”名称-值对的论点在生成的代码,包括{coder.Constant(最小的),0}在arg游戏的价值codegen。
与距离的顺序生成的代码可以与MATLAB的次序不同^®由于数值精度。
生成的代码的pdist2使用parfor创建循环,支持共享内存多核平台上并行运行生成的代码。金宝app如果你的编译器不支持开放的多处理(OpenMP)应用金宝app程序接口或禁用OpenMP库,MATLAB编码器™将parfor循环,为循环。找到支持的编译器金宝app,看看金宝app支持编译器。禁用OpenMP图书馆,设置EnableOpenMP配置对象的属性假。有关详细信息,请参见coder.CodeConfig。

代码生成的更多信息,请参阅介绍代码生成和通用代码生成工作流。

GPU的代码生成
生成NVIDIA的CUDA®代码®GPU使用GPU编码器™。

使用笔记和限制:

距离支持金宝app输入参数值(距离)优化的CUDA代码“欧几里得”,“squaredeuclidean”,“seuclidean”,“cityblock”,闵可夫斯基的,“chebychev”,的余弦,“相关”,“汉明”,“jaccard”。
距离不能自定义距离函数。
距离必须是一个编译时常量。
名字必须编译时常量参数名称-值对。
与距离的顺序生成的代码可以从MATLAB的次序不同,由于数值精度。

GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。

使用笔记和限制:

的距离参数必须指定为一个特征向量。

有关更多信息,请参见运行在GPU MATLAB函数(并行计算工具箱)。

另请参阅

ExhaustiveSearcher|KDTreeSearcher|createns|knnsearch|pdist

pdist2

语法

描述

例子

计算欧氏距离

计算闵可夫斯基距离

找到两个最小的两两距离

计算两两距离缺失的元素使用一个自定义距离函数

将新数据分配给现有的集群和生成C / c++代码

输入参数

`X, Y`- - - - - -输入数据
数字矩阵

`距离`- - - - - -距离度量
特征向量|字符串标量|函数处理

`DistParameter`- - - - - -距离度量参数值
积极的标量|数值向量|数字矩阵

名称-值对的观点

`“最小”`- - - - - -数量的最小距离
正整数

`“最大”`- - - - - -的最大距离
正整数

输出参数

`D`——两两距离
数字矩阵

`我`分类指数
正整数矩阵

更多关于

距离度量

扩展功能

高大的数组
计算和数组的行比装入内存。

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

GPU的代码生成
生成NVIDIA的CUDA®代码®GPU使用GPU编码器™。

GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。

另请参阅

介绍了R2010a

统计和机器学习工具箱文档

金宝app

试着用MATLAB仿真软金宝app件,和其他产品下载188bet金宝搏

pdist2

语法

描述

例子

计算欧氏距离

计算闵可夫斯基距离

找到两个最小的两两距离

计算两两距离缺失的元素使用一个自定义距离函数

将新数据分配给现有的集群和生成C / c++代码

输入参数

X, Y- - - - - -输入数据数字矩阵

距离- - - - - -距离度量特征向量|字符串标量|函数处理

DistParameter- - - - - -距离度量参数值积极的标量|数值向量|数字矩阵

名称-值对的观点

“最小”- - - - - -数量的最小距离正整数

“最大”- - - - - -的最大距离正整数

输出参数

D——两两距离数字矩阵

我分类指数正整数矩阵

更多关于

距离度量

扩展功能

高大的数组计算和数组的行比装入内存。

C / c++代码生成生成C和c++代码使用MATLAB®编码器™。

GPU的代码生成生成NVIDIA的CUDA®代码®GPU使用GPU编码器™。

GPU数组加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。

另请参阅

介绍了R2010a

统计和机器学习工具箱文档

金宝app

试着用MATLAB仿真软金宝app件,和其他产品下载188bet金宝搏

`X, Y`- - - - - -输入数据
数字矩阵

`距离`- - - - - -距离度量
特征向量|字符串标量|函数处理

`DistParameter`- - - - - -距离度量参数值
积极的标量|数值向量|数字矩阵

`“最小”`- - - - - -数量的最小距离
正整数

`“最大”`- - - - - -的最大距离
正整数

`D`——两两距离
数字矩阵

`我`分类指数
正整数矩阵

高大的数组
计算和数组的行比装入内存。

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

GPU的代码生成
生成NVIDIA的CUDA®代码®GPU使用GPU编码器™。

GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。