链接
会凝聚的层次聚类树
语法
描述
例子
集群的数据和阴谋的结果
随机生成样本数据与20000年的观察。
rng (“默认”)%的再现性X =兰德(20000 3);
创建一个层次聚类树使用病房
联系方法。在这种情况下,“SaveMemory”
选择的clusterdata
函数设置为“上”
默认情况下。一般来说,指定的最佳值“SaveMemory”
基于的尺寸X
和可用内存。
Z =连杆(X,“病房”);
集群的数据到一个最大的四组和阴谋的结果。
c =集群(Z,“Maxclust”4);scatter3 (X (: 1) X (:, 2), X(:, 3), 10日,c)
集群
识别四组数据。
比较集群作业类
找到一个最大的三个集群fisheriris
数据集和比较花的集群作业分类。
加载示例数据。
负载fisheriris
创建一个层次聚类树使用“平均”
方法和“chebychev”
指标。
Z =连杆(量,“平均”,“chebychev”);
找到一个最大的三个集群数据。
T =集群(Z,“maxclust”3);
创建一个系统树图块Z
。看到三个集群,使用“ColorThreshold”
与截止介于third-from-last和倒数第二联系。
截止=值([Z (end-2, 3) Z (end-1 3)]);系统树图(Z,“ColorThreshold”,截止)
显示的最后两行Z
看看这三个集群是合并成一个。链接
结合了293(蓝色)与第297(红色)集群集群形成298集群的链接1.7583
。链接
然后结合了296(绿色)集群与第298集群。
lastTwo = Z (end-1:最终,:)
lastTwo =2×3293.0000 297.0000 1.7583 296.0000 298.0000 3.4445
看到集群任务对应于三个物种。例如,一个集群包含50
第二个物种和鲜花的40
第三个物种的鲜花。
交叉表(T,物种)
ans =3×30 0 10 0 50 40 50 0 0
观察聚类分层树
加载examgrades
数据集。
负载examgrades
创建一个层次树链接
。使用“单一”
方法和闵可夫斯基度规的指数3
。
Z =连杆(成绩,“单一”,{闵可夫斯基的3});
观察25日聚类步骤。
:Z(25日)
ans =1×386.0000 137.0000 4.5307
链接
第86届观察和第137集群结合形成一个集群的指数
,120是观察的总数成绩
25的行号Z
。第86届之间最短的距离观察和任何点在第137集群4.5307
。
使用不同集群数据矩阵
创建一个使用一个不同的矩阵会凝聚的层次聚类树。
需要一个不同的矩阵X
并将它转换成一个向量形式链接
接受使用squareform
。
X = [0 1 2 3;1 0 4 5;2 4 0 6;3 5 6 0);y = squareform (X);
创建一个集群树使用链接
与“完成”
计算集群之间的距离的方法。的前两列Z
展示链接
结合集群。第三列的Z
给集群之间的距离。
Z =连杆(y,“完成”)
Z =3×31 2 1 3 5 4 4 6 6
创建一个系统树图块Z
。x轴对应于树的叶节点,和轴与连杆之间的距离集群。
系统树图(Z)
输入参数
X
- - - - - -输入数据
数字矩阵
输入数据,指定为一个数字矩阵的两个或两个以上的行。行代表的观察,和列代表类别或维度。
数据类型:单
|双
方法
- - - - - -算法计算集群之间的距离
“单一”
(默认)|“平均”
|“重心”
|“完成”
|……
算法计算集群之间的距离,在这个表指定为一个值。
方法 | 描述 |
---|---|
“平均” |
未加权的平均距离(UPGMA) |
“重心” |
质心的距离(UPGMC),只适合欧几里得距离 |
“完成” |
最远的距离 |
“中值” |
加权质心距离(WPGMC),只适合欧几里得距离 |
“单一” |
最短的距离 |
“病房” |
内在的平方距离(最小方差算法),只适合欧几里得距离 |
“加权” |
加权平均距离(WPGMA) |
关于这些方法的更多信息,请参阅联系。
度规
- - - - - -距离度量
“欧几里得”
(默认)|“squaredeuclidean”
|“seuclidean”
|“mahalanobis”
|函数处理|……
距离度量,指定为任何度量接受pdist
函数。下表中描述的这些指标。
价值 | 描述 |
---|---|
“欧几里得” |
欧氏距离(默认) |
“squaredeuclidean” |
平方欧氏距离。(此选项仅供效率。它不满足三角不等式)。 |
“seuclidean” |
标准化的欧氏距离。每个坐标差异观察是通过除以相应的扩展元素的标准差, |
“fasteuclidean” |
欧氏距离计算通过使用另一种算法,节省了时间预测的数量至少是10。在某些情况下,这种快速算法可以降低精度。算法开始“快” 不支持稀疏数据金宝app。有关详细信息,请参见算法。 |
“fastsquaredeuclidean” |
平方欧氏距离计算通过使用另一种算法,节省了时间预测的数量至少是10。在某些情况下,这种快速算法可以降低精度。算法开始“快” 不支持稀疏数据金宝app。有关详细信息,请参见算法。 |
“fastseuclidean” |
标准化的欧氏距离计算通过使用另一种算法,节省了时间预测的数量至少是10。在某些情况下,这种快速算法可以降低精度。算法开始“快” 不支持稀疏数据金宝app。有关详细信息,请参见算法。 |
“mahalanobis” |
Mahalanobis距离,计算使用的样本协方差 |
“cityblock” |
城市街区的距离 |
闵可夫斯基的 |
闵可夫斯基距离。默认的指数是2。使用 |
“chebychev” |
Chebychev距离(最大坐标差异) |
的余弦 |
1 -之间的夹角的余弦值点(视为向量) |
“相关” |
1 -样本点之间的相关性(视为序列值) |
“汉明” |
汉明距离,协调不同的百分比 |
“jaccard” |
1 - Jaccard系数,非零坐标不同的百分比 |
“枪兵” |
1 -样本之间的斯皮尔曼等级相关的观察(视为序列值) |
@ |
自定义距离函数处理。距离函数的形式 函数ZJ D2 = distfun(子)%计算距离…
如果你的数据不是稀疏的,你可以通过使用一个内置的通常更快的计算距离的距离度量,而不是一个函数处理。 |
有关更多信息,请参见距离度量。
使用pdist_inputs
而不是度规
指定附加的输入参数DistParameter
的pdist
为“seuclidean”
,闵可夫斯基的
,或“mahalanobis”
。
数据类型:字符
|字符串
|function_handle
pdist_inputs
- - - - - -距离度量和距离度量的选择
单元阵列
距离度量和距离度量选项,指定为逗号分隔的单元阵列组成的两个输入参数距离
和DistParameter
函数的pdist
。这个论点有效仅用于指定“seuclidean”
,闵可夫斯基的
,或“mahalanobis”
。
例子:{“闵可夫斯基”,5}
数据类型:细胞
价值
- - - - - -国旗为“savememory”
选项
“上”
|“关闭”
y
- - - - - -距离
数值向量
相同的距离,指定为一个数字矢量格式的输出pdist
功能:
一个行向量的长度米(米- 1)/ 2,相应的对观测矩阵米行
距离的顺序安排(2,1),(3,1),…,(米1),(2),…,(米,2),…,(米,米- 1))
y
可以是一个更一般的相异矩阵的输出格式符合pdist
。
数据类型:单
|双
输出参数
Z
——会凝聚的层次聚类树
数字矩阵
会凝聚的层次聚类树,返回一个数字矩阵。Z
是一个(米- 1)3矩阵,米在原始数据的数量的观察。1和2的列Z
包含集群指数成对形成二叉树有关。编号从1到叶节点米。叶节点的单例集群都更高的集群。每个新形成的集群,对应于行Z(我,:)
指定的索引米+我
。条目Z(我,1)
和Z(我,2)
包含两个组件的指数集群形成集群米+我
。的米- 1高集群的内部节点对应聚类树。Z(我,3)
包含链接行合并的两个集群之间的距离Z(我,:)
。
例如,考虑建立一个与最初30节点树。假设集群5和集群7步骤12相结合,在这一步,它们之间的距离是1.5。然后:Z(12日)
是(5 7 1.5)
。新成立的集群指数12 + 30 = 42。如果集群42出现在后面的行,那么函数结合集群在第12步创建成一个更大的集群。
数据类型:单
|双
更多关于
联系
一个链接是两个集群之间的距离。
下面的符号描述了各种方法所使用的联系:
集群r是由集群p和问。
nr集群对象的数量r。
x国际扶轮是我th对象在集群r。
单键,也叫最近的邻居,使用最小的两个簇中的对象之间的距离。
完整的链接,也叫最远的邻居最大的对象之间的距离,使用两个集群。
平均链接使用所有成对的对象之间的平均距离任意两个集群。
质心连杆利用质心之间的欧几里得距离的两个集群。
在哪里
中间联系使用加权质心之间的欧几里得距离的两个集群。
在哪里 和 加权质心的集群r和年代。如果集群r是由结合集群p和问, 是递归地定义为
沃德的链接使用增量的平方和,增加总within-cluster平方和由于连接两个集群。within-cluster平方和定义为之间的距离的平方和集群中的所有对象和集群的重心。平方和度量相当于以下距离度量d(r,年代),这是这个公式
链接
用途。在哪里
是欧氏距离。
和 集群的重心r和年代。
nr和n年代集群元素的数量吗r和年代。
在一些引用,沃德的链接不使用2相乘的因素nrn年代。的
链接
函数使用这个因素这两个独立集群之间的距离是一样的欧氏距离。加权平均链接使用一个递归定义之间的距离两个集群。如果集群r是由结合集群p和问,之间的距离r和另一个集群年代被定义为的平均值之间的距离p和年代和之间的距离问和年代。
提示
计算
连杆(y)
时可以慢y
是一个距离矩阵的向量表示。为“重心”
,“中值”
,“病房”
方法,链接
检查是否y
欧氏距离。避免这种耗时的检查通过X
而不是y
。的
“重心”
和“中值”
方法可以产生一个集群树不单调。这个结果发生在距离两个集群的结合,r和年代,集群之间的距离还不到三分之一r和年代。在这种情况下,在系统树图的默认方向,从叶到根节点的路径需要向下的步骤。为了避免这种结果,使用另一种方法。这个图显示了一个非集群树。在这种情况下,集群1和集群3加入到一个新的集群,和这个新的集群和集群2之间的距离小于集群集群1和3之间的距离。结果是一个非树。
您可以提供输出
Z
其他功能包括系统树图
显示树,集群
指定指向集群,不一致的
计算不一致的措施,cophenet
计算同表象相关系数。
版本历史
之前介绍过的R2006a
Beispiel offnen
您有一张这本Beispiels geanderte版本。您这本Beispiel麻省理工学院古老Anderungen offnen吗?
MATLAB-Befehl
您有窗户的链接geklickt,汪汪汪der diesem MATLAB-Befehl entspricht:
在das MATLAB-Befehlsfenster Fuhren您窝Befehl军队Eingabe来自。浏览器unterstutzen MATLAB-Befehle。
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。