集群
从联系构建烧结的集群
描述
例子
定义集群通过指定深度
对随机生成的数据执行凝结的集群通过评估不一致的价值观四个低于每个节点的深度。
随机生成示例数据。
rng (“默认”);%的再现性2 X = [(randn(20日)* 0.75)+ 1;2 (randn(20日)* 0.25)1);
创建一个数据的散点图。
散射(X (: 1), (2):,);标题(随机生成的数据的);
创建一个层次聚类树使用病房
联系方法。
Z =连杆(X,“病房”);
创建一个系统树图的数据。
系统树图(Z)
散点图和系统树图情节似乎显示两个集群数据。
集群的数据使用一个阈值3不一致性系数和寻求4低于每个节点的深度。情节产生的集群。
T =集群(Z,“截止”3,“深度”4);gscatter (X (: 1) X (:, 2), T)
集群
确定两个集群数据。
使用距离集群数据标准
执行凝结的集群上fisheriris
数据集使用“距离”
定义集群的标准。可视化数据的集群作业。
加载fisheriris
数据集。
负载fisheriris
可视化数据的二维散点图使用物种作为分组变量。指定标记颜色和标记符号的三个不同的物种。
gscatter(量(:1)量(:,2),物种,“rgb”,‘*’)标题(“实际的费雪的虹膜数据”)
创建一个层次聚类树使用“平均”
方法和“chebychev”
指标。
Z =连杆(量,“平均”,“chebychev”);
集群的数据使用一个阈值为1.5“距离”
标准。
T =集群(Z,“截止”,1.5,“标准”,“距离”)
T =150×12 2 2 2 2 2 2 2 2 2⋮
T
包含数字,对应于集群作业。找到的类的数量集群
标识。
长度(独特的(T))
ans = 3
集群
识别三个类的指定值截止
和标准
。
想象一个二维散点图的聚类结果T
作为分组变量。指定标记颜色和标记符号的三个不同的类。
gscatter(量(:1)量(:,2),T,“rgb”,‘*’)标题(“费舍尔的虹膜数据集群作业”)
集群正确标识setosa类(二班)属于一个不同的集群,但不区分杂色的和virginica类(类1和3,分别)。注意,散点图标签中包含的类使用的数字T
。
比较集群作业类
找到一个最大的三个集群fisheriris
数据集和比较花的集群作业分类。
加载示例数据。
负载fisheriris
创建一个层次聚类树使用“平均”
方法和“chebychev”
指标。
Z =连杆(量,“平均”,“chebychev”);
找到一个最大的三个集群数据。
T =集群(Z,“maxclust”3);
创建一个系统树图块Z
。看到三个集群,使用“ColorThreshold”
与截止介于third-from-last和倒数第二联系。
截止=值([Z (end-2, 3) Z (end-1 3)]);系统树图(Z,“ColorThreshold”,截止)
显示的最后两行Z
看看这三个集群是合并成一个。链接
结合了293(蓝色)与第297(红色)集群集群形成298集群的链接1.7583
。链接
然后结合了296(绿色)集群与第298集群。
lastTwo = Z (end-1:最终,:)
lastTwo =2×3293.0000 297.0000 1.7583 296.0000 298.0000 3.4445
看到集群任务对应于三个物种。例如,一个集群包含50
第二个物种和鲜花的40
第三个物种的鲜花。
交叉表(T,物种)
ans =3×30 0 10 0 50 40 50 0 0
集群的数据和阴谋的结果
随机生成样本数据与20000年的观察。
rng (“默认”)%的再现性X =兰德(20000 3);
创建一个层次聚类树使用病房
联系方法。在这种情况下,“SaveMemory”
选择的clusterdata
函数设置为“上”
默认情况下。一般来说,指定的最佳值“SaveMemory”
基于的尺寸X
和可用内存。
Z =连杆(X,“病房”);
集群的数据到一个最大的四组和阴谋的结果。
c =集群(Z,“Maxclust”4);scatter3 (X (: 1) X (:, 2), X(:, 3), 10日,c)
集群
识别四组数据。
输入参数
C
- - - - - -阈值定义集群
积极的标量|积极的标量矢量
D
- - - - - -深度计算值不一致
2(默认)|数字标量
计算深度不一致的值,指定为一个数字标量。集群
通过深度评估不一致的值D
低于每个节点。
例子:集群(Z,“截止”,0.5,“深度”,3)
数据类型:单
|双
标准
- - - - - -标准定义集群
“不一致”
(默认)|“距离”
N
- - - - - -最大数量的集群
正整数|向量的正整数
最大数量的集群形成,指定为一个正整数或一个向量的正整数。集群
构造一个最大的N
集群,使用“距离”
定义集群的标准。树中的每个节点的高度代表了合并的两个子节点,节点之间的距离。集群
发现的最小的高度水平穿过树会离开N
或更少的集群。看到指定任意的集群为更多的细节。
例子:集群(Z, MaxClust, 5)
数据类型:单
|双
输出参数
选择功能
如果你有一个输入数据矩阵X
,你可以使用clusterdata
执行每个观察凝结的集群和返回集群指数(行)X
。的clusterdata
函数执行所有必要的步骤,所以您不需要执行pdist
,链接
,集群
单独的功能。
版本历史
之前介绍过的R2006a
Beispiel offnen
您有一张这本Beispiels geanderte版本。您这本Beispiel麻省理工学院古老Anderungen offnen吗?
MATLAB-Befehl
您有窗户的链接geklickt,汪汪汪der diesem MATLAB-Befehl entspricht:
在das MATLAB-Befehlsfenster Fuhren您窝Befehl军队Eingabe来自。浏览器unterstutzen MATLAB-Befehle。
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。