将数据分组变量
您可以使用分组变量将数据变量组。通常,选择分组变量的第一步Split-Apply-Combine工作流。你可以把数据分成组,每组应用一个函数,结合结果。你也可以表示缺失值分组变量,以便在数据变量对应的值将被忽略。
分组变量
分组变量变量用于组或分类,观察,数据值在其他变量。一个分组变量可以是任何数据类型:
数字、逻辑、分类
datetime
,或持续时间
向量单元阵列的特征向量
表,表变量的数据类型列表
数据变量包含观测的变量。分组变量必须有一个值对应于每个值在数据变量。数据值属于同一个组时对应的分组变量中的值是相同的。
这个表显示数据变量的例子,分组变量和组织分割数据时您可以创建变量使用分组变量。
数据变量 |
分组变量 |
组织的数据 |
---|---|---|
|
|
|
|
|
|
|
|
|
你可以给组数据有意义的名字,当你使用细胞阵列特征向量或分类数组作为分组变量。一系列分类是一种有效和灵活的选择分组变量。
组定义
通常,有尽可能多的团体有独特的分组变量中的值。(分类数组也可以包括类别不代表数据。)团体和团体的顺序取决于分组变量的数据类型。
对数字、逻辑
datetime
,或持续时间
特征向量的向量,或细胞阵列组对应唯一的值按升序排序。分类数组,组中观察到对应唯一的值数组,返回的顺序排序
类别
函数。
的findgroups
例如,函数可以接受多个分组变量G = findgroups (A1, A2)
。您还可以包括多个表中的分组变量,例如T =表(A1, A2);G = findgroups (T)
。的findgroups
函数定义组织的独特组合值在相应的元素分组变量。findgroups
决定订单的订单的第一个分组变量,然后通过第二个分组变量的顺序,等等。例如,如果A1 = {' a ', ' a ', ' b ', ' b '}
和A2 = [0 1 0 0]
,然后对面的惟一值分组变量' ' 0
,“一个”1
,“b”0
,定义三组。
Split-Apply-Combine工作流
在您选择分组变量和变量数据分割成团体,您可以应用函数组和合并结果。此工作流叫做Split-Apply-Combine工作流。您可以使用findgroups
和splitapply
功能分析组数据在这个工作流。这个图显示了一个简单的例子使用分组变量性别
和数据变量高度
计算平均身高,性别。
的findgroups
函数返回一个向量的组数字定义组基于独特的分组变量中的值。splitapply
使用组数字数据分割成组有效申请前一个函数。
失踪组值
分组变量可以有缺失值。此表显示了每个数据的缺失值指标类型。如果一个分组变量缺失值findgroups
分配南
组号,splitapply
忽略了相应的值在数据变量。
分组变量数据类型 |
缺失值指标 |
---|---|
数字 |
|
逻辑 |
(不能缺少) |
分类 |
|
|
|
|
|
单元阵列的特征向量 |
|
字符串 |
|
另请参阅
findgroups
|rowfun
|splitapply
|varfun