文档

将数据分组变量

您可以使用分组变量将数据变量组。通常,选择分组变量的第一步Split-Apply-Combine工作流。你可以把数据分成组,每组应用一个函数,结合结果。你也可以表示缺失值分组变量,以便在数据变量对应的值将被忽略。

分组变量

分组变量变量用于组或分类,观察,数据值在其他变量。一个分组变量可以是任何数据类型:

  • 数字、逻辑、分类datetime,或持续时间向量

  • 单元阵列的特征向量

  • 表,表变量的数据类型列表

数据变量包含观测的变量。分组变量必须有一个值对应于每个值在数据变量。数据值属于同一个组时对应的分组变量中的值是相同的。

这个表显示数据变量的例子,分组变量和组织分割数据时您可以创建变量使用分组变量。

数据变量

分组变量

组织的数据

(5 10 15 20 25 30)

(1 0 0 0 0 1)

30 [5 10 15 20][25]

(10 20 30 40 50 60)

(1 2 3 3 1 1)

20 40 60 [10][50][30]

(64 72 67 69 64 68)

{‘F’,‘米’,‘F’,‘米’,‘F’,‘F’}

(64 67 64 68]69 [72]

你可以给组数据有意义的名字,当你使用细胞阵列特征向量或分类数组作为分组变量。一系列分类是一种有效和灵活的选择分组变量。

组定义

通常,有尽可能多的团体有独特的分组变量中的值。(分类数组也可以包括类别不代表数据。)团体和团体的顺序取决于分组变量的数据类型。

  • 对数字、逻辑datetime,或持续时间特征向量的向量,或细胞阵列组对应唯一的值按升序排序。

  • 分类数组,组中观察到对应唯一的值数组,返回的顺序排序类别函数。

findgroups例如,函数可以接受多个分组变量G = findgroups (A1, A2)。您还可以包括多个表中的分组变量,例如T =表(A1, A2);G = findgroups (T)。的findgroups函数定义组织的独特组合值在相应的元素分组变量。findgroups决定订单的订单的第一个分组变量,然后通过第二个分组变量的顺序,等等。例如,如果A1 = {' a ', ' a ', ' b ', ' b '}A2 = [0 1 0 0],然后对面的惟一值分组变量' ' 0,“一个”1,“b”0,定义三组。

Split-Apply-Combine工作流

在您选择分组变量和变量数据分割成团体,您可以应用函数组和合并结果。此工作流叫做Split-Apply-Combine工作流。您可以使用findgroupssplitapply功能分析组数据在这个工作流。这个图显示了一个简单的例子使用分组变量性别和数据变量高度计算平均身高,性别。

findgroups函数返回一个向量的组数字定义组基于独特的分组变量中的值。splitapply使用组数字数据分割成组有效申请前一个函数。

失踪组值

分组变量可以有缺失值。此表显示了每个数据的缺失值指标类型。如果一个分组变量缺失值findgroups分配组号,splitapply忽略了相应的值在数据变量。

分组变量数据类型

缺失值指标

数字

逻辑

(不能缺少)

分类

<定义>

datetime

NaT

持续时间

单元阵列的特征向量

字符串

<失踪>

另请参阅

|||

相关的话题