主要内容

描述性统计

数值总结和相关措施

从样本数据中计算描述性统计,包括集中趋势、离散度、形状、相关性和协方差的度量。制表和交叉制表数据,并计算分组数据的汇总统计信息。

功能

全部展开

geomean 几何平均数
harmmean 调和平均数
trimmean 均值,排除异常值
峰度 峰度
时刻 中央的时刻
偏态 偏态
范围 取值范围
位差 四分位范围
疯了 平均或中位数绝对偏差
prctile 数据集的百分位数
分位数 数据集的分位数
zscore 标准化z分数
相关系数 线性或等级相关
robustcov 稳健的多元协方差和均值估计
cholcov cholesky样协方差分解
corrcov 将协方差矩阵转换为相关矩阵
partialcorr 线性或秩偏相关系数
partialcorri 部分相关系数调整为内部变量
nearcorr 通过最小化Frobenius距离计算最近的相关矩阵
grpstats 按组组织的汇总统计
汇总 频率表
交叉表 交叉表
tiedrank 排名调整为平局

主题

数据探索性分析

使用描述性统计研究数据的分布。

集中趋势的措施

在适当的范围内确定数据的分布。

离散度量

找出数据值在数轴上的分布情况。

分位数和百分位数

了解统计和机器学习工具箱™如何计算分位数和百分位数。

分组变量

分组变量是用于对观察结果进行分组或分类的效用变量。