创建一个OneClassSVM
未被污染的培训对象观察使用ocsvm
函数。然后检测小礼品(新数据异常)通过对象和新的数据对象的功能isanomaly
。
1994年的人口普查数据加载存储census1994.mat
。数据集由人口数据来自美国人口普查局预测一个人是否使每年超过50000美元。
census1994
包含了训练数据集adultdata
和测试数据集成人
。
ocsvm
不使用观察用缺失值。删除缺失值的数据集,以减少内存消耗,加快培训。
支持向量机训练看到下面成了adultdata
。假设adultdata
不包含异常值。指定StandardizeData
作为真正的
标准化的输入数据,并设置KernelScale
来“汽车”
让函数选择适当的内核使用启发式程序尺度参数。
Mdl
是一个OneClassSVM
对象。如果你不指定ContaminationFraction
名称参数值大于0,ocsvm
把所有训练观察正常观测。这个函数设置分数阈值最大的分数值。显示阈值。
发现异常成人
通过训练看到下面成了一个支持向量机模型。因为你指定的StandardizeData = true
当你训练模型,isanomaly
函数标准化输入数据通过使用预测手段和训练数据存储在的标准差μ
和σ
属性,分别。
的isanomaly
函数的作用是:返回异常指标tf_test
和分数s_test
为成人
。默认情况下,isanomaly
确定观测分数高于阈值(Mdl.ScoreThreshold
)异常。
创建直方图异常分数年代
和s_test
。创建一个垂直线阈值的异常分数。
显示异常的观测指标的测试数据。
的异常分数分布测试数据与训练数据,isanomaly
没有发现任何异常的测试数据默认阈值。您可以指定一个不同的阈值使用ScoreThreshold
名称-值参数。例如,看到的指定异常分数阈值。