主要内容

在分类学习App中训练分类模型

您可以使用分类学习器来训练这些分类器的模型:决策树、判别分析、支持向量机、逻辑回归、最近邻、朴素贝叶斯和集成分类。金宝app除了训练模型,您还可以探索数据、选择特征、指定验证方案和评估结果。您可以将模型导出到工作区,以使用带有新数据的模型或生成MATLAB®了解编程分类的代码。

分类学习者模型的训练包括两个部分:

  • 验证模型:用验证方案训练模型。默认情况下,应用程序通过应用交叉验证来防止过拟合。或者,您可以选择拒绝验证。验证过的模型在应用程序中可见。

  • 完整模型:在没有验证的完整数据上训练模型。应用程序同时训练这个模型和验证过的模型。但是,在完整数据上训练的模型在应用程序中不可见。当您选择要导出到工作区的分类器时,Classification Learner将导出完整的模型。

该应用程序显示验证模型的结果。诊断措施,如模型精度,和图,如散点图或混淆矩阵图,反映验证的模型结果。您可以自动训练一组或所有分类器,比较验证结果,并选择最适合您的分类问题的模型。当您选择要导出到工作区的模型时,Classification Learner将导出完整的模型。由于Classification Learner在训练期间创建了完整模型的模型对象,因此在导出模型时不会遇到延迟时间。您可以使用导出的模型对新数据进行预测。

若要开始训练一组模型类型,请参见自动分类器训练.如果您已经知道要训练的分类器类型,请参见手动分类器训练

自动分类器训练

您可以使用分类学习器在数据上自动训练选择的不同分类模型。

  • 通过一次自动训练多个模型来开始。您可以快速尝试选择的模型,然后交互式地探索有前景的模型。

  • 如果您已经知道想要的分类器类型,则可以改为训练单个分类器。看到手动分类器训练

  1. 应用程序选项卡,在机器学习组中,单击分类学习者

  2. 点击新会话并从工作区或文件中选择数据。指定一个响应变量和用作预测器的变量。看到选择分类问题的数据和验证

  3. 分类学习者选项卡,在模型类型部分中,点击所有Quick-To-Train.此选项将训练所有可用于您的数据集的模型预置,以便快速拟合。

  4. 点击火车

    请注意

    该应用程序并行训练模型,如果你有并行计算工具箱™。看到并行分类器训练

    一个模型类型的选择出现在History列表中。当他们完成训练时,最好的百分比精度分数在方框中突出显示。

  5. 单击历史列表中的模型以探索图中的结果。

    有关后续步骤,请参见手动分类器训练比较和改进分类模型

  6. 若要尝试数据集中可用的所有不可优化分类器模型预设,请单击所有,然后按火车

手动分类器训练

如果您想探索单个模型类型,或者如果您已经知道您想要的分类器类型,您可以一次训练一个分类器,或者训练一组相同类型的分类器。

  1. 选择一个分类器。在分类学习者选项卡,在模型类型节中,单击分类器类型。控件最右侧的箭头,可以查看所有可用的分类器选项模型类型节展开分类器列表。中的不可优化模型选项模型类型画廊是预设的起点与不同的设置,适用于一系列不同的分类问题。

    要阅读每个分类器的描述,请切换到详细信息视图。

    有关每个选项的详细信息,请参见选择分类器选项

  2. 选择分类器后,单击火车

    重复尝试不同的分类器。

    提示

    首先试试决策树和判别法。如果模型在预测响应时不够准确,可以尝试其他具有更高灵活性的分类器。为了避免过度拟合,请寻找灵活性较低但提供足够精度的模型。

  3. 如果您想尝试相同或不同类型的所有不可优化模型,请从所有的选项。模型类型画廊。

    或者,如果您想自动优化特定模型类型的超参数,请选择相应的超参数Optimizable建模并执行超参数优化。有关更多信息,请参见分类学习App中的超参数优化

有关后续步骤,请参见比较和改进分类模型

并行分类器训练

如果您有并行计算工具箱,您可以使用分类学习器并行训练模型。当你训练分类器时,应用程序会自动启动一个并行工作池,除非你关闭默认的并行首选项自动创建并行池.如果一个泳池已经开放,应用程序就会使用它进行训练。并行训练允许您一次训练多个分类器并继续工作。

  1. 第一次点击火车,你会看到一个对话框,同时应用程序打开了一个并行工作池。池打开后,您可以一次训练多个分类器。

  2. 当分类器并行训练时,您可以在历史列表中看到每个训练模型和队列模型的进度指示器,如果您愿意,您可以取消单个模型。在训练过程中,您可以检查模型的结果和图,并开始训练更多的分类器。

要控制并行训练,请切换使用并行按钮在应用程序工具条。的使用并行按钮只有当您有并行计算工具箱时才可用。

如果您有并行计算工具箱,则可以在分类学习器中进行并行训练,并且不需要设置UseParallel选项statset函数。如果您关闭了并行首选项自动创建并行池,那么该应用程序不会在没有请求的情况下为你启动一个池。

请注意

不能并行执行超参数优化。应用程序会禁用使用并行按钮,以选择可优化的模型。如果您随后选择了一个不可优化的模型,该按钮默认情况下是关闭的。

比较和改进分类模型

  1. 单击历史列表中的模型以查看图中的结果。通过在散点图和混淆矩阵中检查结果来比较模型性能。检查每个模型的历史列表中报告的百分比准确度。看到评估分类学习者中的分类器性能

  2. 在历史记录列表中选择最好的模型,然后尝试在模型中包含和排除不同的特征。单击“功能选择”。

    尝试平行坐标图,以帮助您确定要删除的特征。看看是否可以通过去除低预测能力的特征来改进模型。指定要包含在模型中的预测器,并使用新选项训练新模型。比较历史记录列表中模型的结果。

    你也可以尝试用PCA转换特征来降低维数。

    看到使用分类学习App进行特征选择和特征转换

  3. 要进一步改进模型,您可以尝试在高级对话框中更改分类器参数设置,然后使用新选项进行训练。要了解如何控制模型灵活性,请参见选择分类器选项.有关如何自动调优模型参数设置的信息,请参见分类学习App中的超参数优化

  4. 如果特征选择、PCA或新参数设置可以改善模型,请尝试训练所有使用新设置建模类型。看看是否有其他模型类型在新设置下表现更好。

提示

为了避免过度拟合,请寻找灵活性较低但提供足够精度的模型。例如,寻找简单的模型,如决策树和判别器,这些模型快速且易于解释。如果模型预测响应不够准确,则选择其他具有更高灵活性的分类器,例如集成。要了解模型灵活性,请参见选择分类器选项

图中显示了一个包含各种分类器类型的历史列表的应用程序。

提示

有关比较不同分类器的逐步示例,请参见使用分类学习应用程序训练决策树

对于接下来的步骤,生成代码以使用不同的数据训练模型,或者将训练好的模型导出到工作区,以便使用新数据进行预测。看到导出分类模型预测新数据

相关的话题