人工智能PPT第6章模型评估与选择.ppt

上传人：bubibi

文档编号：18831152

上传时间：2023-11-02

格式：PPT

页数：29

大小：422.50KB

《人工智能PPT第6章模型评估与选择.ppt》由会员分享，可在线阅读，更多相关《人工智能PPT第6章模型评估与选择.ppt（29页珍藏版）》请在文库网上搜索。

1、第第6 6章章模型调优与评估模型调优与评估过拟合和欠合和欠拟合合拟拟合是指机器学合是指机器学合是指机器学合是指机器学习习模型在模型在模型在模型在训练训练的的的的过过程中，通程中，通程中，通程中，通过过更新参数，更新参数，更新参数，更新参数，使得模型不断契合可使得模型不断契合可使得模型不断契合可使得模型不断契合可观测观测数据数据数据数据(训练训练集集集集)的的的的过过程。欠程。欠程。欠程。欠拟拟合合合合指的是模型在指的是模型在指的是模型在指的是模型在训练训练和和和和预测预测表表表表现现都不好，往往由于模型都不好，往往由于模型都不好，往往由于模型都不好，往往由于模型过过于于于于简单简单,如如如如

2、图图(a)(a)所示。正常模型指的是模型在所示。正常模型指的是模型在所示。正常模型指的是模型在所示。正常模型指的是模型在训练训练和和和和预预测测表表表表现现都好，如都好，如都好，如都好，如图图(b)(b)所示。所示。所示。所示。过拟过拟合是指由于模型合是指由于模型合是指由于模型合是指由于模型过过于于于于复复复复杂杂，模型在，模型在，模型在，模型在训练训练集上的表集上的表集上的表集上的表现现很好，但在很好，但在很好，但在很好，但在测试测试集上表集上表集上表集上表现现较较差差差差,如如如如图图(c)(c)所示。所示。所示。所示。欠拟合1）添加新特征添加新特征当特征不足或者现有特征与样本标签的相关性

3、不强时，模型容易出现欠拟合。通过“组合特征”等进行处理。2）模型优化：提升模型复杂度模型优化：提升模型复杂度模型的复杂度可以使模型拥有更强的拟合能力。例如，在线性模型中添加高次项等进行处理。不同的建模算法针对不同的业务场景有不同的表现，尝试不同的建模算法，从中比较，择优者而用之。细分群体，建立多个模型，对应不同的核心客户群体。3）减少正则项权重减少正则项权重过拟合1）获取更多的训练样本获取更多的训练样本由于模型训练了包含噪音在内的所有特征，导致模型过拟合，通过获取更多的训练样本，可以衰减噪音权重。2）减少特征数目减少特征数目特征共线性检查，利用Pearson相关系数计算变量之间的线性相关性，如

4、果自变量中属于中度以上线性相关的多个变量，只需要保留一个就可以。重要特征筛选，利用决策树模型，降低树的深度、进行剪枝等,筛选出重要特征。数据降维，主成分分析，保留特征变量重要差异。3）增加正则项权重增加正则项权重减少高次项的影响。例如，添加L2正则化到损失函数等。模型调优模型调优，首先应解决欠拟合问题，其次再解决过拟合问题。更主要的，是从数据的特征入手，好的特征工程决定预测结果的上限。参数调优往往是数据挖掘、数据分析中至关重要的一步，主要调整模型中的超参数，例如学习速率等。Sklearn提供了网格搜索法和随机搜索方法用于参数调优。网格搜索GridSearchCV可以自动进行超参数组合，传入需要

5、测试的超参数和对应的值，自动使用交叉验证，来评估在这些超参数的组合下，模型的优劣。GridSearchCV拆分为GridSearch和CV两部分，即网格搜索和交叉验证。Sklearn的model_selection模块GridSearchCV，形式如下所示：GridSearchCV(eatimator,param_grid)随机搜索法在处理较少的超参数组合时，GridSearchCV方法比较适用。GridSearchCV可以保证在指定的参数范围内找到精度最高的参数，但是这也是网格搜索的缺陷所在，要求遍历所有可能参数的组合，在面对大数据集和多参数的情况下，非常耗时。RandomizedSearc

6、hCV随机参数搜索的方法相对于网格搜索方法,找到模型的最优参数的可能性比较大，并且也比较省时。Sklearn的model_selection模块RandomizedSearchCV分类评估标准n混淆矩阵n准确率n精确率n召回率nF1scorenROC曲线nAUC面积n分类评估报告分类评估报告混淆矩阵n混淆矩阵也称误差矩阵，用于评价算法或者分类器的结果。混淆矩阵由n行n列组成，每一列代表了预测类别，每一列的总数表示预测为该类别的数据的数目；每一行代表了数据的真实归属类别，每一行的总数表示该类别的数据实例的数目。每一列中的数值表示真实数据被预测为该类的数目。混淆矩阵准确率准确率（Accuracy，

7、缩写ACC）是最常用的分类性能指标。准确率是指有病被检查的TP是检测对了，没病也检测的TN也是检测对了。准确率(Accuracy)=预测正确样本数/总样本数。公式如下所示：sklearn.metrics模块提供accuracy_score函数，形式如下所示：sklearn.metrics.accuracy_score(y_true,y_pred,normalize)精确率精确率（Precision）又称为查准率，容易和准确率混淆。精确率只是针对预测正确的正样本而不是所有预测正确的样本，精准率是正确预测的正例数/预测正例总数。公式如下所示：sklearn.metrics模块提供precision

8、_score函数，形式如下所示：sklearn.metrics.precision_score(y_true,y_pred)召回率召回率（Recall）就是所有准确的条目有多少被检索出来，召回率可理解为查全率。查准率和查全率是一对矛盾的度量。一般来说，查准率高时，查全率往往偏低；而查全率高时，查准率往往偏低。召回率是正确预测的正例数/实际正例总数sklearn.metrics模块提供recall_score函数，形式如下所示：recall_score(y_true,y_pred,average)F1scoreF1分数（F1Score）用于衡量二分类模型精确度,是精确率和召回率的调和值，变化范围

9、在0-1。F1计算公式如下所示：sklearn.metrics模块提供f1_score函数，形式如下所示：f1_score(y_test,predictions,average=micro)ROC曲线ROC全称是“受试者工作特征”（ReceiverOperatingCharacteristic）曲线，用于描述混淆矩阵中FPR-TPR两个量之间的相对变化情况。ROC曲线的横轴是FPR，纵轴是TPR。ROC曲线用于描述样本的真实类别和预测概率。AUC面积AUC（AreaUnderCurve）是指ROC曲线下的面积，由于ROC曲线一般都处于y=x这条直线的上方，所以AUC的取值范围在0.5和1之间。

10、AUC只能用于评价二分类，直观的评价分类器的好坏，值越大越好sklearn.metrics模块提供roc_auc_score函数，形式如下所示：sklearn.metrics.roc_auc_score(y_true,y_score)分类评估报告分类评估报告sklearn中的classification_report函数用于显示主要分类指标的文本报告，显示每个类的精确度、召回率、F1值等信息。classification_report函数形式如下所示classification_report(y_true,y_pred,labels,target_names)回归评估方法n平均绝对误差n均方误

11、差nr2_score平均绝对误差平均绝对误差(MeanabsoluteError,MAE),又被称为l1。是指预测值与真实值之间平均相差多大，反映预测值误差的实际情况，用于评估预测结果和真实数据集的接近程度的程度，其值越小说明拟合效果越好Sklearn提供了mean_absolute_error用于平均绝对误差，如下所示：mean_absolute_error(y_true,y_pred)均方误差均方均方误差（差（MeanSquaredError，缩写写MSE）,又被又被称称为l2。反映。反映观测值与真与真值偏差的平方和与偏差的平方和与观测次数次数的比的比值，是指，是指预测值与真与真实值之差的

12、平方和的平均之差的平方和的平均值，其其值越小越小说明明拟合效果越好。合效果越好。Sklearn提供了提供了mean_squared_error用于均方用于均方误差，差，如下所示：如下所示：mean_squared_error(y_true,y_pred)r2_scoren在分在分类问题中，用中，用F1_score分分类。在回。在回归问题中有中有相相应的决定系数（的决定系数（Coefficientofdetermination），），又被称又被称为R2_score，其，其值取取值范范围是是0,1，越接近，越接近1，表明方程的，表明方程的变量量对y的解的解释能力越能力越强，模型，模型对数据数据拟合

13、的也合的也较好，越接近好，越接近0，表明模型，表明模型拟合的越差。合的越差。nSklearn提供了提供了r2_score用于解用于解释回回归模型的方差模型的方差得分，如下所示：得分，如下所示：nr2_score(y_true,y_pred)损失函数n损失函数（失函数（lossfunction）用来估量模型的）用来估量模型的预测值与真与真实值的不一致程度，是一个非的不一致程度，是一个非负实值函数。函数。损失函数在失函数在统计学和机学和机器学器学习中被用于模型的中被用于模型的参数估参数估计计，即通，即通过最小化最小化损失函数求解失函数求解和和评估模型。估模型。n损失函数又称失函数又称为代价函数代价

14、函数（CostFunction），或成本函数。），或成本函数。成本函数和成本函数和损失函数是同失函数是同义词n并且可以互并且可以互换使用，但稍有不同。使用，但稍有不同。n损失函数有失函数有时也称也称为误差函数差函数(errorfunction)，用于，用于单个个训练样本。本。n代价函数，是整个代价函数，是整个训练数据集的所有数据集的所有样本本误差的平均差的平均损失。失。损失函数n常常见的的损失失误差如下所示：差如下所示：n平方平方损失函数（失函数（squaredloss）：采用最小二乘法，用在）：采用最小二乘法，用在线性回性回归n绝对误差差损失（失（Absoluteerrorloss）：用在）

15、：用在线性回性回归n铰链损失（失（HingeLoss）：主要用于支持向量机。）：主要用于支持向量机。n对数似然数似然损失函数（失函数（logarithmicloss）：主要在）：主要在逻辑回回归中中使用使用n其他其他损失（如失（如0-1损失）失）平方误差损失n平方平方损失函数（失函数（squaredloss）是）是实际值和和预测值之差的平之差的平方，一般用在方，一般用在线性回性回归，可以理解，可以理解为最小二乘法。最小二乘法。n相相应的成本函数是的成本函数是这些平方些平方误差的平均差的平均值(MSE)。绝对误差损失n绝对误差差损失（失（Absoluteerrorloss）是）是预测值和和实际值

16、之之间的距离，用在的距离，用在线性回性回归。绝对误差也称差也称为L1Loss。绝对误差差损失函数的表达形式失函数的表达形式为：n成本函数是成本函数是这些些绝对误差的平均差的平均值(MAE)。0-1损失n0-1损失函数失函数(Zero-oneLoss)是指当是指当预测标签和真和真实标签一致，返回一致，返回0，否，否则就就为1。0-1损失函数的表达形式失函数的表达形式为：nSklearn提供了提供了zero_one_loss用于用于0-1损失函数，如下所示失函数，如下所示zero_one_loss(y_true,y_pred,normalize)对数似然损失n对数似然数似然损失函数（失函数（log

17、arithmicloss）主要在）主要在逻辑回回归中使中使用，当用，当样本本预测值和和实际值的的误差符合高斯分布，使用极大似差符合高斯分布，使用极大似然估然估计的方法，取的方法，取对数得到数得到损失函数。失函数。nSklearn提供了提供了log_loss函数，函数，语法如下所示：法如下所示：log_loss(y_true,y_pred)铰链损失n铰链损失函数（失函数（HingeLoss）用于）用于评价支持向量机，价支持向量机，Sklearn提供了提供了hinge_loss函数，函数，语法如下所示：法如下所示：hinge_loss(y_true,y_pred)模型保存与加载nsklearn中提供了高效的模型持久化模中提供了高效的模型持久化模块joblib，将模型保存，将模型保存至硬至硬盘。nfromsklearn.externalsimportjoblib