首页 > 其他 > 详细

《机器学习进阶》Udacity 机器学习基础 评估指标

时间:2019-12-30 13:20:42      阅读:75      评论:0      收藏:0      [点我收藏+]

技术分享图片

选择合适的指标

在构建机器学习模型时,我们首先要选择性能指标,然后测试模型的表现如何。相关的指标有多个,具体取决于我们要尝试解决的问题。

在可以选择性能指标之前,首先务必要认识到,机器学习研究的是如何学习根据数据进行预测。对于本课程和后续的“监督式机器学习”课程,我们将重点关注那些创建分类或创建预测回归类型的已标记数据。

此外,在测试模型时,也务必要将数据集分解为训练数据和测试数据。如果不区分训练数据集和测试数据集,则在评估模型时会遇到问题,因为它已经看到了所有数据。我们需要的是独立的数据集,以确认模型可以很好地泛化,而不只是泛化到训练样本。在下一课中,我们将探讨模型误差的一些常见来源,并介绍如何正确分解本课程的“数据建模和验证”部分中的数据集。

技术分享图片

分类指标与回归指标

在分类中,我们想了解模型隔多久正确或不正确地识别新样本一次。而在回归中,我们可能更关注模型的预测值与真正值之间差多少。

在本节课的余下部分,我们会探讨几个性能指标。对于分类,我们会探讨准确率、精确率、召回率和 F 分数。对于回归,我们会探讨平均绝对误差和均方误差。

技术分享图片

技术分享图片

技术分享图片

准确率实际上是所有被正确标示的数据点除以所有的数据点。如果你是在看特定类的表现,我们需要看召回率(recall),这在后面的课程中会讲到。

技术分享图片

技术分享图片

技术分享图片

技术分享图片

真阳性。真实是positive而被预测的是negtive。

技术分享图片

技术分享图片

技术分享图片

技术分享图片

可通过调节参数来使曲线偏移。

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片技术分享图片

技术分享图片

 

 技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

 

 技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

《机器学习进阶》Udacity 机器学习基础 评估指标

原文:https://www.cnblogs.com/JasonPeng1/p/12118755.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!