首页 > 其他 > 详细

Coursera Deep Learning笔记 结构化机器学习项目 (下)

时间:2020-06-14 00:20:22      阅读:49      评论:0      收藏:0      [点我收藏+]

参考:https://blog.csdn.net/red_stone1/article/details/78600255https://blog.csdn.net/red_stone1/article/details/78600255

1. 进行误差分析(error analysis)

举个例子,猫类识别问题,已经建立的模型的错误率为10%。为了提高正确率,我们发现该模型会将一些狗类图片错误分类成猫。一种常规解决办法是扩大狗类样本,增强模型对够类(负样本)的训练。但是,这一过程可能会花费几个月的时间,耗费这么大的时间成本到底是否值得呢?也就是说扩大狗类样本,重新训练模型,对提高模型准确率到底有多大作用?这时候我们就需要进行error analysis,帮助我们做出判断。

我们可以从分类错误的样本中统计出狗类的样本数量。根据狗类样本所占的比重,判断这一问题的重要性

假如狗类样本所占比重仅为5%,即时我们花费几个月的时间扩大狗类样本,提升模型对其识别率,改进后的模型错误率最多只会降低到9.5%。相比之前的10%,并没有显著改善。我们把这种性能限制称为ceiling on performance。

相反,假如错误样本中狗类所占比重为50%,那么改进后的模型错误率有望降低到5%,性能改善很大。因此,值得去花费更多的时间扩大狗类样本。

技术分享图片

2. 清除标注错误的数据

3. 快速搭建你的第一个系统并迭代

4. 在不同的划分上进行训练并测试

5. 不匹配数据划分的偏差和方差

6. 定位数据不匹配

7. 迁移学习

8. 多任务学习

9. 什么是端到端的深度学习

10. 是否要使用端到端的深度学习

Coursera Deep Learning笔记 结构化机器学习项目 (下)

原文:https://www.cnblogs.com/douzujun/p/13122094.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!