首页 > 其他 > 详细

学习相关

时间:2019-06-20 22:54:19      阅读:135      评论:0      收藏:0      [点我收藏+]

数据运用:注意对数据先进行random_shuffle(如果数据有一定顺序,下述划分会导致数据范围不全面)
1)数据7:3划分
train err/ test err
2)数据6:2:2划分
train err/ validation err/ test err
第二部用与多种模型/算法之间进行比较,比较后可以选出较优算法
但不能用这一步的误差来反映其预测误差
因为在这步相当于额外训练了一个参数(如选哪个算法,最高次项几次这种)(隐含了调整参数选择最小J的步骤)
所以还得再用test进行误差预计。(这里第二步筛选出的较劣算法不需要test)

注意当使用regularization时,使用带\(\lambda\sum \theta^2\)\(J\)训练,但使用不带的去计算三种err

算法不如意,debug:
1)调处J关于iter图像
2)增training set

算法调整:
1)增/减featrue,增加polynomial项
2)调参如\(\alpha,\lambda\)
3)增training set

学习相关

原文:https://www.cnblogs.com/acha/p/11061633.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!