数据运用:注意对数据先进行random_shuffle(如果数据有一定顺序,下述划分会导致数据范围不全面)
1)数据7:3划分
train err/ test err
2)数据6:2:2划分
train err/ validation err/ test err
第二部用与多种模型/算法之间进行比较,比较后可以选出较优算法
但不能用这一步的误差来反映其预测误差
因为在这步相当于额外训练了一个参数(如选哪个算法,最高次项几次这种)(隐含了调整参数选择最小J的步骤)
所以还得再用test进行误差预计。(这里第二步筛选出的较劣算法不需要test)
注意当使用regularization时,使用带\(\lambda\sum \theta^2\)的\(J\)训练,但使用不带的去计算三种err
算法不如意,debug:
1)调处J关于iter图像
2)增training set
算法调整:
1)增/减featrue,增加polynomial项
2)调参如\(\alpha,\lambda\)
3)增training set
原文:https://www.cnblogs.com/acha/p/11061633.html