在具体的机器学习实践中,发现碰到了很多问题,这些问题单凭不断实验已经无法解决了,必须要从理论上提高认识水平,来进一步指导自己的研究。具体的问题有下面这些。
(1)针对具体问题,是选择特征工程 + 机器学习(ML)方法还是采用端到端的深度学习(DL)方法?
(1.1)问题本身是否适合用深度学习/机器学习,通常认为深度学习模型复杂度高,需要数据量大,可解释性差,但是泛化能力好。而机器学习模型复杂度相对较低,所需数据量小,可解释性好,泛化能力一般比深度学习要差一些。
(1.2)如果采用机器学习,考虑自己提取特征的话,需要调研文献,看看学术界针对具体问题提取了哪些特征,这些特征是否容易泛化等。
(2)如何评价(evaluation)模型的效果?
(2.1)训练集与测试集的划分;
(2.2)其他指标:准确率,召回率等,分别是什么意义?能够具备说服能力?
(3)如果模型的效果不好,要怎样改进?
(3.1)如果模型出现欠拟合(underfitting)的情况,应该怎么办?
(3.2)如果模型出现过拟合(overfitting)的情况,应该怎么办?
(4)细节问题:梯度下降法,正则化方法等等
2 梯度下降:代价函数(cost function)和等高线图(contour line)
(2.1)通过人工进行特征选择,达到减少变量的目的;
(2.2)通过正则化方法,使权重参数具备更强的泛化(generalize)能力。
图中是一个不好的例子,这个例子展示了正则化参数太大会导致的不好的结果,即欠拟合。
(1)训练集:测试集 = 7:3, 随机选择会更好; 采用misclassification error来评价模型的准确率
原文:https://www.cnblogs.com/ghjnwk/p/11522305.html