2、要避免陷入自己计算自己的怪圈,会导致过拟合。
3、采用一个样本的统计特征会比这个样本的本身的特征来预测效果要好。
4、要相信人类才是这个世界的最高智慧,建立模型的时候合理思考究竟是什么对预测的结果会有影响,这些影响是怎么组织起来的,这些思考是建立模型的关键。
5、合理的计算方式来自于对于原始数据合理的理解。
做统计特征需要注意的事项
原文:http://blog.51cto.com/yixianwei/2144900