首页 > 其他 > 详细

2、特征获取

时间:2019-08-17 15:19:46      阅读:86      评论:0      收藏:0      [点我收藏+]

互联网公司里大部分复杂的模型都是极少数的数据科学家在做,大多数工程师们做的事情基本是在数据仓库里搬砖,不断地数据清洗,再一个是分析业务不断地找特征。 

特征的来源有两部分,(1)业务已经整理好的各种特征数据,我们去寻找适合我们问题需要的特征;(2)我们从业务特征中寻找高级的数据特征。

对于业务已经整理好的各种特征,我们如何去找到适合我们问题需要的特征呢?这就需要我们找到该领域懂业务的专家,让他们给一些意见,如果对于一个药品疗效的分类问题,我们问这些专家,哪些因素会对药物的疗效产生影响,影响大的影响小的都要,这些特征就是我们的第一候选特征集。

这个特征集可能会很大,需要我们来进行降维、筛选等等,也就是我们的数据清理阶段要做的事情。

 

2、特征获取

原文:https://www.cnblogs.com/pacino12134/p/11368641.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!