首页 > 其他 > 详细

数据的特征抽取

时间:2019-10-08 20:31:23      阅读:92      评论:0      收藏:0      [点我收藏+]

机器学习库scikit-learn,进行特征抽取

 

特征工程:

特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的模型准确性

 

特征工程意义:

直接影响模型的预测结果

 

字典特征抽取:

技术分享图片

 

技术分享图片

 

 技术分享图片

 1 from sklearn.feature_extraction import DictVectorizer
 2 
 3 
 4 
 5 def dict_vec():
 6     """
 7     字典数据,特征抽取
 8     :return: None
 9     """
10     # 实例化
11     d = DictVectorizer(sparse=False)  # 有无sparse参数返回的数据类型不一样
12     # 调用 fit_transform
13     data = d.fit_transform([{city: 北京, temperature: 100}, {city: 上海, temperature: 60}, {city: 深圳, temperature: 80}])
14     print(d.get_feature_names())
15     print(data)
16     return None
17 
18 # 字典数据抽取:把字典中一些类别数据,分别进行转换成特征
19 if __name__ == __main__:
20     dict_vec()

输出结果:

  [‘city=上海‘, ‘city=北京‘, ‘city=深圳‘, ‘temperature‘]
  [[ 0. 1. 0. 100.]
  [ 1. 0. 0. 60.]
  [ 0. 0. 1. 80.]]

 

数据的特征抽取

原文:https://www.cnblogs.com/springionic/p/11637509.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!