首页 > 其他 > 详细

pipeline结合GridSearchCV的一点小介绍

时间:2018-01-15 10:20:01      阅读:335      评论:0      收藏:0      [点我收藏+]
 1     clf = tree.DecisionTreeClassifier()
 2 
 3     ‘‘‘
 4  5     GridSearchCV search the best params
 6     ‘‘‘
 7     pipeline = Pipeline([(tree, clf), ("svm", svm)])
 8    
 9    
10     11     param_test = dict(tree__min_samples_leaf=range(5, 16, 2), tree__criterion=["gini","entropy"],svm__C=[0.1, 1, 10])
12     gsearch2 = GridSearchCV(pipeline,param_grid=param_test, scoring="accuracy", n_jobs=2, cv=5)
13     gsearch2.fit(np.array(x_train), np.array(y_train))
14     print(gsearch2.best_estimator_)
pipeline 联合estimator,使其使用一个fit,简化代码。

命名规则:
pipeline = Pipeline([(‘tree‘, clf), ("svm", svm)])
param_test = dict(tree__min_samples_leaf=range(5, 16, 2), tree__criterion=["gini","entropy"],svm__C=[0.1, 1, 10])

tree‘(自己设定的名称)通过“__”连接estimator的参数(min_samples_leaf),range代表取值范围。

例如,min_samples_leaf为决策树里面的一个参数设置,tree.DecisionTreeClassifier(min_samples_leaf=?)

pipeline的流程在次不做介绍。


 

pipeline结合GridSearchCV的一点小介绍

原文:https://www.cnblogs.com/shizhenqiang/p/8286730.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!