pipeline结合GridSearchCV的一点小介绍

时间：2018-01-15 10:20:01 阅读：339 评论：0 收藏：0 [点我收藏+]

 1     clf = tree.DecisionTreeClassifier()
 2 
 3     ‘‘‘
 4  5     GridSearchCV search the best params
 6     ‘‘‘
 7     pipeline = Pipeline([(‘tree‘, clf), ("svm", svm)])
 8    
 9    
10     11     param_test = dict(tree__min_samples_leaf=range(5, 16, 2), tree__criterion=["gini","entropy"]，svm__C=[0.1, 1, 10])
12     gsearch2 = GridSearchCV(pipeline,param_grid=param_test, scoring="accuracy", n_jobs=2, cv=5)
13     gsearch2.fit(np.array(x_train), np.array(y_train))
14     print(gsearch2.best_estimator_)

pipeline 联合estimator，使其使用一个fit，简化代码。

命名规则：

pipeline = Pipeline([(‘tree‘, clf), ("svm", svm)])

param_test = dict(tree__min_samples_leaf=range(5, 16, 2), tree__criterion=["gini","entropy"]，svm__C=[0.1, 1, 10])

‘tree‘(自己设定的名称)通过“__”连接estimator的参数（min_samples_leaf），range代表取值范围。


例如，min_samples_leaf为决策树里面的一个参数设置，tree.DecisionTreeClassifier(min_samples_leaf=？)


pipeline的流程在次不做介绍。

pipeline结合GridSearchCV的一点小介绍

原文：https://www.cnblogs.com/shizhenqiang/p/8286730.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)