7.逻辑回归实践

时间：2020-04-27 10:43:07 阅读：66 评论：0 收藏：0 [点我收藏+]

1.逻辑回归是怎么防止过拟合的？为什么正则化可以防止过拟合？（大家用自己的话介绍下）

2.用logiftic回归来进行实践操作，数据不限。

第一题：

①增加样本量。②对稀疏的数据进行正则化处理。③特征选择。④特征离散化。

过拟合时，拟合函数的系数往往非常大，需要顾忌每一个点，最终形成的拟合函数波动很大。在某些很小的区间里，函数值差异大。这就意味着函数在某些小区间里的导数值非常大，由于自变量值可大可小，所以只有系数足够大，才能保证导数值很大。而正则化是通过约束参数的范数使其不要太大，所以可以在一定程度上减少过拟合情况。

第二题：

# （1）加载load_breast_cancer数据集，并划分训练集与测试集。
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
cancer = load_breast_cancer()
x = cancer.data
y = cancer.target
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2,random_state=5)

#（2）训练模型，并计算训练数据集的评分数据和测试数据集的评分数据，以及查看测试样本中预测正确的个数。
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report
model = LogisticRegression()
model.fit(x_train, y_train)
y_pre=model.predict(x_test)
print(‘训练数据集的评分：‘,model.score(x_train, y_train))
print(‘测试数据集的评分：‘,model.score(x_test, y_test))
print(‘预测个数：‘,x_test.shape[0])
print(‘预测正确个数：‘,x_test.shape[0]*model.score(x_test,y_test))
print("召回率", classification_report(y_test, y_pre))

技术分享图片

7.逻辑回归实践

原文：https://www.cnblogs.com/seele233/p/12784722.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)