首页 > 其他 > 详细

标准化

时间:2019-01-12 12:44:33      阅读:132      评论:0      收藏:0      [点我收藏+]

可以用StandardScaler函数进行标准化,好处是可以保存训练集中的参数(均值、方差)直接使用其对象转换测试集数据

import numpy as np
import pandas as pd
import xlrd 
from sklearn import preprocessing
from pandas import DataFrame
def standardScaler(path):
    table = xlrd.open_workbook(path).sheets()[0]#获取第一个sheet表
    row = table.nrows  # 行数
    col = table.ncols  # 列数
    datamatrix = np.zeros((row, col))#生成一个nrows行ncols列,且元素均为0的初始矩阵
    for x in range(col):
        cols = np.matrix(table.col_values(x))  # 把list转换为矩阵进行矩阵操作
        datamatrix[:, x] = cols # 按列把数据存进矩阵中
    #标准化
    scaler=preprocessing.StandardScaler().fit(datamatrix)
    return (scaler.transform(datamatrix))
    #返回的就是标准化好的矩阵了
path = rc:\Users\Liugengxin\Desktop\test.xlsx
data = standardScaler(path) #标准化好的矩阵存在了data中
DataFrame(data).to_excel(rc:\Users\Liugengxin\Desktop\test_end.xlsx)#写入test_end中

 

标准化

原文:https://www.cnblogs.com/Liu269393/p/10259128.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!