首页 > 编程语言 > 详细

Python大数据:信用卡逾期分析

时间:2018-03-20 22:04:13      阅读:484      评论:0      收藏:0      [点我收藏+]
# -*- coding:utf-8 -*-
# 数据集成

import csv
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt  

#客户信息
basicInfo = pd.DataFrame.from_csv(datas/basicInfo_train.csv, header=0, sep=,, index_col=0, parse_dates=True, encoding=None, tupleize_cols=False, infer_datetime_format=False)
#历史还款记录
historyInfo = pd.DataFrame.from_csv(datas/history_train.csv, header=0, sep=,, index_col=0, parse_dates=True, encoding=None, tupleize_cols=False, infer_datetime_format=False)
#历史逾期情况
defaultInfo = pd.DataFrame.from_csv(datas/default_train.csv, header=0, sep=,, index_col=0, parse_dates=True, encoding=None, tupleize_cols=False, infer_datetime_format=False)
combineInfo = pd.concat([basicInfo,historyInfo,defaultInfo],axis=1)
#查看前10条数据
combineInfo[:10]
#性别分析
gender = combineInfo.groupby(SEX)[Default].mean().reset_index()
plt.xticks((0,1),(u"Male",u"Female"))
plt.xlabel(u"Gender")
plt.ylabel(u"Counts")
plt.bar(gender.SEX,gender.Default,0.1,color=green)
plt.show()
#教育程度与default值的相关性分析
edu = combineInfo.groupby(EDUCATION)[Default].mean()
plt.plot(edu)
plt.show()
#婚姻状况分析
marriage = combineInfo.groupby(MARRIAGE)[Default].mean().reset_index()
plt.bar(marriage.MARRIAGE,marriage.Default,0.5,color=green)
plt.show()

 

Python大数据:信用卡逾期分析

原文:https://www.cnblogs.com/blackice/p/8613012.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!