NYPD提供有关数据字典的止损和风险的数据,位于此处。这些数据从2003年到2014年不等,包含450多万 的信息。包括 人的年龄,性别和种族等几个变量。
我写了一些R代码来清理并将数据编译成单个.RData文件。 这篇文章的目的只是为了让这些干净的编译数据集可供其他人与他们自己的数据集结合使用,并得出有趣/有意义的结论。
以下是一些初步(未经调整)的描述性统计数据:
数据显示了一些有趣的趋势:
关于数据的几点说明:
编码对此特别有意思,因为我从未使用过R来从网上下载ZIP文件。我复制了以下代码的这部分内容。它从2013年到2014年每年生成一个数据集。
大数据部落 -中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务
统计分析和数据挖掘咨询服务:y0.cn/teradat(咨询服务请联系官网客服)
【服务场景】
科研项目; 公司项目外包;线上线下一对一培训;数据采集;学术研究;报告撰写;市场调查。
【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询服务
原文:https://www.cnblogs.com/tecdat/p/10751610.html