首页 > 其他 > 详细

【自学笔记】0基础自学机器学习 (第三天)

时间:2018-12-28 23:31:53      阅读:249      评论:0      收藏:0      [点我收藏+]

 

“数据”是机器学习的基础。

 

技术分享图片

 

初学机器学习时,我们通常处理的数据格式通常是以下 的形式:

 

属性(特征)

几室

几厅

供暖(0地热 1暖气)

...

临街(1临街 2不临街)

楼层

房价

样本1

3

2

1

...

1

5

300000

...

...

...

...

...

...

...

...

样本N

4

1

0

...

0

2

400000

 

关于房价评估预测,假设该表反应为一个我们实地采集的数据,我们要从中 “机器学习” 之前首先要学习几个概念: 

 

样本

    上表中一横行为一个样本,即我们所采集到的一所房子的相关信息。

特征

    上表中一纵列为一个属性(或特征),即一个房子的某些方面,如几室几厅。人们在购买房子时,几室几厅直接影响房子价格,所以我们要采集他,当然一些数据有一些非直观的影响,如当地工业程度对房价的影响。

标签

    上表中最后一列为标签,即我们想要预测的内容。如该例中,我们想预测房价

数据集

    所有样本的集合

 

(未完持续)

 

 

 

 

 

 

【自学笔记】0基础自学机器学习 (第三天)

原文:https://www.cnblogs.com/labixiaohei/p/10193318.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!