Python_Data_Analysis_ML_17_Seaborn

时间：2018-11-29 20:37:51 阅读：224 评论：0 收藏：0 [点我收藏+]

斯坦福机器学习笔记

https://yoyoyohamapi.gitbooks.io/mit-ml/content/

在机器学习(Machine learning)领域，主要有三类不同的学习方法：监督学习(Supervised learning)、非监督学习(Unsupervised learning)、半监督学习(Semi-supervised learning)。

监督学习：通过已有的一部分输入数据与输出数据之间的对应关系，生成一个函数，将输入映射到合适的输出，例如回归分析和分类。如果我们想要预测的是离散值，例如“好瓜”“坏瓜”，此类学习任务称为“分类”；如果想要预测的是连续值，例如西瓜成熟度0.95、0.37，此类学习任务称为“回归”。学得模型后，使用其进行预测的过程称为“测试”，被预测的样本成为“测试样本”。例如在学得f后，对测试例x，可得到其预测标记y=f(x)。目前最广泛被使用的分类器有人工神经网络、支持向量机、最近邻居法、高斯混合模型、朴素贝叶斯方法、决策树和径向基函数分类。
非监督学习：直接对输入数据集进行建模，例如聚类。我们还可以对西瓜做“聚类”，即将训练集中的西瓜分为若干组，每组称为一个“簇”；这些自动形成的簇可能对应一些潜在的概念划分，例如“浅色瓜”“深色瓜”，甚至“本地瓜”“外地瓜”。这样的学习过程有助于我们了解数据内在的规律，能为更深入地分析数据简历基础。需说明的是，在聚类学习中，“浅色瓜”“本地瓜”这样的概念我们事先是不知道的，而且学习过程中使用的训练样本通常不拥有标记信息。
半监督学习：综合利用有类标的数据和没有类标的数据，来生成合适的分类函数。
区别：监督学习其实就是我们对输入样本经过模型训练后有明确的预期输出，非监督学习就是我们对输入样本经过模型训练后得到什么输出完全没有预期。

For details：https://blog.csdn.net/u011067360/article/details/24735415

线性回归

预测

首先，我们明确几个常用的数学符号：

特征（feature）： $x_{i}$
特征向量（输入）： $x$
输出向量： $y$
假设（hypothesis）：也称为预测函数，比如一个线性预测函数是：

h θ (x) = θ 0 + θ 1 x 1 + θ 2 x 2 + ? + θ n x n = θ T x

上面的表达式也称之为回归方程（regression equation）， $θ$

例子：申请贷款时，工资和年龄为指标，即特征x1和x2。用这两个指标去预测一下银行给你贷款多少钱（回归分析）。但这两个指标的影响程度是不一样的，所以θ₁和θ₂

技术分享图片

Python_Data_Analysis_ML_17_Seaborn

原文：https://www.cnblogs.com/tlfox2006/p/10040657.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)