数据挖掘步骤: 数据准备 数据探索 模型建立 模型评估 模型部署
数据挖掘方法分类: 关联 回归 分类 聚类 预测 诊断
数据准备: 数据收集 数据质量分析 数据预处理
数据探索: 数据可视化 数据降维 数据统计 衍生变量
关联方法: Apriori FP-Growth
回归方法: 一元回归 多元回归 逐步回归 Logistic回归
分类方法: 朴素贝叶斯 SVM支持向量机 神经网络 决策树 KNN近邻 逻辑斯梯模型 分类分析 判别分析
聚类方法: K-Means聚类 层次聚类 神经网络 模糊C均值 高斯混合聚类
预测方法: 灰色预测 马尔科夫预测
诊断方法:
离群点监测: 基于统计 基于距离 基于密度 基于聚类
时间序列方法: 平稳时间序列方法 季节指数 时间序列模型
智能优化方法: 遗传算法 模拟退火算法 蚁群算法
机器学习:
数据挖掘 = 机器学习 + 数据仓库
模式识别 = 机器学习
统计学习 ≈ 机器学习
计算机视觉 = 图像处理 + 机器学习
语音识别 = 语音处理 + 机器学习
自然语言处理 = 文本处理 + 机器学习
机器学习方法:监督学习、无监督学习:
监督学习:
回归算法 神经网络 ANN 支持向量机 SVM
无监督学习: 聚类算法 降维算法
其他学习: 推荐算法
大数据分析方法:
大数据,小分析:OLAP,多维分析思想
大数据,大分析:数据挖掘与机器学习
流式分析:事件驱动架构
查询分析:NoSql分析
机器学习的子类---》深度学习
机器学习的父类---》人工智能
原文:http://www.cnblogs.com/defineconst/p/5187336.html