冲刺课
数值处理问题
插值拟合
主要用于对数据的补全和基本的趋势分析
小波分析、聚类分析(高斯混合聚合、K-均值聚类等等)
主要用于诊断数据异常值并进行剔除
主要成分分析、线性判别分析、局部保留投影等
主要用于多维数据的降维处理,减少数据冗余
均值、方差分析、协方差分析等统计方法
主要用于数据的截取或者特征选择
关联与因果
特征:多维数据、有自变量和因变量、输入输出关系
注意:1、5用的比较多;拟合也可以做因果分析
分类与判别
1距离聚类(系统聚类:开均值、高斯混合)常用
2关联性聚类(常用)
3层次聚类(数据没有基准)
4密度聚类(数据没有基准)
5其他聚类
6贝叶斯判别(统计判别法)
7费舍尔判别(训练的样本比较少)
8模糊识别(分好类的数据点比较少)
9SOM神经网络聚类
评价与决策
模糊综合评价:评价一个对象优良中差等层次评价,评价一个学校等,不能排序(数据非定量化)
主层次分析法:评价多个对象的水平并排序,指标间关联性很强
层次分析法:做决策,通过指标,综合考虑做决定(low、主观性评价)
数据包络(DEA)分析法:优化问题,对各省发展状况进行评判
rank和比综合评价法:评价各个对象并排序,指标间关联性不强
神经网络评价:适用于多指标非线性关系明确的评价(重要、基本上都能用、适用于指标很多或者一点没有需要自己构建很多指标的情况)
优劣解距离法(TOPSIS法)
投影寻踪综合评价法:融合多种算法,比如遗传算法、最优化理论
方差分析、协方差分析等:
方差分析:看几类数据之间有无差异,差异性影响,例如:元素对麦子的产量无影响,差异量的多少;
协方差分析:有几个因素,我们只考虑一个因素对问题的影响,忽略其他因素,但注意初始数据的量纲及初始情况。
预测与预报问题(5种、一定要定位好题型)
小样本的内部预测:插值,基本不考
大样本的内部预测:数据处理问题、不考
小样本的未来预测:小于50个、很容易考
大样本的随机元素或周期特征的未来预测:数据量很大,随机因素很多
大样本的未来预测:数据量大、没说随机
1灰色预测模型(必须掌握、小样本的未来预测)
满足两个条件可用:
a数据样本点个数少,6~15个
b数据呈现指数或者曲线的形式
微分方程预测(备用、少用)
无法直接找到原始数据之间的关系,
但可以找到原始数据变化速度之间的关系,
通过公式(差分等)推导转化为原始数据之间的关系
回归分析预测(必须掌握,小样本和大样本的内部预测,小样本未来预测)
求一个因变量与若干自变量之间的关系,若自变量变化之后,求因变量怎么变化
样本点的个数要求:
a自变量至今协方差比较小,最好趋于零,自变量间关系小(变量之间最好独立)
b样本点个数n大于3k+1,k为变量的个数
c因变量要符合正态分布
马尔科夫预测(备用、大样本的随机元素或周期特征的未来预测)
就是DP、目标优化只与现在有关
一个序列之间没有信息的传递,前后没有联系,数据与数据之间随机性强,相互不影响;
今天的温度和昨天、后天没有联系,预测后天温度高、中、低的概率,只能得到概率
时间序列预测(必须掌握、周期随机)
与马尔科夫预测互补,至少2个点需要信息的传递,ARMA模型,周期模型,季节模型等
小波分析预测(大样本未来预测)
神经网络预测(大样本未来预测)
混沌序列预测(大样本未来预测)
优化与控制
例子:生产线、运输、选址问题
线性规划、整数规划、0-1规划(有约束、确定目标)
非线性规划与智能优化算法
多目标规划和目标规划(柔性约束,目标含糊,超过)
动态规划
图论、网络优化(多因素交错复杂)
排队论与计算机仿真
模糊规划(范围约束)
灰色规划(难)
智能算法(任何关于极大值和极小值的问题,变相的优化):
1遗传算法:可以用于修正bp神经网络的loss函数;
2模拟退火:有点像强化学习,不一样的是这里是概率
3粒子群算法:
冲刺期
1.美赛问题搞懂,先自行了解匹配题型(训练对题型的分类理解)
2.算法形成体系,知道那些算法分别能解决哪些问题,将算法对应文档整理(算法相关的原理性文档)好备用。
3.编程入门,程序形成库,明白如何用,到时改参数即可
4.多看优秀论文,中文的,找找写作的感觉。
5.提前找好比赛场地,水电暖电都要考虑到
6.团队默契,事先沟通好联络方式和分工,三部分,建模,写作,编程。
7.实现联系英语大牛,让他帮忙翻译摘要
8.锻炼身体,不要生病
比赛的断定:举办单位;
MCM要求的数学能力比较高,ICM为交叉学科,F为热点问题,无套路。
常用3d建模软件
大数据处理技术(数据清洗、降维分析、建立关系等)
查资料是找思路的一个重要途径
看题目思考大致思路
选择、优化
例子:
最好的水利用率
烤箱最佳容纳及受热
棒球的最佳受力点
最佳登机方案
服务系统最优排队
工料最优切割
发电机组最优组合
最优运输路劲
要素:
决策变量;目标函数;约束条件;
概念:
可行解、可行域、最优解
评价、分类、排序
服装样式评判
数独游戏难度分类
各国医疗系统服务质量排序
招聘人员综合能力评价
学生知识掌握情况评价
某种疾病防治效果评价
金融系统风险评价
个人信用评价
要素:
确定多个确定的评价指标(有依据、论文;排除主观;一定不能强行)
层次分析主观性强,神经网络非线性映射能力强,模糊均值。
评价步骤
确定目标;确定评价指标;确定权重;求单个指标评价值;求综合评价值
三种解题思路
1.找到关键词,定位题型,之后再定位算法。
2.找同类问题、弱化问题、或者强化问题,看看有没有相关的研究文献,从其中学习借鉴。
3.数学推导
原文:https://www.cnblogs.com/YiXinLiu617/p/12189962.html