参考:https://github.com/mbadry1/CS231n-2017-Summary
01.略
02.图像分类
1)KNN,k近邻算法,参考:https://blog.csdn.net/qq_35206320/article/details/81946246
步骤:计算当前点与所有已知类别点的距离,找到其中距离最近的k个,通过分类决策股则决定当前点的类别
三个基本要素:
k值选择(一般选取较小k值,然后交叉验证选取最优k值,交叉验证即将原始训练集分为k份,然后训练k次,每次拿第k份当验证集,其他k-1份当训练集)
距离度量(多采用欧氏距离或者曼哈顿距离)
分类决策规则(一般都是选择前k近中出现次数最多的类别)
需要解决的问题:样本不平衡时,可能会出现某个样本容量大的类别占大多数
解决方案:不同样本赋予不同权重
使用该算法的问题:复杂度过高,与样本数和维度有关
准确性?
原文:https://www.cnblogs.com/ytytzzz/p/11114383.html