首页 > 其他 > 详细

CV2——学习笔记-图像分类

时间:2019-08-16 19:32:32      阅读:235      评论:0      收藏:0      [点我收藏+]

1.图像分类 • 2.神经网络原理 • 1.卷积神经网络介绍 • 2.利用caffe搭建深度网络做图像分类

挑战:光照变化+形变。类内变化。

技术分享图片

标签、预测函数,泛化能力。

如何提高泛化能力?需要用图像特征来描述图像。

技术分享图片

 技术分享图片

颜色特征:直方图。

形状特征:PCA降维。

局部特征细节、纹理。

技术分享图片

SIFT特征:局部,4*4区域的16格内,每个格子内算8维梯度,拼成128维特征。用于检测匹配。

HOG:检测目标形状。用于检测、跟踪。

LBP:对区域编码,适合处理人脸,对称的均匀的。可以有效捕捉响应。

Harr:滤波器。边缘。

VLFeat - Home http://www.vlfeat.org/

 

SVM分类:

技术分享图片

技术分享图片

最大化间隔:

技术分享图片

CNN特征:大量图像中学习出来的特征。Imagenet1000类。

神经网络做图像分类:

技术分享图片

CS231n Convolutional Neural Networks for Visual Recognition http://cs231n.github.io/convolutional-networks/

神经网络搭建:

技术分享图片

神经网络的基本单元:神经元

技术分享图片

激励函数:

技术分享图片

卷积层:

技术分享图片

卷积滤波的计算:

Stride = 1, pad =2,

输出的尺寸=(输入尺寸+2*pad-kernel_size)/stride + 1

技术分享图片

卷积层可视化:

卷积提取的特征为什么有效果。传统的只是表层特征,深层特征无法获得。技术分享图片

池化层(pooling layer):平均池化、最大池化。特征亚采样。

特征表达更加紧凑,同时具有位移不变性。

技术分享图片

全连接层:全连接权重是W。

技术分享图片

损失函数:

• SIGMOID_CROSS_ENTROPY_LOSS

• SOFTMAX_LOSS

• EUCLIDEAN_LOSS

• Contrastive loss

• Triplet Loss

不同的task对应着不同的loss

交叉熵损失函数(SIGMOID_CROSS_ENTROPY_LOSS):

Sigmoid函数把负无穷到正无穷压缩到-1~+1。应用于二分类问题。

 技术分享图片

 

Softmax 损失函数(SOFTMAX_LOSS):多分类问题

技术分享图片

欧式距离损失函数(EUCLIDEAN_LOSS):

技术分享图片

对比损失函数(Contrastive loss):用于图像分类、检索。

训练 Siamese 网络,用来计算两个图像之间的相似度,image match。输入两张图。

技术分享图片

Triplet loss:三元,输入三张图。

 技术分享图片

http://blog.csdn.net/tangwei2014/article/details/46788025

训练网络、测试

技术分享图片

技术分享图片

http://caffe.berkeleyvision.org/tutorial/forward_backward.html

 

Caffe 实现一个图像分类任务 • 安装教程 :

• Windows环境:http://www.cnblogs.com/trantor/p/4570097.html

• Linux环境:http://www.cnblogs.com/denny402/p/5067265.html

CV2——学习笔记-图像分类

原文:https://www.cnblogs.com/wxl845235800/p/11365443.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!