声明:每人都有自己的理解,动手实践才能对细节更加理解!
一.算法理解
省略。。。。。。。。。。。。。。。。。。
二.训练及源码理解
首先配置:
在./lib/utils文件下....运行python setup.py build_ext --inplace
。。。。
(1)数据准备
net.create_architecture(sess, "TRAIN", self.imdb.num_classes, tag=‘default‘)
rois, cls_prob, bbox_pred = self.build_network(sess, training) rois为roi pooling层得到的框,cls_prob分类得分,bbox_pred框预测
net = self.build_head(is_training) vgg16卷积层提取特征,图片缩小16倍
rpn_cls_prob, rpn_bbox_pred, rpn_cls_score, rpn_cls_score_reshape = self.build_rpn(net, is_training, initializer) rpn网络(anchor生成与原图对应坐标),分类得分,候选框偏移等
rois = self.build_proposals(is_training, rpn_cls_prob, rpn_bbox_pred, rpn_cls_score) 通过超出图片区域,nms等筛选出合适的rois
cls_score, cls_prob, bbox_pred = self.build_predictions(net, rois, is_training, initializer, initializer_bbox) roi pooling,全连接预测等
原文:https://www.cnblogs.com/lzq116/p/12106552.html