最近在研究一个新课题-Text Detection,正在读论文中。。。
1、Zhang Z, Zhang C, Shen W, et al. Multi-Oriented Text Detection with Fully Convolutional Networks[J]. arXiv preprint arXiv:1604.04018, 2016.
这篇文章将局部和全局信息结合,使用了一种coarse-to-fine的方法来定位自然场景中的文本。首先,使用了全卷积的神经网络来训练和预测文字区域的显著图;然后,结合显著图和文字元素来估计文字所在的直线;最后,另一个全卷积模型的分类器用来估计每个字符的中心,从而去掉误检区域。这个系统能够处理不同方向、语言、字体的文本检测,在MSRA-TD500, ICDAR2015和ICDAR2013的评测集上都取得了state-of-the-art的结果。
PS:这篇文章被CVPR 2016收录,在valse 2016会议中见过了作者,也讨论了一些问题,帮我普及了文本检测的基本知识。
2、TextProposals: a Text-specific Selective Search Algorithm for Word Spotting in the Wild.
这篇文章针对文本的特殊属性,将object proposal 的方法用在了文本检测中,形成了text-proposal。
text-proposal也是基于联通区域的组合,但又与之前的方法有所不同:初始化的区域并不对应单个字符,也不需要知道里面的字符数。
代码见:https://github.com/lluisgomez/TextProposals
3、Chen H, Tsai S S, Schroth G, et al. Robust text detection in natural images with edge-enhanced maximally stable extremal regions[C]//Image Processing (ICIP), 2011 18th IEEE International Conference on. IEEE, 2011: 2609-2612.
作者提出了一种叫做最大稳定极值区域(Maximally Stable Extremal Regions,MSER)作为文本候选,再通过几何和笔划宽度信息滤掉非本文区域, 剩余的文本信息形成文本直线,最终可被切分为单个文字。
【论文笔记】Text-Detection_简略版_201604
原文:http://blog.csdn.net/shaoxiaohu1/article/details/51251084