【自然场景文本检测】PSENet: Shape Robust Text Detection with Progressive Scale Expansion Network

github:https://github.com/whai362/PSENet

论文:https://arxiv.org/abs/1806.02559

 

 主要思想:

网络主要学习,Sn,Sn-1,.......,S1, 其中Sn占文字区域100%, Sn-1占文字区域90%,...........S1占文字区域50%

标签可以利用clipper来实现(pip install pyclipper)

后期处理:先求联通区域,即很多个S1,再利用S1作为文字区域核在S2中进行膨胀,依次进行,最后到Sn

例如:当n=4,Sn的预测可以如下表示

F_score = slim.conv2d(F, 4, 1, activation_fn=tf.nn.sigmoid, normalizer_fn=None)

 

相关文章