github:https://github.com/whai362/PSENet
论文:https://arxiv.org/abs/1806.02559
主要思想:
网络主要学习,Sn,Sn-1,.......,S1, 其中Sn占文字区域100%, Sn-1占文字区域90%,...........S1占文字区域50%
标签可以利用clipper来实现(pip install pyclipper)
后期处理:先求联通区域,即很多个S1,再利用S1作为文字区域核在S2中进行膨胀,依次进行,最后到Sn
例如:当n=4,Sn的预测可以如下表示
F_score = slim.conv2d(F, 4, 1, activation_fn=tf.nn.sigmoid, normalizer_fn=None)