• 打印
  • 收藏
收藏成功
分享

多网络和多头注意力融合的场景文本识别算法


打开文本图片集

关键词:场景文本识别;多网络融合;多头注意力机制;特征提取

0 引言

如今大量的文字/文本内容被保存在图片或视频中。因此需要运用计算机技术检测和识别图片或视频中的文字/文本内容。例如证件识别[1]、车牌识别[2]以及视频检索[3,4]中,都需检测其中的文字/文本内容。

自然场景中的文本大都以序列的形式出现,可以将其理解为序列识别问题。(剩余4053字)

网站仅支持在线阅读(不支持PDF下载),如需保存文章,可以选择【打印】保存。

畅销排行榜
monitor