基于空频动态融合与多路径依赖感知的图像字幕生成

  • 打印
  • 收藏
收藏成功


打开文本图片集

中图分类号:TP391.4 文献标识码:A文章编号:2095-1302(2026)06-0134-07

0引言

自动图像字幕是一个具有复杂性的关键研究问题,吸引了大量的工作,广泛应用于各个领域,如人机交互[1、医学图像字幕和处方[2、交通数据分析、工业质量控制,特别是视障人士的辅助技术[3]。随着深度学习技术的发展,该领域发生了革命性的转变[4],推动先进方法的出现和性能的提升。(剩余9767字)

目录
monitor
客服机器人