基于大模型的高效遥感图像描述算法研究

  • 打印
  • 收藏
收藏成功


打开文本图片集

一、引言

大规模语言模型(LLM)在自然语言理解方面表现出色,促使研究者们考虑将其强大的理解能力扩展到图像领域。目前,已有多种多模态大模型能够有效地处理自然语言和自然图像,但在遥感图像的理解上仍存在一定的不足。因此,本工作旨在通过对现有多模态大模型进行有监督微调,提升其在遥感图像理解方面的能力。

典型的多模态大模型(MLLM)由三个主要部分构成:模态编码器、中间模态连接器和预训练的大语言模型(LLM)。(剩余3512字)

目录
monitor
客服机器人