您好!欢迎访问云南省人工智能重点实验室
科研成果
当前位置:首页>科研成果>论文列表

论文列表



 论   文  作   者: 王红斌,张志亮,李华锋*.
 论   文  名   称: 基于堆叠交叉注意力的图像文本跨模态匹配方法
 论文发表刊物: 信号处理(2017)
 论文发表时间: 2022
 卷   号  页   码:
 论   文  描   述:
 收   录  情   况:
  论   文  摘   要:
        图像文本跨模态匹配是计算机视觉与自然语言处理交叉领域的一项重要任务,然而传统的图像文本跨模态匹配方法要么只考虑到全局图像与全局文本匹配,要么只考虑到局部图像与局部文本匹配,无法全面有效的考虑局部和全局信息,导致提取出来的特征信息不完善。或者只是简单的对全局图像与全局文本特征进行提取,局部细节信息无法凸显,导致全局特征无法充分表达其全局语义信息。针对该问题,本文提出一种基于堆叠交叉注意力的图像文本跨模态匹配方法。该方法在考虑局部图像与局部文本匹配的同时,将堆看交叉注意力引进全局图像与全局文本匹配,通过注意力来进一步挖掘全局特征信息,让全局图像与全局文本特征得到优化。从而提升图像文本跨模态检索的效果。在Fickr30K和MS-COCO两个公共数据集上进行了实验验证,模型的总体性能 R@sum(Recal@sum)较baseline(SCAN)分别提高了3.9%与3.7%。该模型与SCAN模型相比,R@sum表现较好。由此表明本文提出方法在图像文本跨模态检索任务上的有效性,并且与现有方法相比具有一定的优越性。
点击此处下载文章内容