从视觉到文本:图像描述生成的研究进展综述-文章-世纪中文出版社

从视觉到文本:图像描述生成的研究进展综述

DOI: ,PDF 下载: 30 浏览: 428

作者: 魏忠钰1；范智昊1；王瑞泽2；承怡菁1；赵王榕1；黄萱菁3；

作者单位: 1.复旦大学大数据学院；2.复旦大学工程与应用技术研究院；3.复旦大学计算机科学与技术学院；

关键词: 图像描述生成；跨模态特征对齐；文献综述；

摘要:

近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像描述生成模型的性能评价和图像描述生成模型的主要发展过程四个方面对相关文献进行介绍和总结。最后,该文给出了几个未来的重点研究方向,包括跨视觉和语言模态的特征对齐、自动化评价指标的设计以及多样化图像描述生成。

投稿

学术共建

	在线客服
	客服电话：400-188-5008
	客服邮箱：service@ccnpub.com
	投诉举报：feedback@ccnpub.com