基于多模态特征交互的医学视觉问答方法研究与实现.pdf
文本预览下载声明
基于多模态特征交互的医学视觉问答方法研究与实现摘要
基于多模态特征交互的医学视觉问答方法研究与实现
摘要
视觉问答是计算机视觉与自然语言相结合的交叉模态研究,医学视觉问答是将
视觉问答应用于医学的研究任务,为医生或研究人员提供医学图像的智能理解,在
影像诊断、病理诊断和预测性分析等多个领域提供辅助。现有多数医学视觉问答方
法仅能挖掘图像和文本浅层信息,忽略了深层多模态特征交互,限制了模型对多模
显示全部