文档详情

基于多模态特征交互的医学视觉问答方法研究与实现.pdf

发布:2025-02-20约11.75万字共74页下载文档
文本预览下载声明

基于多模态特征交互的医学视觉问答方法研究与实现摘要

基于多模态特征交互的医学视觉问答方法研究与实现

摘要

视觉问答是计算机视觉与自然语言相结合的交叉模态研究,医学视觉问答是将

视觉问答应用于医学的研究任务,为医生或研究人员提供医学图像的智能理解,在

影像诊断、病理诊断和预测性分析等多个领域提供辅助。现有多数医学视觉问答方

法仅能挖掘图像和文本浅层信息,忽略了深层多模态特征交互,限制了模型对多模

显示全部
相似文档