文档详情

基于深度学习的表情识别关键技术研究.pdf

发布:2025-06-12约9.16万字共68页下载文档
文本预览下载声明

成都信息工程大学硕士学位论文

基于深度学习的表情识别关键技术研究

摘要

表情识别作为图像识别领域内的一个分支工作,在一些场景下具有重要的意

义,比如驾驶场景下的疲劳监测,教学场景下的注意力监测,医疗场景下的耐受

度监测等。通过表情识别来对目标的生理心理状态进行分析,有助于医疗,教育,

安防等工作更加高效的开展。近年来随着深度学习领域技术的发展,图像识别工

作得到了极大的发展,本文分析表情识别工作现存难点,并对深度学习下的表情

识别关键技术进行了研究,主要包括以下几点:

(1)人脸表情丰富且复杂,目前的表情数据集普遍数据量不足,训练得到的

模型权重会存在一定的过拟合问题,因此考虑在数据增强方面开展一定的工作。

首先分析GANimation算法生成表情实验中存在表情部分特征点模糊问题,改进

GANimation网络中生成器中的残差块结构,同时引入内容损失以及纹理损失,

帮助生成器训练,提升生成图像的质量。通过实验验证改进后GANimation算法

生成的表情图像质量有了一定的提升,接着选用部分表情数据利用改进后

GANimation算法进行数据扩充构建EM-FER数据集用于后续的表情识别工作。

(2)结合深度学习知识,在稠密卷积神经网络DenseNet121的基础上进行研究,

提出一种融合注意力机制的多尺度稠密网络。首先,针对DenseNet121提取复杂

表情特征能力不足的问题,引入了多尺度特征提取稠密块替代其中的DenseBlock

用于提取不同尺寸的特征;其次,使用多尺度特征提取卷积块替代DenseNet121

头部的大卷积核,进一步丰富特征的提取;最后,为了从通道维度上提取到更重

要的特征,考虑结合ECA通道注意力机制来帮助提升模型性能。实验证明本章

提出的模型在FER2013,CK+,以及自建EM-FER数据集上识别准确率相比

DenseNet121分别提升了2.034%,3.031%,2.645%,与其他常用分类模型对比

也有一定优势。

(3)在以上工作的基础上,考虑到追求识别精度提升带来的模型参数较重,

效果和实用性不能兼顾的问题,选用浅层稠密卷积神经网络DenseNet40继续研

究。首先针对模型对旋转畸变的鲁棒性较差的问题,引入参数量较少的非对称卷

积块;为了进一步实现模型轻量化,使用通道剪枝算法对模型进行剪枝处理,最

FER2013CK+

终提出了基于非对称卷积的轻量化稠密网络。该模型在,,以及自

建EM-FER数据集上相比DenseNet40依然提升了2.285%%,3.457%,2.634%,

参数却只有DenseNet40的64%,融合注意力机制的多尺度稠密网络的18%,模

型在保证识别效果的同时实现了轻量化。

关键词:表情识别,深度学习,卷积神经网络,生成对抗网络

ii

成都信息工程大学硕士学位论文

ResearchonKeyTechnologiesofExpressionRecognitionBasedon

DeepLearning

ABSTRACT

Asabranchofimagerecognition,facialexpressionrecognitionhasimportant

significanceinsomescenarios,suchasfatiguemonitoringindrivingscenarios,

attentionmonitoringinteachingscenarios,andtolerancemonitoringinmedical

scenarios.Analyzingthephy

显示全部
相似文档