基于过程神经元的语音情感识别的中期报告.docx
文本预览下载声明
基于过程神经元的语音情感识别的中期报告
该项目旨在应用过程神经元模型以识别语音情感。在前期的研究和实验中,我们已经完成了以下工作:
1. 数据集获取和处理:我们使用的是The Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS)数据集,该数据集包含来自24位演员的非自然语音读音和歌曲录音,每位演员录制了8种不同情感状态的语音,共计1440条记录。
2. 特征提取:我们使用了Python中的librosa库来提取每个录音文件的频谱特征,并将特征矩阵存储为CSV文件以便训练和测试。
3. 过程神经元模型:我们基于Python中的Keras框架搭建了过程神经元模型。该模型包含多个过程神经元层,每层的输出作为下一层的输入,并通过自适应学习算法进行训练和优化。
目前,我们已经进行了初步的实验,使用50%的RAVDESS数据集作为训练集,50%的数据集作为测试集。实验结果显示过程神经元模型能够在一定程度上识别语音情感。我们将继续优化和扩展该模型,以提高准确性和推广应用。
显示全部