文档详情

基于深度学习的道路场景语义分割技术研究.pdf

发布:2025-05-25约6.11万字共57页下载文档
文本预览下载声明

基于深度学习的道路场景语义分割技术研究

摘要

在计算机视觉领域上,语义分割实现了图像像素级的分类。它能够将一张图片或

者视频,按照类别的异同,将图像分为多个块。随着图像语义分割技术的不断发展,

激发了很多学者的研究热情。同时语义分割技术在很多的领域都有着广泛的应用,比

如医学影像、遥感图像、自动驾驶等方面。对于自动驾驶而言,对于道路场景的语义

分割技术就变得尤为重要。但现有的道路场景图像的语义分割技术的输出效果存在着

预测精度不高、训练速度慢等问题。所以本文分析以往的网络结构特点,提出了改进

技术在道路场景下的应用。

(1)针对传统U-Net模型在进行道路场景语义分割存在精确度较低的问题,本文

提出了基于DeepLabV3+和U-Net融合的Du-Net网络,对道路场景进行语义分割。Du-

Net是由第一阶段的DeepLabV3+网络结构和第二阶段基于ECA通道注意力模块的U-

Net所构成。将分割图像输入到DeepLabV3+后的输出作为第二阶段基于ECA通道注意

力模块的U-Net的输入,这样使得道路边缘图像会更加细化。在道路场景的应用上,使

图像的道路边缘分割的精确度有了明显提升。

(2)为减少复杂背景对道路图像语义分割的影响,在第二阶段U-Net的编码部分

的三次卷积与池化操作之间嵌入了ECA通道注意力机制,其在编码阶段更好的提升了

特征通道的调节能力,在一定程度上提高了分割精度。

(3)道路场景语义分割的分割速度,是自动驾驶技术不可忽视的考量因素。本文

在第一阶段的DeepLabV3+的骨干网络使用的轻量级的MobileNetV2,并且在第二阶段

的U-Net网络结构的编码阶段采用的四次卷积和池化操作改为了三次,解码部分采用的

四次上采样和卷积操作改为了三次,以提升语义分割的速度,为Du-Net语义分割技术

在自动驾驶的部署上提供了可能性。

最后使用Labelme标注工具对数据集进行标注,通过实验对比基于Du-Net和其他

网络结构的道路语义分割效果,结果显示:基于Du-Net的道路语义分割精确度、准确

度、召回率以及F1的值都有一定的提升。

关键词:深度学习;道路场景;DeepLabV3+;U-Net;语义分割;

基于深度学习的道路场景语义分割技术研究

Abstract

Inthefieldofcomputervision,semanticsegmentationenablestheclassificationofimages

atthepixellevel.Itisabletotakeapictureorvideoanddividetheimageintomultipleblocks

accordingtothesimilaritiesanddifferencesofthecategories.Thedevelopmentofsemantic

imagesegmentationtechniqueshasinspiredmanyscholarstoresearch.Atthesametime

semanticsegmentationtechnologyhasawiderangeofapplicationsinmanyfields,suchas

medicalimaging,remotesensingimages,autonomousdrivingandsoon.Forautonomous

driving,thesemanticsegmentationofroadsceneshasbecomeparticularlyimportant.However,

theoutputeffectofexistingsemanticsegmentationtechniquesforroadsceneshasproblems

suchaslowpredictionaccuracy

显示全部
相似文档