文档详情

基于深度强化学习的任务分析方法.pdf

发布:2025-03-22约3.88万字共12页下载文档
文本预览下载声明

第36卷第7期系统仿真学报Vol.36No.7

2024年7月JournalofSystemSimulationJul.2024

基于深度强化学习的任务分析方法

龚雪,彭鹏菲,荣里*,郑雅莲²,姜俊1

(1.海军工程大学,湖北武汉430033;2.武汉大学水资源与水电工程科学国家重点实验室,湖北武汉430072)

摘要:针对任务分析中任务协同交互耦合度高、影响因素繁多等问题,提出了基于序列解耦与深

度强化学习的任务分析方法,实现了复杂约束条件下的任务分解及任务序列重构。设计了基于任

务信息交互的深度强化学习环境,基于目标网络与评估网络损失函数间的差值改进SumTree算法,

实现任务间的优先级评估;将激活函数运行机制引入深度强化学习网络,提取任务特征,提出贪

婪激活因子,优化深度神经网络参数,确定智能体最优状态,从而进行智能体状态转换。通过经

验回放生成多目标任务执行序列图。仿真实验结果表明,该方法能生成最佳调度下的可执行任务

图;且相对于静态情景,该方法对动态情景有较好的自适应性,在领域任务筹划中具有良好的推

广应用前景。

关键词:任务分析;强化学习;评估网络;贪婪因子;耦合任务;激活函数

中图分类号:E917;TP391文献标志码:A文章编号:1004-731X(2024)07-1670-12

DOI:10.16182/j.issn1004731x.joss.23-0443

引用格式:龚雪,彭鹏菲,荣里,等.基于深度强化学习的任务分析方法[].系统仿真学报,2024,36(7):1670-1681.

Referenceformat:GongXue,PengPengfei,RongLi,etal.TaskAnalysisMethodsBasedonDeepReinforcement

Learning[J].JournalofSystemSimulation,2024,36(7):1670-1681.

TaskAnalysisMethodsBasedonDeepReinforcementLearning

GongXue,PengPengfeil,RongLil*,ZhengYalian?,JiangJun

(1.NavalUniversityOfEngineering,Wuhan430033,China;

2.StateKeyLaboratoryofWaterResourcesandHydropowerEngineeringScience,WuhanUniversity,Wuhan430072,China)

Abstract:Inresponsetothehighcouplingoftaskinteractionandmanyinfluencingfactorsintask

analysis,ataskanalysismethodbasedonsequencedecouplinganddeepreinforcementlearning(DRL)is

proposed,whichcanachievetaskdecompositionandtasksequencereconstructionundercomplex

constraints.Themethoddesignsanenvironmentfordeepreinforcementlearningbasedontask

informationinteraction,whileimprovingtheSumTreealgorithmbasedonthediffer

显示全部
相似文档