大型语言模型智能体:机制和应用的综述.pdf
第15卷第6期指挥信息系统与技术Vol.15No.6
2024年12月CommandInformationSystemandTechnologyDec.2024
·专家视野·doi:10.15908/ki.cist.2024.06.001
大型语言模型智能体:机制和应用的综述
1211
胡伟姜晓夏邵洲天朱容志
(1南京大学计算机软件新技术国家重点实验室南京210023)
(2信息系统工程全国重点实验室南京210023)
摘要:人工智能智能体(AIagent)具有环境感知、决策制定和行动执行能力,被视为实现通用人
工智能(AGI)的关键。首先,介绍了大型语言模型智能体(LLMagent)在角色定位、记忆操作、规划
推理和动作执行环节的技术细节,包括长短期混合记忆机制、多种推理模型(如思维链、思维树和思
维图)以及基于规划的多样化输出策略;其次,回顾了Dust.tt和LangChain等开源框架,并探讨了
LLMagent在多个领域的应用及未来发展趋势,包括多模态发展、机器人技术进步和模型轻量化设
计;最后,指出了LLMagent面临的伦理和社会问题。
关键词:大型语言模型;AI智能体;思维链
中图分类号:TP311文献标志码:A文章编号:1674⁃909X(2024)06⁃0001⁃11
LargeLanguageModel(LLM)Agents:SurveyofMechanismsandApplications
HUWei1JIANGXiaoxia2SHAOZhoutian1ZHURongzhi1
(1StateKeyLaboratoryforNovelSoftwareTechnology,NanjingUniversity,Nanjing210023,China)
(2NationalKeyLaboratoryofInformationSystemsEngineering,Nanjing210023,China)
Abstract:Artificialintelligence(AI)agenthascapabilitiesofenvironmentalperception,
decision⁃making,andactionexecution,anditisregardedasessentialtorealizeartificialgeneralintelli⁃
gence(AGI).Firstly,thetechnicalaspectsoflargelanguagemodel(LLM)agentinrolepositioning,
memoryoperation,planningandreasoning,andactionexecutionareintroduced,includinglong⁃term
and