文档详情

从强化学习(多)智能体到大语言模型(多)智能体.docx

发布:2025-04-09约2.25万字共48页下载文档
文本预览下载声明

从强化学习(多)智能体

到大语言模型(多)智能体

毛航宇,快手科技

2024年10月12日@RLChina2024

目录

1.强化学习(多)智能体到大语言模型(多)智能体十年研究脉络梳理

2.强化学习(多)智能体到大语言模型(多)智能体代表工作选讲

DeepRLAgent(DRL)

Transformer-basedRLAgent(TRL)

LLM-basedAIAgent

3.企业实践中的心得体会

2

Background:RLAgents

Background:AIAgents

https://lilianweng.github.io/p

显示全部
相似文档