文档详情

大模型技术演进与应用创新洞察-2024全球机器学习技术大会.pdf

发布：2024-11-24约9.13千字共25页下载文档

文本预览下载声明

2024全球机器学习技术大会（北京站）主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题，力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

2024全球机器学习技术大会（北京站）主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题，力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

2024全球机器学习技术大会（北京站）主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题，力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

李建忠

CSDN高级副总裁，Boolan首席技术专家

于2009年发起成立PM-Summit全球产品经理大会。在人工智能、产品创新、

2024全球机器学习技术大会（北京站）主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题，力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

软件架构等方面拥有丰富的经验和深入的研究。他也是全球机器学习技术大会

主席，近年来专注于大语言模型的人工智能方法，提出科技创新的“范式转换

立方体ParaShiftCube”，相关研究和咨询引起了业界的强烈关注。

演讲主题：

大模型技术演进与应用创新洞察

大模型技术演进与应用创新洞察

2024全球机器学习技术大会（北京站）主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题，力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

李建忠

ScalingLaw扩展法则背后的密码

演进一、InferenceScaling：从训练到推理

2024全球机器学习技术大会（北京站）主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题，力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

演进二、ModalityScaling：从文本到多模态

演进三、DataScaling：数据扩展

智能体：AGI时代的应用形态

扩展法则ScalingLaw

ScalingLaw：模型的性能提升随着模型规模三要素的指数增加

而线性提高。

1、计算量2、数据集3、参数量

2024全球机器学习技术大会（北京站）主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题，力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

Scaling扩展背后的密码

•唯一推动过去七十年AI进步的力量，就是通用可扩展的算力

强化学习之父RichardSutton：《苦涩的教训》

2024全球机器学习技术大会（北京站）主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题，力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

•Transformer的成功，是解耦了算力、数据、参数三者之间

的关系，实现了快速的Sca

显示全部

相似文档