文档详情

大模型技术演进与应用创新洞察-2024全球机器学习技术大会.pdf

发布:2024-11-24约9.13千字共25页下载文档
文本预览下载声明

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

李建忠

CSDN高级副总裁,Boolan首席技术专家

于2009年发起成立PM-Summit全球产品经理大会。在人工智能、产品创新、

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

软件架构等方面拥有丰富的经验和深入的研究。他也是全球机器学习技术大会

主席,近年来专注于大语言模型的人工智能方法,提出科技创新的“范式转换

立方体ParaShiftCube”,相关研究和咨询引起了业界的强烈关注。

演讲主题:

大模型技术演进与应用创新洞察

大模型技术演进与应用创新洞察

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

李建忠

ScalingLaw扩展法则背后的密码

演进一、InferenceScaling:从训练到推理

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

演进二、ModalityScaling:从文本到多模态

演进三、DataScaling:数据扩展

智能体:AGI时代的应用形态

扩展法则ScalingLaw

ScalingLaw:模型的性能提升随着模型规模三要素的指数增加

而线性提高。

1、计算量2、数据集3、参数量

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

Scaling扩展背后的密码

•唯一推动过去七十年AI进步的力量,就是通用可扩展的算力

强化学习之父RichardSutton:《苦涩的教训》

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

•Transformer的成功,是解耦了算力、数据、参数三者之间

的关系,实现了快速的Sca

显示全部
相似文档