大模型技术演进与应用创新洞察-2024全球机器学习技术大会.pdf
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
李建忠
CSDN高级副总裁,Boolan首席技术专家
于2009年发起成立PM-Summit全球产品经理大会。在人工智能、产品创新、
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
软件架构等方面拥有丰富的经验和深入的研究。他也是全球机器学习技术大会
主席,近年来专注于大语言模型的人工智能方法,提出科技创新的“范式转换
立方体ParaShiftCube”,相关研究和咨询引起了业界的强烈关注。
演讲主题:
大模型技术演进与应用创新洞察
大模型技术演进与应用创新洞察
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
李建忠
ScalingLaw扩展法则背后的密码
演进一、InferenceScaling:从训练到推理
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
演进二、ModalityScaling:从文本到多模态
演进三、DataScaling:数据扩展
智能体:AGI时代的应用形态
扩展法则ScalingLaw
ScalingLaw:模型的性能提升随着模型规模三要素的指数增加
而线性提高。
1、计算量2、数据集3、参数量
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
Scaling扩展背后的密码
•唯一推动过去七十年AI进步的力量,就是通用可扩展的算力
强化学习之父RichardSutton:《苦涩的教训》
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
•Transformer的成功,是解耦了算力、数据、参数三者之间
的关系,实现了快速的Sca