文档详情

AIGC模型的量化和稀疏优化-2024全球机器学习技术大会.pdf

发布:2024-11-23约1.91万字共41页下载文档
文本预览下载声明

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

刘松伟

字节跳动ByteNN团队高级工程师

硕士毕业于浙江大学,研究领域聚焦深度学习算法的全栈优化,涵盖模型优化和N

卡推理优化。在字节跳动ByteNN团队先后负责服务端稀疏加速/LLM推理优化能力

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

建设,支持豆包视觉多模态大模型项目的推理优化。目前在ByteNN团队负责模型

优化,致力于通过推理引擎和模型层面的协同优化,降低LLM/SD模型的云端推理

成本,进一步推动AIGC模型的端侧落地。

演讲主题:

AIGC模型的量化和稀疏优化

AIGC端侧落地实践

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

稀疏和量化优化

刘松伟字节跳动ByteNN高性能计算专家

团队介绍

AIGC优化介绍

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

稀疏和量化优化

未来展望

ByteNN业务

落地产品

业务应用特效视觉直播企业办公广告音乐游戏

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

算法方向计算机视觉语音自然语言处理多模态广告推荐

操作系统

显示全部
相似文档