文档详情

提升代码生成质量:代码大模型实践经验-2024全球机器学习技术大会.pdf

发布:2024-11-23约1.32万字共34页下载文档
文本预览下载声明

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

蒋思源

aiXcoder代码大模型算法专家

负责aiXcoder大模型开发的全流程,包括数据采集与清洗、大模型构建与训练、模型

推理优化及服务、模型评估等。关注如何通过大规模分布式训练获得更符合软件工程

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

实际开发场景的基础代码大模型;关注构建能符合软件开发流程、工具、行为的人类

对齐训练方法;关注如何在私有代码上做领域化增量训练,并尽可能降低灾难遗忘等

问题。

演讲主题:

提升代码生成质量:代码大模型实践经验

提升代码生成质量:代码大模型实践经验

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

蒋思源|aiXcoder大模型算法专家

l目录

1.预训练数据处理

2.偏好对齐训练

3.软件工程工具

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

4.多智能体协同

5.领域化训练

6.代码质量评测

生成代码质量评测评测指标监控生成质量

领域化增强代码质量适配闭源代码质量把控

多智能体协同增强代码质量

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

工程化提升推理质量

软件工程工具增强代码质量

偏好对齐增强代码质量

基础模型质量保证

强化预训练数据处理

PART1

2024全球机器学习技

显示全部
相似文档