提升代码生成质量:代码大模型实践经验-2024全球机器学习技术大会.pdf
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
蒋思源
aiXcoder代码大模型算法专家
负责aiXcoder大模型开发的全流程,包括数据采集与清洗、大模型构建与训练、模型
推理优化及服务、模型评估等。关注如何通过大规模分布式训练获得更符合软件工程
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
实际开发场景的基础代码大模型;关注构建能符合软件开发流程、工具、行为的人类
对齐训练方法;关注如何在私有代码上做领域化增量训练,并尽可能降低灾难遗忘等
问题。
演讲主题:
提升代码生成质量:代码大模型实践经验
提升代码生成质量:代码大模型实践经验
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
蒋思源|aiXcoder大模型算法专家
l目录
1.预训练数据处理
2.偏好对齐训练
3.软件工程工具
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
4.多智能体协同
5.领域化训练
6.代码质量评测
生成代码质量评测评测指标监控生成质量
领域化增强代码质量适配闭源代码质量把控
多智能体协同增强代码质量
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
工程化提升推理质量
软件工程工具增强代码质量
偏好对齐增强代码质量
基础模型质量保证
强化预训练数据处理
PART1
2024全球机器学习技