TAI 123.6-2024 人工智能算力网络 第6部分:云际管理与调度.pdf
ICS35.020
CCSL70
团体标准
T/AI123.6—2024
人工智能算力网络
第6部分:云际管理与调度
Artificialintelligencecomputingnet–
Part6:JointCloudmanagementandscheduling
2024-11-29发布2024-11-29实施
中关村视听产业技术创新联盟发布
T/AI123.6—2024
目次
前言II
引言III
1范围1
2规范性引用文件1
3术语和定义1
4缩略语3
5软件参考架构3
6功能要求4
6.1算力资源管理4
6.2镜像管理7
6.3数据管理7
6.4作业管理9
6.5作业调度11
6.6调度策略12
6.7调度性能评估14
7接口要求14
7.1作业管理接口14
7.2调度策略接口14
7.3调度评估模型接口15
附录A(资料性)接口说明16
参考文献22
I
T/AI123.6—2024
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》
的规则起草。
本文件是T/AI123《人工智能算力网络》的第6部分,T/AI123已经发布了以下部分:
——第1部分:总体要求;
——第6部分:云际管理与调度。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由新一代人工智能产业技术创新战略联盟AI标准工作组提出。
本文件由中关村视听产业技术创新联盟归口。
本文件起草单位:鹏城实验室、北京大学、国防科技大学、华为技术有限公司、中科寒
武纪科技股份有限公司、广东博华超高清创新中心有限公司。
本文件主要起草人:余跃、徐春香、杨晓珍、林冯军、王晖、张叶红、刘敏、曾炜、樊
春、聂永丰、张鹏、朱宗卫、赵轩、张伟民、赵海英、崔晓冉。
II
T/AI123.6—2024
引言
T/AI123为人工智能算力网络规定了技术要求,接口要求,调度适配协同要求,网络设
施要求、运营服务要求等。
T/AI123《人工智能算力网络》拟由以下部分组成:
——第1部分:总体要求。目的在于确立智算网络的系统参考架构、总体功能要求及接
口要求。
——第2部分:异构资源统一度量和标识。目的在于确立数据、算力、模型、存储、网
络等异构资源统一抽象度量和标识的方法与转换要求。
——第3部分:云际数据统一存储应用接口。目的在于确立全局共享数据存储的统一技
术架构及其功能、接口、性能、可靠性要求。
——第4部分:调度适配器南向接口规范。目的在于确立调度适配器与各智算中心云化
管理调度系统之间的接口,实现智算中心资源获取和作业下发。
——第5部分:资源感知路由协议接口。目的在于确立通过智算网络资源感知路由协议
获取资源动态信息的接口。
——第6部分: