文档详情

TAI 123.6-2024 人工智能算力网络 第6部分:云际管理与调度.pdf

发布:2025-03-08约3.2万字共28页下载文档
文本预览下载声明

ICS35.020

CCSL70

团体标准

T/AI123.6—2024

人工智能算力网络

第6部分:云际管理与调度

Artificialintelligencecomputingnet–

Part6:JointCloudmanagementandscheduling

2024-11-29发布2024-11-29实施

中关村视听产业技术创新联盟发布

T/AI123.6—2024

目次

前言II

引言III

1范围1

2规范性引用文件1

3术语和定义1

4缩略语3

5软件参考架构3

6功能要求4

6.1算力资源管理4

6.2镜像管理7

6.3数据管理7

6.4作业管理9

6.5作业调度11

6.6调度策略12

6.7调度性能评估14

7接口要求14

7.1作业管理接口14

7.2调度策略接口14

7.3调度评估模型接口15

附录A(资料性)接口说明16

参考文献22

I

T/AI123.6—2024

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》

的规则起草。

本文件是T/AI123《人工智能算力网络》的第6部分,T/AI123已经发布了以下部分:

——第1部分:总体要求;

——第6部分:云际管理与调度。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由新一代人工智能产业技术创新战略联盟AI标准工作组提出。

本文件由中关村视听产业技术创新联盟归口。

本文件起草单位:鹏城实验室、北京大学、国防科技大学、华为技术有限公司、中科寒

武纪科技股份有限公司、广东博华超高清创新中心有限公司。

本文件主要起草人:余跃、徐春香、杨晓珍、林冯军、王晖、张叶红、刘敏、曾炜、樊

春、聂永丰、张鹏、朱宗卫、赵轩、张伟民、赵海英、崔晓冉。

II

T/AI123.6—2024

引言

T/AI123为人工智能算力网络规定了技术要求,接口要求,调度适配协同要求,网络设

施要求、运营服务要求等。

T/AI123《人工智能算力网络》拟由以下部分组成:

——第1部分:总体要求。目的在于确立智算网络的系统参考架构、总体功能要求及接

口要求。

——第2部分:异构资源统一度量和标识。目的在于确立数据、算力、模型、存储、网

络等异构资源统一抽象度量和标识的方法与转换要求。

——第3部分:云际数据统一存储应用接口。目的在于确立全局共享数据存储的统一技

术架构及其功能、接口、性能、可靠性要求。

——第4部分:调度适配器南向接口规范。目的在于确立调度适配器与各智算中心云化

管理调度系统之间的接口,实现智算中心资源获取和作业下发。

——第5部分:资源感知路由协议接口。目的在于确立通过智算网络资源感知路由协议

获取资源动态信息的接口。

——第6部分:

显示全部
相似文档