2024龙蜥大会中兴通讯分论坛:Arm 生态助力大模型时代AI可持续发展.docx
文本预览下载声明
Arm?生态助力大模型时代AI可持续发展
AArch64优化矩阵计算内核在llama.cpp上的应用
李天羽
主任软件工程师
?2024Arm
GenerativeAIAdoption
Inferencing?~80-85%ofAIworkloads
Inferencing
?~80-85%ofAIworkloads
?Customizetoindustryverticalsenterprises
?Hundredsofstartupslaunchedsince2023
?Anevolving
显示全部