文档详情

博通市值破万亿美元启示:国产芯片可另类突围.docx

发布:2025-03-03约1.73千字共3页下载文档
文本预览下载声明

博通市值破万亿美元启示:国产芯片可另类突围

另外,博通CEO还表示,公司正在与美国三家大型云计算厂商开发定制AI芯片。因此,华尔街多家投行纷纷上调博通股票目标价,例如,高盛将公司目标价从190美元上调至240美元,巴克莱将博通目标价从200美元上调至205美元。

需要指出的是,在定制AI芯片领域,国内寒武纪(688256.SH)、百度(09888.HK)、腾讯控股(00700.HK)等企业也早有布局,并取得了一定的成绩。而且,在下游客户方面,国内阿里云、天翼云、移动云、腾讯云均位列全球十大云计算厂商名单,这也为国内定制AI芯片的发展提供了必要的需求。

AI芯片是一种专为高效运行人工智能算法而设计的特殊处理器,这种芯片基于人工神经网络模型,模拟生物神经元工作机制,通过大量处理单元进行计算,以实现负载的数学运算和数据处理。

由于英伟达GPU在AI芯片领域的市场占有率较高,绝大部分人将英伟达GPU与AI芯片直接画等号。但实际上,市场上主流的AI芯片主要分为三类,第一类是以GPU为代表的通用芯片,第二类是以ASIC为代表的专用芯片,第三类则是以FPGA为代表的半定制化芯片,其中,GPU与ASIC为AI芯片的主要技术路径。

据慧博投研数据,在三大主流AI芯片中,GPU更适用于AI训练,其原因在于AI训练过程需要处理大量的数据和复杂的计算,对芯片的计算能力、内存宽带和并行处理能力要求非常高。GPU由于拥有众多的计算核心和高宽带内存,可以同时处理大量的数据样本和复杂的计算任务,能够加速AI模型的训练过程。而且,在训练过程中,由于需要不断的调整模型的参数和结构,GPU的灵活性使其更适合这种频繁的调试和迭代。

不过,GPU也存在一些局限性。例如,在功耗方面,GPU的功耗相对较高,且由于其通用的架构设计,在执行特定任务可能存在功耗的浪费。

在此情况下,兼具成本与能耗优势的ASIC成为各大云计算厂商在推理领域的首选AI芯片。ASIC是一种为了专门目的或者算法而专门定制的芯片,根据运算类型,ASIC又细分为TPU、DPU、NPU芯片。TPU是谷歌发明的AI处理器,主要支持张量计算;DPU则是用于数据中心内部的加速计算;NPU则是对应了上一轮AI中的CNN神经卷积算法,后来被大量SoC进了边缘设备的处理芯片中。

据国泰君安研报,ASIC成本与能耗低于GPU的原因在于其相对简单的硬件结构,ASIC是为了特定任务而设计,减少了很多针对通用加速计算的不必要的硬件设计,因此,其成本明显降低。

值得一提的是,ASIC单卡算力与GPU相比仍有一定的差距,例如,谷歌TPUv6和微软的Maia100算力约为英伟达H100的90.00%与80.00%。不过,两者单价显著低于H100,故在推理场景中,ASIC更具有性价比。

据慧博投研数据,寒武纪是国内AI芯片领域的独角兽企业,采用公司终端智能处理器IP的终端设备出货量已经超过1亿台。而且,公司云端智能芯片及加速卡也已在国内主流服务器厂商产品中得到广泛应用。

寒武纪高研发投入取得了成果,据慧博投研数据,在推理芯片领域,寒武纪先后发布MLU100、MLU200、MLU370和玄思1001等4个系列共8个产品。值得一提的是,思元370芯片采用7nm制程工艺,是寒武纪首颗采用chiplet芯片技术的AI芯片,也是国内第一款公开发布支持LPDDR5内存的云端AI芯片,其算力是寒武纪第二代云端推理产品思元270算力的2倍。

更为重要的是,370系列在高密度云端推理领域具有明显优势,其MLU370-X8提供256TOPS的峰值算力,高于英伟达的L20。与国内云端推理芯片相比,在150W功耗推理卡中,MLU370-X4峰值算力和昆仑芯R200、燧原I20相同,均为256TOPS。在高密度云端推理领域,MLU370-S4的能耗比为2.56,具有一定的能耗优势。

腾讯也先后发布三款自研芯片,分别为紫霄、沧海、玄灵。其中,紫霄主要用于AI推理,并在语音撰写、OCR等腾讯业务场景中得到应用;沧海则主要用于视频转码,目前已量产并投用数万片;玄灵主要用于智能网络,定位于云主机的性能加速,减少主CPU网络功能的占用。

显示全部
相似文档