文档详情

计算机行业人工智能系列深度：DeepSeek十大关键问题解读.pptx

发布：2025-02-15约7.71千字共17页下载文档

文本预览下载声明

请务必阅读报告附注中的风险提示和免责声明3DeepSeek探索出一条“算法创新+有限算力”的新路径，开源AI时代或已至，国产AI估值或将重塑。Q1：DeepSeek对于算力的影响？——Jevons悖论：短期训练侧算力需求或受影响，但DeepSeek推理价格下降吸引更多用户调用模型，带来英伟达H100GPU的租赁价格提升，故表明算力需求量短期仍呈提升趋势，中长期推理算力需求有望持续增长。Q2：文本与多模态对算力的需求差别？——多模态模型大规模应用，或将升级算力需求。Sora将大模型训练数据从大规模的文本/图像，发展到视频数据，提升了新的维度，这或将数倍提升算力需求。Q3：对芯片未来格局的影响？——训练：NV仍具备计算与生态护城河，DeepSeek带来模型训练算力使用效率提升，NV高等级芯片或主要用于探索AGI；推理：推理化、国产化、ASIC化为三大趋势。Q4：DeepSeek系列模型为何引起轰动？——技术与开源：DeepSeek优化模型结构（MLA+MOE、MTP）、模型训练方法（DualPipe）、针对性GPU优化（FP8混合精度等）等内容，降低了训练成本，同时进行开源，各下游企业可以直接通过本地部署或云端调用，降低了调用成本。Q5：模型未来侧重Dense还是Sparse（MOE）？——一个通才（Dense）能够处理多个不同的任务，但一群专家（MoE）能够更高效、更专业地解决多个问题。Q6：蒸馏模型的定义与发展潜力？——蒸馏可以减少原本大参数模型部署的硬件需求高、推理时间长、成本高昂的缺点，更有利于本地部署、推理业务、应用与端侧发展。Q7：多模态的演进路径？——AI大模型技术和应用逐渐从文本扩展至更多模态。Q8：DeepSeek发生后对应用侧的影响？——DeepSeek在推动降本、强推理等驱动下，有望加速AI应用普及度迎来跨越式提升。Q9：DeepSeek发布对于端侧的影响？——DeepSeek决定支持用户进行“模型蒸馏”，已更新线上产品的用户协议，有望加速AI在端侧进程，未来手机、PC、小型设备等端侧或可部署。Q10：北美增加Capex的用意，以及对deepseek的看法？——北美CSP厂商增加资本开支至服务器与数据中心，继续发展模型预训练与推理侧，重视deepseek技术与发展。

请务必阅读报告附注中的风险提示和免责声明4投资建议DeepSeek探索出一条“算法创新+有限算力”的新路径，开源AI时代或已至，国产AI估值或将重塑，维持计算机行业“推荐”评级。1）AI应用：2G：中科曙光、科大讯飞、中国软件、太极股份、中科星图、国投智能、云从科技2B：金蝶国际、用友网络、卫宁健康、广联达、石基信息、明源云、新开普、泛微网络、同花顺2C：金山办公、三六零、万兴科技、福昕软件、合合信息2）算力：云：海光信息、寒武纪、浪潮信息、中科曙光、华勤技术、紫光股份、中国电信、优刻得、云赛智联、光环新网、中国软件国际、神州数码边：网宿科技、顺网科技、中科创达、深信服端：软通动力、乐鑫科技、移远通信风险提示：宏观经济影响下游需求、大模型产业发展不及预期、市场竞争加剧、中美博弈加剧、相关公司业绩不及预期，各公司并不具备完全可比性，对标的相关资料和数据仅供参考。

请务必阅读报告附注中的风险提示和免责声明5一、DeepSeek十大关键问题解答

请务必阅读报告附注中的风险提示和免责声明6资料来源：Semianalysis，新浪网AI的演进路径中，推理成本不断下降，计算效率持续提高是长期趋势。例如：据Semianalysis，算法进步的速度约为每年4次；AnthropicCEODario甚至认为，这一进步速度可能达到10倍。Jevons悖论：技术进步提高了资源使用效率，效率提高降低了资源使用成本，成本下降刺激了资源需求的增长，需求增长可能超过效率提升带来的节约，最终导致资源总消耗增加。我们认为，短期训练侧算力需求或受影响，但DeepSeek推理价格下降吸引更多用户调用模型，带来英伟达H100GPU的租赁价格提升，故表明算力需求量短期仍呈提升趋势，中长期推理算力需求有望持续增长。表：大模型成本持续下降，效率提升表：V3/R1发布后，AWS多地H100GPU价格上涨，H200也更难获取

请务必阅读报告附注中的风险提示和免责声明7基础计算4倍计算32倍计算资料来源：机器之心公众号，国海证券研究所多模态大模型是一种基于深度学习的机器学习模型，类似于人脑能够同时处理文本、声音、图像等不同类型的信息，多模态模型能够处理和整合“图像+文本”、“视频+音频”、“语音+文字”等多种模态的数据和信息，利用不同模态之间的互补和协同，来提高模型的全

显示全部

相似文档