电子行业深度报告:豆包大模型全面升级,算力侧和应用侧产业链有望受益.docx
目录
TOC\o1-2\h\z\u豆包大模型家族全面升级,视觉和语音大模型发布 4
应用端:豆包大模型拓宽应用边界,终端硬件再革新 6
智能终端+大模型,革新人机交互方式 6
大模型赋能家居生活,应用形式日益丰富 9
大模型+汽车,智能座舱再升级 10
算力端:AI云原生推进,算力建设至关重要 12
推理需求快速增长,算力建设持续性强 12
服务器及液冷厂商有望受益 13
PCB需求增长 14
数据存力和运力需求增长拓宽产业空间 14
投资建议 15
风险提示 15
图表目录
图1:豆包模型发展时间线 4
图2:各模型性能参数对比 5
图3:豆包Pro模型升级 5
图4:豆包视觉理解模型应用场景拓展 6
图5:智能终端大模型应用 7
图6:全球AIPC出货量/亿台 8
图7:OlaFriend智能体耳机可作为用户的旅行导游 9
图8:2023-2028中国蓝牙耳机市场出货量及预测/百万台 9
图9:全球智能耳机市场规模预测/百万美元 9
图10:扣子与HiAgent标准化实践 10
图11:Smart精灵5车型 11
图12:梅赛德斯-奔驰(中国)与火山引擎合作 11
图13:veOmniverse与豆包3D生成模型 11
图14:AICloudNative端到端提升大模型训练效率 12
图15:火山引擎AI云原生范式 13
图16:火山引擎计算架构和资源弹性能力 13
图17:2022年CSP厂商AI服务器采购量占比 13
图18:全球服务器/数据存储PCB市场规模(亿美元) 14
图19:服务器PCB单机价值量(美元) 14
表1:AI手机快速渗透,产业链受益环节多 8
豆包大模型家族全面升级,视觉和语音大模型发布
豆包大模型家族已成长为国内大模型领军者。23年8月云雀模型、24年5月正式发布、24年9月率先成为国内用户规模破亿的首个AI应用、24年12月字节跳动视频生成模型PixelDance已在豆包电脑版正式开启内测。11月全球月活跃用户排行榜显示,豆包App的MAU已接近6000万,仅次于ChatGPT,位列全球第二、全国第一。火山引擎Force冬季大会上宣布,截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,较七个月前首次发布时增长了33倍。会上还发布了豆包视觉理解模型、3D生成模型、通用模型pro、音乐模型和文生图模型等,2025年春季将推出豆包视频生成模型1.5版,端到端实时语音模型也即将上线。
图1:豆包模型2024年发展时间线
数据来源:公司官网,
豆包大模型家族包括语言模型、视觉大模型和语音模型。
语言模型方面,通用大模型再升级,包含4k、32k、128k和256k等版本,覆盖从基础任务到超长文本推理的广泛需求。其中,doubao-pro-256k支持256k上下文处理能力,可解析长达40万汉字的内容,展现出在复杂流程推理、总结与信息抽取等方面的显著提升。同时,轻量化模型Doubao-lite针对高响应速度的需求,适用于对时延有严格要求的场景。此外,这些模型新增了联网问答、角色扮演、工具调用等能力,在多领域综合性能上表现卓越。
图2:各模型性能参数对比
数据来源:公司官网,
图3:豆包Pro模型升级
数据来源:公司官网、
豆包Pro模型在功能迭代和企业应用方面取得了显著成果。新版本在专业知识领域的能力提升了54个百分点,在综合任务处理能力上对标GPT-4,甚至在某些复杂场景中表现更优。例如,在法务领域,豆包Pro通过高精度信息抽取,帮助企业实现了95%以上的判例精度,大幅降低了法律分析成本;在教育领域,它被用于智能NPC和AI质检的创建,其调用量在几个月内提升了800倍。此外,在角色扮演、逻辑推理等任务中的表现也赢得了广泛的企业认可。
视觉大模型方面,多款大模型推出,进一步拓展产品边界。图生图模型提供多达23种风格转换能
力,广泛应用于互动娱乐和广告创意场景;文生图模型则体现了对中国文化的深刻理解,支持丰
有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。
富多样的生成需求,包括朋友圈文案生成、美食点评灵感等。特别是,基于视觉理解技术的模型拥有强大的推理能力,支持单图、多图输入,拓展了视觉技术在设计、媒体创作领域的应用场景。视觉理解模型在成本控制上也具备显著优势,其定价仅