清华大学DS指南:基于DeepSeek的AI音乐词曲创作法.pptx
@新媒沈阳团队Al音乐人刘东江
2025年2月
基于DeepSeek的Al音乐
词曲创作法
所属公司
模型名称
主要特点
亮点功能
适用场景
SunoAl
Suno
-能够一次性完成歌词、演唱、编曲、配乐等音乐创作的全流程
-多语言交叉混合生成能力
-支持多种音乐风格和情绪状态
-支持所有用户制作4分钟的歌曲,创建最长2分钟的歌曲扩展
个人音乐创作、社交媒
体内容创作、音乐教育
等
MiniMax
Abab-music-1
-端到端音乐生成能力
-纯音乐、清唱作品、伴奏、人声生成
-拟人化生成能力
-支持多种音乐风格和情绪状态
音乐创作和制作、影视配乐、内容创作等
昆仑万维
天工SkyMusic
端到端音乐生成能力
-人声自然度高、发音可懂度强
-方言演唱能力
-支持人声、歌词使用多种方言
文化传播、社交媒体内容创作、音乐教育等
腾讯
琴乐大模型
-能根据文本或音频输入生成音乐
-遵循乐理生成能力
-支持自动编辑和乐谱生成支持音频文本对齐
-支持乐谱/音频表征提取
音乐教育、社交媒体内容创作等
抖音
豆包
-零样本人声克隆能力
-旋律歌词局部改写能力
-预设多种情绪状态
-支持一键分享至社交平台
-支持多种情绪状态
-支持旋律仿写
个人音乐创作、社交媒
体内容创作、音乐教育
等
网易
网易天音
一站式AI音乐创作平台
-功能免费使用
-支持用户自主调整乐器、编曲
-支持音轨上传和段落结构设置
专业音乐创作、音乐教育、音乐娱乐等
在国内外一众音乐大模型中,Suno的表现最为优异,在音乐创作的全流程中表现出色。但
Minimax、昆仑万维、腾讯、抖音、网易也在开发新功能并完善原有功能。
1.歌词:歌词这一部分建议有一些人工参与,歌词最重要的是要保证主歌和副歌在段落结构上的区别,以及整体律动上的一致性。
2.风格化标签:风格化标签可以在平常整理一些音乐风格以及自己听音乐时的感受,当然也可以询问AI,让它批量列举风格化参数。
3.元标签:元标签的使用手法可以查询一些爱好者根据自己创作内容整理的标签文档,学习在[]内使用打断、器乐效果、Rap转换、前奏尾奏等等一系列操作手法。
以目前非常主流的Al音乐创作平台SunoAl为例,我们主要可以通过歌词、风格化标签、元标签三个模块对我们的音乐风格进行外部控制,而实际生成的过程依然是个黑盒状态,有着很高的随机性与不确定性。但他们三者的重要性总体而言是歌词风格化标签元标签
0/200melodicn
我走在鼓楼下面
淋湿的咖啡馆
睡不着的后海边
月亮还在抽着烟
喝醉的亲吻着
快活的人不眠
唯有我倚着围栏
对过往说晚安
晚安
我是个沉默不语的靠着车窗想念你的乘客
当107路再次经过
时间是带走青春的电车我站在什刹海边
一切甜蜜与我无关
这是个拥挤的地方
而我却很孤单
我在鼓楼
我走在鼓楼下面
路在堵着
雨后的阳光洒落
人们都出来了
执着的迷惘的
文艺青年很多
如果我无聊了就会来这里坐坐我是个沉默不语的靠着墙壁
晒太阳的过客
如果我有些倦意了
就让我在这里独自醒过
我站在鼓楼上面
一切繁华与我无关
这是个拥挤的地方
而我却很平凡
批注
mt
基于人、事、时、地、物的歌词创作法
人事时地物
AI音乐生产工作流:零知识启动,高知识生产
编曲:Al--100%
而通过大模型产出的Al音乐,要想成为一首合格的歌曲,就是通过优秀的旋律的构建形成有记忆点的听感效果,在律动上做出创新的形式,在收听时有较好与相对统一节奏(SunoAl4.0就是重点加强了律动、DeepSeek加强了歌词),最后,将原本的听别人的歌,感受自己的故事,扭转为听自己的歌,感受自己的故事。使得人人都可以零门槛成为“音乐创作人”。
旋律
优美动听的旋律会在我们脑海中形成耳虫效应,这是我们在仅仅只听一两次就能记住一首传世名曲的根本条件,甚至于近两年的抖音神曲只需要十秒钟或两句歌词就能达到洗脑的效果。
故事
而对于东亚听众的音乐审美来说,歌曲所具备的故事内核尤其重要,一首歌要满足
“人、事、时、
地、物”的条件。主歌叙事,副歌抒情,每个人都是在听别人的歌,感受自己的故事。
律动
好的律动是相同旋律能拉开差距的关键,也是听音乐过程当中
“爽感”的来源,这些年来,欧美音乐向着轻旋律,重律动的方向发展,也使得嘻哈文化成为主流。
先培养音乐欣赏能力,然后创作拔高
传统音乐教育与职业音乐家的角色变化
音乐教育的转型:如果AI能生成高质量旋律,音乐教育可能从“创作技能