
Stable Audio
Stable Audio是 Stability AI 于 2023 年首次发布的 AI 音频、音乐和音效模型。Stability AI 是生成式 AI 领域的知名企业,其文本转图像模型Stable Diffusion已广为人知。

多模态工作流
通过灵活的多模态功能(包括文本转音频、音频转音频和音频局部修改)实现对声音制作的全方位掌控。Stable Audio可确保严格遵循提示词,让您的输出完美符合您的想法。
免费试用 Tad AI
商业安全且可定制
Stable Audio经过完全合规的授权数据集进行训练,提供商业上安全的模型,保护您的品牌免受版权问题的影响。企业甚至可以与研究团队合作,根据其专有的声音库微调模型。
免费试用 Tad AI
Stable Audio的工作原理
文本提示词输入
首先,输入描述您想要的音频输出的文本提示词,并指定情绪、乐器和其他特征等元素。
音频样本上传(可选)
您还可以选择上传现有的音频样本。这样,您就可以将上传的音频转换成全新的版本。
生成与定制
Stable Audio会处理您的输入以生成音频。如有需要,您可以进行进一步调整。

常见问题解答
Stable Audio 2.5 与之前的版本有何不同?
Stable Audio 2.5 主要面向企业级音频制作。Stable Audio 2.5采用Stable Audio研究团队开创的先进技术进行训练,在质量和控制方面取得了进步,可满足跨渠道自定义及品牌导向音频的需求。
什么是Stable Audio Open?
Stable Audio Open是一款开源模型,经过优化,可使用文本提示生成短音频样本、音效和制作元素。它能生成长达 47 秒的高质量音频,非常适合创建鼓点、乐器即兴演奏、环境音和拟音录音。
Stable Audio Open和Stable Audio 2.5有什么区别?
Stable Audio Open是一款开源模型,经过优化,可生成短音频样本,而Stable Audio 2.5 则专为企业级音频制作而设计。
生成的每段音频都是独一无二的吗?
是的, Stable Audio生成的每个音频文件都经过独特设计,确保没有两个文件是完全相同的。
我可以在商业项目中使用Stable Audio生成的音乐吗?
是的,只要订阅了相应的等级,例如创作者或企业授权,您就可以在商业项目中使用生成的音乐。