
Stable Audio
Stable Audio是一款由 Stability AI 开发并于 2023 年发布的 AI 音频、音乐和音效生成器。Stability AI 是生成式 AI 领域的重要参与者,此前已因其 AI 图像生成器Stable Diffusion而闻名。
免费试用Tad AI
文本转音频生成
借助Stable Audio,用户可以使用自然语言提示创建高质量、完整的音轨,这些音轨具有连贯的音乐结构,时长可达三分钟,采样率为 44.1 kHz 立体声。这使得生成具有独特前奏、发展和尾声部分的完整歌曲成为可能。
免费试用 Tad AI
音频到音频的生成
Stable Audio使用户能够上传音频样本,并使用自然语言提示对其进行转换。它为艺术家和音乐家拓展了创作可能性,允许他们基于现有的音频输入生成旋律、伴奏音轨、音源和音效。
免费试用 Tad AI
音效生成
Stable Audio还可以生成各种音效,从键盘敲击声到人群喧嚣声和城市环境音。此外,它还提供风格迁移功能,允许用户在生成过程中修改新生成的或上传的音频,使其与特定的风格和音调相符。
免费试用 Tad AI
Stable Audio的工作原理
文本提示输入
首先,你需要输入一段文字提示,描述你想要的音频输出,具体说明音乐类型、情绪、乐器和其他特征等要素。
音频样本上传(可选)
您也可以选择上传现有的音频样本。这允许您使用自然语言提示来转换他们上传的音频。
生成与定制
Stable Audio处理输入内容以生成音频。如果需要,您可以进行进一步调整。

常见问题解答
Stable Audio 2.0 与之前的版本相比有哪些不同之处?
Stable Audio 2.0 引入了多项重大改进,包括生成长达三分钟的、具有连贯音乐结构的音轨的能力,以及全新的音频到音频生成功能,该功能允许用户使用自然语言提示上传和转换音频样本。
什么是Stable Audio Open?
Stable Audio Open 是一个开源模型,经过优化,可以使用文本提示生成短音频样本、音效和制作元素。它允许用户生成长达 47 秒的高质量音频,非常适合创建鼓点、乐器即兴演奏、环境声音和拟音录音。
生成的每段音频都是独一无二的吗?
是的, Stable Audio生成的每个音频文件都是由人工智能独一无二地制作的,确保没有两个文件是相同的。
Stable Audio 的模型是用什么数据训练的?
Stable Audio 2.0 是使用来自 AudioSparx 音乐库的授权数据集进行训练的。Stable Stable Audio Open 是使用来自 Freesound 和 Free Music Archive 的数据进行训练的。
我可以在商业项目中使用Stable Audio生成的音乐吗?
是的,如果用户订阅了相应的级别,例如创作者或企业许可,他们可以将生成的音乐用于商业项目。