Stable Audio 2.0

Stability AI · Audio Generation
POST /v1/audio/generations可根据文本提示生成长达3分钟的音频,支持可调节时长、步数和CFG比例的 text-to-audio 和audio-to-audio。
一眼看
定价
示例请求
参数
注释
通过文本或audio-to-audio变换生成最多3分钟的音频。
音频对音频模式
- 需要提示词和上传的音频文件
- 推荐CFG等级:7-15
- 推荐步骤:6-8
- 典型强度:0.3-0.7
Machine可读模式: GET https://api.empiriolabs.ai/v1/models/stable-audio-2-0。
