Stable Audio 2.0

Stability AI · Audio Generation
POST /v1/audio/generationsテキストプロンプトから最大3分間の音声を生成し、持続時間、ステップ、CFGスケールを調整可能な、text-to-audioとaudio-to-audioをサポートします。
一目で
価格設定
例示リクエスト
パラメータ
注記
テキストやaudio-to-audio変換から最大3分間の音声を生成します。
音声から音声へのモード
- プロンプトとアップロードされた音声ファイルの両方が必要です
- 推奨CFGスケール:7-15
- 推奨ステップ:6-8
- 典型的な強さ:0.3〜0.7
Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/stable-audio-2-0。
