ACE-Step 1.5 XL

ACE-Step 1.5 XL
ACE-Step · Audio Generation
POST /v1/audio/generations

オープンソースの音楽生成モデルで、text-to-songおよび歌詞ガイド音声のための高速8ステップXLターボ推論による曲の制御可能な反復が可能です。

一目で

フィールド価値
モデルIDace-step-1.5-xl
モデル発売日2026-04-02
入力モダリティ本文
出力モダリティ音声
コンテキストウィンドウ-
重量精度BF16
特徴music_generation、歌詞、text_to_music、seed_control、commercial_ready
ネイティブ推論はい
新作はい
サポート端末POST /v1/audio/generations

価格設定

チャージスペックレート
音楽生成生成秒あたり$0.00025(だった$0.0003)

例示リクエスト

$curl https://api.empiriolabs.ai/v1/audio/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "ace-step-1.5-xl", "prompt": "warm jazz piano", "duration": 8}'

パラメータ

パラメータ種類必須デフォルト概要
promptストリングはい-ジャンル、ムード、楽器編成、BPMが作曲すべき音楽のヒントを示唆しています。カンマ区切られたタグはよく機能します。
lyricsストリングいいえ-この曲のボーカルリリック。セクションは[ヴァース]/[コーラス]/[ブリッジ]タグで区切り、インストゥルメンタルブレイクは空欄で示します。純粋なインストゥルメンタルトラックは空欄にしてください。
audio_duration番号いいえ30.0生成されたトラックの長さを秒単位で計算します。このモデルは最大4~分までが最も信頼性が高いです。長時間は拡散時OOM/qualityドロップのリスクがあります。·範囲:10.0 – 240
num_inference_steps整数いいえ8拡散ステップ数。ターボ仕様の推奨は8回転です。より磨き上げるなら上げ、低くして安価なドラフト世代を選びましょう。·射程:1 – 20
guidance_scale番号いいえ1.0分類器なしのガイダンススケール。1.0はモデルの自然分布に従います。高い数値は、多様性を犠牲にしてプロンプトに近づきます。·射程:0.0 – 20.0
shift番号いいえ-拡散タイムステップシフト。デフォルトではスケジュールは変更されず、shorter/punchierでは1.0+に、slower/dreamier結果は1.0以下に調整してください。
negative_promptストリングいいえ-ネガティブプロンプト - アンチタグ、アンチスタイル、排除すべきツール。プロンプトと同じカンマ区切りのスタイルです。
seed整数いいえ-再現性のためのランダムシード。同じシード+同一のパラメータでも同じトラックが生成されます。
formatエヌムいいえ"flac"応答用の音声コンテナ形式。FLAC = ロスレス、WAV = 非圧縮、MP3 = 小さなファイルサイズ。·許可:flacwavoggmp3
response_formatエヌムいいえ"url"作業員がどのように音声を返すか。「url」はレンダリングされたファイルに対して署名付きURLを返します。「base64」は応答のバイトをインライン化します。·許可:urlb64_json
return_base64ブール値いいえ偽りもし真である場合、応答はレンダリングされた音声をURLに加えて(またはresponse_formatによっては代替)として含みます。

注記

デフォルト

  • 8つの推論ステップ
  • ガイダンススケール1.0
  • ロスレスFLAC出力

操作系統

歌詞、prompt/description、10〜600秒の長さ、シード、シフト、ピン留めパイプラインでサポートされた場合のオプションネガティブプロンプト、URLまたはbase64出力モードをサポートしています。


Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/ace-step-1.5-xl