ACE-Step 1.5 XL

ACE-Step 1.5 XL
ACE-Step · Audio Generation
POST /v1/audio/generations

text-to-song 및 가사 유도 오디오를 위한 오픈 소스 음악 생성 모델과 빠른 8단계 XL 터보 추론을 통해 노래 반복을 제어할 수 있습니다.

한눈에

필드가치
모델 IDace-step-1.5-xl
모델 출시일2026-04-02
입력 양상본문
출력 방식오디오
컨텍스트 윈도우-
무게 정밀도BF16
특징music_generation, 가사, text_to_music, seed_control, commercial_ready
원주민 추론
신규
지원되는 엔드포인트POST /v1/audio/generations

가격

돌격사양요금
음악 생성생성된 초당$0.00025 ($0.0003였다)

예시 요청

$curl https://api.empiriolabs.ai/v1/audio/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "ace-step-1.5-xl", "prompt": "warm jazz piano", "duration": 8}'

매개변수

매개변수유형필수기본 설정설명
prompt스트링-장르, 분위기, 악기 편성, BPM이 작곡할 음악을 설명하는 힌트를 줍니다. 쉼표 구분된 태그가 잘 작동합니다.
lyrics스트링아니-이 곡의 보컬 가사. 구간은 [벌스] / [후렴] / [브릿지] 태그를 사용하고, 악기 브레이크는 빈칸 줄로 표시하세요. 순수 연주 트랙은 비워두세요.
audio_duration번호아니30.0생성된 트랙의 길이는 초 단위입니다. 이 모델은 최대 ~4분까지 가장 신뢰할 수 있습니다; 더 긴 지속 시간은 확산 중 OOM/quality 떨어질 위험이 있습니다. · 범위: 10.0 – 240
num_inference_steps정수아니8확산 단계 수. 터보 변형의 권장 스위트 스팟은 8 기구이며; 더 다듬어지려면 올려두고, 낮은 것은 저렴한 드래프트 세대를 위한 것입니다. · 사거리: 1 – 20
guidance_scale번호아니1.0분류기 없는 유도 척도. 1.0은 모델의 자연 분포를 따르며; 높은 값은 다양성을 희생하면서도 프롬프트에 더 가까워집니다. · 범위: 0.0 – 20.0
shift번호아니-확산 타임스텝 시프트. 디폴트는 일정을 변경하지 않으며; shorter/punchier 점수는 1.0+로 조정하고, slower/dreamier 결과는 1.0 이하로 조정하세요.
negative_prompt스트링아니-부정적 프롬프트 - 안티태그, 안티스타일, 배제할 도구. 프롬프트와 같은 쉼표 구분 스타일입니다.
seed정수아니-재현성을 위한 무작위 시드. 같은 시드 + 동일한 파라미터가 동일한 트랙을 생성합니다.
format열거아니"flac"응답용 오디오 컨테이너 형식. FLAC = 무손실, WAV = 비압축, MP3 = 작은 파일 크기. · 허용: flac, wav, ogg, mp3
response_format열거아니"url"작업자가 오디오를 반환하는 방식. ‘url’은 렌더링된 파일에 서명된 URL을 반환합니다; ‘base64’는 응답에서 바이트를 인라인 처리합니다. · 허용: url, b64_json
return_base64불리언아니거짓사실일 경우, 응답은 렌더링된 오디오를 URL과 더불어(또는 response_format에 따라 대신) base64로 포함합니다.

주석

디폴트

  • 8단계 추론
  • 가이던스 척도 1.0
  • 무손실 FLAC 출력

조작법

가사, prompt/description, 10-600초 지속 시간, 시드, 시프트, 고정 파이프라인에서 지원할 경우 선택적 네거티브 프롬프트, URL 또는 base64 출력 모드를 지원합니다.


Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/ace-step-1.5-xl.