prompt | 스트링 | 네 | - | 장르, 분위기, 악기 편성, BPM이 작곡할 음악을 설명하는 힌트를 줍니다. 쉼표 구분된 태그가 잘 작동합니다. |
lyrics | 스트링 | 아니 | - | 이 곡의 보컬 가사. 구간은 [벌스] / [후렴] / [브릿지] 태그를 사용하고, 악기 브레이크는 빈칸 줄로 표시하세요. 순수 연주 트랙은 비워두세요. |
audio_duration | 번호 | 아니 | 30.0 | 생성된 트랙의 길이는 초 단위입니다. 이 모델은 최대 ~4분까지 가장 신뢰할 수 있습니다; 더 긴 지속 시간은 확산 중 OOM/quality 떨어질 위험이 있습니다. · 범위: 10.0 – 240 |
num_inference_steps | 정수 | 아니 | 8 | 확산 단계 수. 터보 변형의 권장 스위트 스팟은 8 기구이며; 더 다듬어지려면 올려두고, 낮은 것은 저렴한 드래프트 세대를 위한 것입니다. · 사거리: 1 – 20 |
guidance_scale | 번호 | 아니 | 1.0 | 분류기 없는 유도 척도. 1.0은 모델의 자연 분포를 따르며; 높은 값은 다양성을 희생하면서도 프롬프트에 더 가까워집니다. · 범위: 0.0 – 20.0 |
shift | 번호 | 아니 | - | 확산 타임스텝 시프트. 디폴트는 일정을 변경하지 않으며; shorter/punchier 점수는 1.0+로 조정하고, slower/dreamier 결과는 1.0 이하로 조정하세요. |
negative_prompt | 스트링 | 아니 | - | 부정적 프롬프트 - 안티태그, 안티스타일, 배제할 도구. 프롬프트와 같은 쉼표 구분 스타일입니다. |
seed | 정수 | 아니 | - | 재현성을 위한 무작위 시드. 같은 시드 + 동일한 파라미터가 동일한 트랙을 생성합니다. |
format | 열거 | 아니 | "flac" | 응답용 오디오 컨테이너 형식. FLAC = 무손실, WAV = 비압축, MP3 = 작은 파일 크기. · 허용: flac, wav, ogg, mp3 |
response_format | 열거 | 아니 | "url" | 작업자가 오디오를 반환하는 방식. ‘url’은 렌더링된 파일에 서명된 URL을 반환합니다; ‘base64’는 응답에서 바이트를 인라인 처리합니다. · 허용: url, b64_json |
return_base64 | 불리언 | 아니 | 거짓 | 사실일 경우, 응답은 렌더링된 오디오를 URL과 더불어(또는 response_format에 따라 대신) base64로 포함합니다. |