input | 스트링 | 네 | - | 합성할 텍스트. 다중 스피커를 사용할 경우 [S1] / [S2] 태그 또는 ‘Speaker N:’ 라인을 사용하세요. |
voice | 열거 | 아니 | "emma" | emma=영어 여성, james=미국 남성, arthur=미국 남성 대체 문자, xiaomei=중국 여성, zhigang=중국 남성, custom=voice_audio_url 통한 출처 업로드. · 허용: emma, james, arthur, xiaomei, zhigang, custom |
voice_audio_url | 스트링 | 아니 | - | 커스텀 음성 복제를 위한 오디오 URL 참조. 참조 녹음에는 화자가 자신의 목소리로 이 정확한 동의 문구를 낭독하는 내용이 포함되어야 합니다: “나는 합성 음성 생성을 위해 Empirio Labs가 내 목소리를 복제하는 것에 동의합니다. 제 음성 샘플이 개인화된 오디오 콘텐츠를 만드는 데 사용될 것이라고 알고 있습니다.” 문구가 없는 참조 오디오는 거부됩니다. |
output_format | 열거 | 아니 | "mp3" | 출력 미디어 파일 형식(엔드포인트에 따라 mp3, wav, mp4, png, jpg 등)을 선택할 수 있습니다. · 허용: mp3, wav |
speed | 번호 | 아니 | 1.0 | 말하는 속도 배수. · 범위: 0.5 – 2.0 |
model_quality | 열거 | 아니 | "quality" | 퀄리티=FP16(더 좋음), 빠름=INT8(더 빠름) · 허용: quality, fast |
sample_rate | 열거 | 아니 | "24000" | 출력 샘플링 속도 (Hz · 허용: 24000, 16000 |
volume | 번호 | 아니 | 1.0 | 출력 이득 배수기. · 범위: 0.1 – 2.0 |
use_cache | 불리언 | 아니 | 맞아요 | 동일한 세대가 반복되는 속도를 높여줍니다. |
optimize_input | 불리언 | 아니 | 맞아요 | 기술 용어, 약어, 특수 문자의 자동 고정 발음. |
seed | 번호 | 아니 | - | 재현성 시드. |