GLM TTS

Z.ai · Audio Generation
POST /v1/audio/speechLLM-based text-to-speech with zero-shot voice cloning from 3-10s of audio and emotion-expressive, controllable output via multi-reward RL.
في لمحة
الطباعة
طلب مثال
البارامترات
الحواشي
** الأهداف**
- مدخل ماكس: 000 5 شخص
- التوليد: 5-10 دقائق
** استنساخ صوتي**
- الصوت المرجعي: 3-10 ثوان
- الأشكال المقبولة: WAV, MP3, OGG, FLAC, AAC, M4A, WebM
** أصوات متفرقة**
- emma (English F)
- جيمس (US M)
- (UK M)
- Xiaomei (Chinese F)
- zhigang (Chinese M)
مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/glm-tts.
