Gemini 3.1 Flash TTS

Google · Audio Generation
POST /v1/audio/speechTTS عالية السيطرة مع تاجز الصوتية الجديدة لأسلوب دقيق، نبرة، سرعة، تسليم عبر التخدير، مساعدين، وأجهزة الصوت.
في لمحة
الطباعة
طلب مثال
البارامترات
الحواشي
معظم الـ (جيميني تي تي تي تي تي تي تي) المتحكم به حتى الآن
** الأهداف**
- النص + الأسلوب السريع: 000 4 بوصة لكل 000 8 نسخة مجتمعة
- الناتج الأقصى: 10 دقائق
- Audio billing: ~25 tokens per second (~15 chars/s)
- اللغة محررة آلياً؛ وضع اللغة هو تلميح وليس قيداً
** بطاقات صوتية خطية** (توصيل المراقبة)
- المشاعر:
[whispers]،[shouts]،[laughs]،[sighs]،[cheerful]،[sad]،[angry]، إلخ. - السرعة:
[slow]،[fast]،[extremely fast]،[normal pace] - توقفات:
[short pause]،[long pause]،[breath] - التأكيد:
[softly]،[loudly]،[high pitch]،[low pitch]،[rising tone]،[falling tone]
مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/gemini-3-1-flash-tts.
