SoulX Podcast

SoulX Podcast
Soul AI Lab · Audio Generation
POST /v1/audio/speech

長尺の多話者ポッドキャスト対話のためのオープンソース音声モデルで、パラリンガスティック制御(笑い、ため息)とゼロショット音声クローンを備えています。

一目で

フィールド価値
モデルIDsoulx-podcast
モデル発売日2025-10-29
入力モダリティテキスト、音声
出力モダリティ音声
コンテキストウィンドウ-
重量精度-
特徴voice_cloning、multi_speaker、方言、ポッドキャスト
ネイティブ推論はい
新作いいえ
サポート端末POST /v1/audio/speech

価格設定

チャージスペックレート
基地1,000文字あたり$0.015
方言1,000文字あたり$0.015

例示リクエスト

$curl https://api.empiriolabs.ai/v1/audio/speech \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "soulx-podcast", "input": "Hello from EmpirioLabs."}'

パラメータ

パラメータ種類必須デフォルト概要
inputストリングはい-ポッドキャストの台本。マルチスピーカーの場合は、[S1] / [S2] / [S3] / [S4] タグや「Speaker N:」のラインを使いましょう。サポートするパラリンガスティックタグ:<|笑い声
voice_modelエヌムいいえ"base"ベース:英語+中国語。方言:四川語、河南語、広東語を加えます。·許可:basedialect
voice_s1エヌムいいえ"arthur"[S1]の声。lj = エマ。custom_s1voice_s1_audio_urlが必要です。·許可:arthurjamesljxiaomeizhigangcustom_s1
voice_s2エヌムいいえ"lj"[シーズン2]の声。lj = エマ。·許可:arthurjamesljxiaomeizhigangcustom_s2
voice_s3エヌムいいえ"james"[シーズン3]の声。·許可:arthurjamesljxiaomeizhigangcustom_s3
voice_s4エヌムいいえ"xiaomei"[シーズン4]の声。·許可:arthurjamesljxiaomeizhigangcustom_s4
voice_s1_audio_urlストリングいいえ-[S1]カスタムボイスクローンの参考音声URL。話者は同意のフレーズを声に出して言わなければなりません。
voice_s2_audio_urlストリングいいえ-[S2]カスタムボイスクローンの参考音声URL。
voice_s3_audio_urlストリングいいえ-[S3]カスタムボイスクローンの参考音声URL。
voice_s4_audio_urlストリングいいえ-[S4]カスタムボイスクローン用の参考音声URL。
temperature番号いいえ0.6サンプリング温度。·射程:0.1 – 2.0
top_k番号いいえ100トップkサンプリングキャップ。·射程:1 – 500
top_p番号いいえ0.9核サンプリング。·射程:0.1 – 1.0
repetition_penalty番号いいえ1.25高い値は繰り返しの表現を抑制します。·範囲:1.0 – 2.0
seedストリングいいえ"42"再現性シード(上流あたりの文字列)。
output_formatエヌムいいえ"mp3"出力メディアファイル形式(mp3、wav、mp4、png、jpgなど、エンドポイントによって異なります)。·許可:mp3wav
languageストリングいいえ""ポッドキャストモデルが適切なvoice/dialect層を選べるように、上流(パススルー)に転送します。

注記

長尺の多話者ポッドキャスト対話のためのオープンソース音声モデルで、パラリンガスティック制御とゼロショットボイスクローン機能を備えています。


Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/soulx-podcast