SoulX Podcast | EmpirioLabs AI Docs

Soul AI Lab · Audio Generation

POST /v1/audio/speech

長尺の多話者ポッドキャスト対話のためのオープンソース音声モデルで、パラリンガスティック制御(笑い、ため息)とゼロショット音声クローンを備えています。

一目で

フィールド	価値
モデルID	`soulx-podcast`
モデル発売日	2025-10-29
入力モダリティ	テキスト、音声
出力モダリティ	音声
コンテキストウィンドウ	-
重量精度	-
特徴	voice_cloning、multi_speaker、方言、ポッドキャスト
ネイティブ推論	はい
新作	いいえ
サポート端末	`POST /v1/audio/speech`

価格設定

チャージ	スペック	レート
基地	1,000文字あたり	$0.015
方言	1,000文字あたり	$0.015

例示リクエスト

$ curl https://api.empiriolabs.ai/v1/audio/speech \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "soulx-podcast", "input": "Hello from EmpirioLabs."}'

パラメータ

パラメータ	種類	必須	デフォルト	概要
`input`	ストリング	はい	-	ポッドキャストの台本。マルチスピーカーの場合は、[S1] / [S2] / [S3] / [S4] タグや「Speaker N:」のラインを使いましょう。サポートするパラリンガスティックタグ:<\|笑い声
`voice_model`	エヌム	いいえ	`"base"`	ベース:英語+中国語。方言:四川語、河南語、広東語を加えます。·許可:`base`、`dialect`
`voice_s1`	エヌム	いいえ	`"arthur"`	[S1]の声。lj = エマ。custom_s1voice_s1_audio_urlが必要です。·許可:`arthur`、`james`、`lj`、`xiaomei`、`zhigang`、`custom_s1`
`voice_s2`	エヌム	いいえ	`"lj"`	[シーズン2]の声。lj = エマ。·許可:`arthur`、`james`、`lj`、`xiaomei`、`zhigang`、`custom_s2`
`voice_s3`	エヌム	いいえ	`"james"`	[シーズン3]の声。·許可:`arthur`、`james`、`lj`、`xiaomei`、`zhigang`、`custom_s3`
`voice_s4`	エヌム	いいえ	`"xiaomei"`	[シーズン4]の声。·許可:`arthur`、`james`、`lj`、`xiaomei`、`zhigang`、`custom_s4`
`voice_s1_audio_url`	ストリング	いいえ	-	[S1]カスタムボイスクローンの参考音声URL。話者は同意のフレーズを声に出して言わなければなりません。
`voice_s2_audio_url`	ストリング	いいえ	-	[S2]カスタムボイスクローンの参考音声URL。
`voice_s3_audio_url`	ストリング	いいえ	-	[S3]カスタムボイスクローンの参考音声URL。
`voice_s4_audio_url`	ストリング	いいえ	-	[S4]カスタムボイスクローン用の参考音声URL。
`temperature`	番号	いいえ	`0.6`	サンプリング温度。·射程:0.1 – 2.0
`top_k`	番号	いいえ	`100`	トップkサンプリングキャップ。·射程:1 – 500
`top_p`	番号	いいえ	`0.9`	核サンプリング。·射程:0.1 – 1.0
`repetition_penalty`	番号	いいえ	`1.25`	高い値は繰り返しの表現を抑制します。·範囲:1.0 – 2.0
`seed`	ストリング	いいえ	`"42"`	再現性シード(上流あたりの文字列)。
`output_format`	エヌム	いいえ	`"mp3"`	出力メディアファイル形式(mp3、wav、mp4、png、jpgなど、エンドポイントによって異なります)。·許可:`mp3`、`wav`
`language`	ストリング	いいえ	`""`	ポッドキャストモデルが適切なvoice/dialect層を選べるように、上流(パススルー)に転送します。

注記

長尺の多話者ポッドキャスト対話のためのオープンソース音声モデルで、パラリンガスティック制御とゼロショットボイスクローン機能を備えています。

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/soulx-podcast。