SoulX Podcast

SoulX Podcast
Soul AI Lab · Audio Generation
POST /v1/audio/speech

开源语音模型,用于长格式、多说话播客对话,并具备副语言控制(笑声、叹息)和零帧语音克隆。

一眼看

场地价值
型号IDsoulx-podcast
车型发布日期2025-10-29
输入模态文本,音频
输出模态音频
上下文窗口-
重量精度-
特色voice_cloning、multi_speaker、方言、播客
本土推断是的
支持的端点POST /v1/audio/speech

定价

冲锋规格速率
基地每1000字符$0.015
方言每1000字符$0.015

示例请求

$curl https://api.empiriolabs.ai/v1/audio/speech \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "soulx-podcast", "input": "Hello from EmpirioLabs."}'

参数

参数类型必修默认描述
input是的-播客剧本。多扬声器使用[S1] / [S2] / [S3] / [S4] 标签或“Speaker N:”行。支持的副语言标签:<|笑声|>, <|叹气|>, <|呼吸|>, <|咳嗽|>.
voice_model枚举"base"基础:英语 + 普通话。方言:新增四川语、河南语和粤语。·允许:basedialect
voice_s1枚举"arthur"为[第一季]配音。lj = 艾玛。custom_s1需要voice_s1_audio_url。·允许:arthurjamesljxiaomeizhigangcustom_s1
voice_s2枚举"lj"为[第二季]配音。lj = 艾玛。·允许:arthurjamesljxiaomeizhigangcustom_s2
voice_s3枚举"james"为[第三季]配音。·允许:arthurjamesljxiaomeizhigangcustom_s3
voice_s4枚举"xiaomei"为[第四季]配音。·允许:arthurjamesljxiaomeizhigangcustom_s4
voice_s1_audio_url-[S1] 自定义声音克隆的参考音频链接。发言人必须大声说出同意短语。
voice_s2_audio_url-[S2] 自定义语音克隆的参考音频链接。
voice_s3_audio_url-参考[S3]自定义声音克隆音频链接。
voice_s4_audio_url-[S4] 自定义语音克隆的参考音频链接。
temperature人数0.6采样温度。·范围:0.1 – 2.0
top_k人数100顶K采样上限。·范围:1 – 500
top_p人数0.9核采样。·范围:0.1 – 1.0
repetition_penalty人数1.25高数值则避免重复表达。·范围:1.0 – 2.0
seed"42"可重复性种子(每个上游的字符串)。
output_format枚举"mp3"输出媒体文件格式(mp3、wav、mp4、png、jpg 等,取决于终端)。·允许:mp3wav
language""转发到上游(直通),这样播客模式可以选择合适的voice/dialect层。

注释

开源语音模型,用于长格式、多说话播客对话,具备副语言控制和零样本语音克隆。


Machine可读模式: GET https://api.empiriolabs.ai/v1/models/soulx-podcast