OpenAI Whisper 1

OpenAI Whisper 1
OpenAI · Transcription
POST /v1/audio/transcriptions

Whisper-1 speech-to-text transcrição treinada com áudio supervisionado multilíngue, com limite de upload de 25 MB por arquivo.

De um olhar

CampoValor
ID do modeloopenai-whisper-1
Data de lançamento do modelo2022-09-21
Modalidades de entradaÁudio
Modalidades de saídaTexto
Janela de contexto-
Precisão do peso-
Característicastranscrição, speech_to_text
Inferência nativaNão
NovoNão
Endpoints suportadosPOST /v1/audio/transcriptions

Precificação

CargaEspecificaçãoTaxa
Por minuto de áudiopor minuto$0.030

Exemplo de pedido

$curl https://api.empiriolabs.ai/v1/audio/transcriptions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -F model=openai-whisper-1 \
> -F file=@meeting.mp3

Parâmetros

ParâmetroTipoObrigatórioPadrãoDescrição
fileStringsim-Arquivo de áudio (upload em múltiplas partes) OU usar file_url para o caminho JSON.
file_urlStringNão-URL pública para buscar áudio (alternativa ao upload de arquivo).
translateBooleanoNãofalsoSe for verdade, faça roteamento para /audio/translations e traduza para o inglês em vez de transcrever na língua de origem.
timestampsBooleanoNãofalsoOpção de conveniência. Se for verdadeiro, estabelece response_format=verbose_json e inclui timestamp_granularities em nível de palavra.
languageStringNão-Código opcional da língua ISO-639-1. Detectado automaticamente se for omitido. Ignorado quando traduz=verdadeiro.
promptStringNão-Glossário ou contexto prévio para viesar o modelo.
response_formatenumNão"json"Sobrescrito para verbose_json quando timestamps=true. · Permitido: json, text, srt, verbose_json, vtt
temperatureNúmeroNão0.0Temperatura de amostragem. · Intervalo: 0 – 1
timestamp_granularitiesStringNão-Lista separada por vírgula: palavra, segmento. Usado quando response_format=verbose_json.

Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/openai-whisper-1.