OpenAI Whisper 1 | EmpirioLabs AI Docs

OpenAI · Transcription

POST /v1/audio/transcriptions

Whisper-1 speech-to-text 다국어 감독 오디오로 학습된 전사로, 파일당 업로드 제한 25MB가 있습니다.

한눈에

필드	가치
모델 ID	`openai-whisper-1`
모델 출시일	2022-09-21
입력 양상	오디오
출력 방식	본문
컨텍스트 윈도우	-
무게 정밀도	-
특징	전사, speech_to_text
원주민 추론	아니
신규	아니
지원되는 엔드포인트	`POST /v1/audio/transcriptions`

가격

돌격	사양	요금
오디오 분당	분당	$0.030

예시 요청

$ curl https://api.empiriolabs.ai/v1/audio/transcriptions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -F model=openai-whisper-1 \
>   -F file=@meeting.mp3

매개변수

매개변수	유형	필수	기본 설정	설명
`file`	스트링	네	-	오디오 파일(멀티파트 업로드) 또는 JSON 경로로 file_url을 사용하는 방법도 있습니다.
`file_url`	스트링	아니	-	오디오 가져오기 위한 공개 URL(파일 업로드 대안).
`translate`	불리언	아니	거짓	만약 그렇다면, /audio/translations로 라우팅해서 원본 언어로 전사하지 않고 영어로 번역하세요.
`timestamps`	불리언	아니	거짓	편의 토글. 만약 참이라면, response_format=verbose_json를 설정하고 단어 수준 timestamp_granularities을 포함합니다.
`language`	스트링	아니	-	선택적으로 ISO-639-1 언어 코드가 제공됩니다. 누락 시 자동 감지. translate=true일 때 무시됩니다.
`prompt`	스트링	아니	-	모델을 편향하기 위한 용어집이나 사전 맥락.
`response_format`	열거	아니	`"json"`	타임스탬프=참일 때 verbose_json으로 오버라이드됨. · 허용: `json`, `text`, `srt`, `verbose_json`, `vtt`
`temperature`	번호	아니	`0.0`	샘플링 온도. · 사거리: 0 – 1
`timestamp_granularities`	스트링	아니	-	쉼표 구분 목록: 단어, 구절. response_format=verbose_json 때 사용되었습니다.

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/openai-whisper-1.