OpenAI Whisper 1

OpenAI Whisper 1
OpenAI · Transcription
POST /v1/audio/transcriptions

Whisper-1 speech-to-text 다국어 감독 오디오로 학습된 전사로, 파일당 업로드 제한 25MB가 있습니다.

한눈에

필드가치
모델 IDopenai-whisper-1
모델 출시일2022-09-21
입력 양상오디오
출력 방식본문
컨텍스트 윈도우-
무게 정밀도-
특징전사, speech_to_text
원주민 추론아니
신규아니
지원되는 엔드포인트POST /v1/audio/transcriptions

가격

돌격사양요금
오디오 분당분당$0.030

예시 요청

$curl https://api.empiriolabs.ai/v1/audio/transcriptions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -F model=openai-whisper-1 \
> -F file=@meeting.mp3

매개변수

매개변수유형필수기본 설정설명
file스트링-오디오 파일(멀티파트 업로드) 또는 JSON 경로로 file_url을 사용하는 방법도 있습니다.
file_url스트링아니-오디오 가져오기 위한 공개 URL(파일 업로드 대안).
translate불리언아니거짓만약 그렇다면, /audio/translations로 라우팅해서 원본 언어로 전사하지 않고 영어로 번역하세요.
timestamps불리언아니거짓편의 토글. 만약 참이라면, response_format=verbose_json를 설정하고 단어 수준 timestamp_granularities을 포함합니다.
language스트링아니-선택적으로 ISO-639-1 언어 코드가 제공됩니다. 누락 시 자동 감지. translate=true일 때 무시됩니다.
prompt스트링아니-모델을 편향하기 위한 용어집이나 사전 맥락.
response_format열거아니"json"타임스탬프=참일 때 verbose_json으로 오버라이드됨. · 허용: json, text, srt, verbose_json, vtt
temperature번호아니0.0샘플링 온도. · 사거리: 0 – 1
timestamp_granularities스트링아니-쉼표 구분 목록: 단어, 구절. response_format=verbose_json 때 사용되었습니다.

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/openai-whisper-1.