Fugu Ultra | EmpirioLabs AI Docs

Sakana AI · Text Generation

POST /v1/chat/completions

100만 개의 맥락, 이미지 입력, 웹 검색을 활용해 하드 디론, 코딩, 연구를 위한 프런티어 전문가 모델을 조율하는 다중 에이전트 지휘자입니다.

한눈에

필드	가치
모델 ID	`fugu-ultra`
모델 출시일	2026-06-21
입력 양상	텍스트, 이미지
출력 방식	본문
컨텍스트 윈도우	1M
무게 정밀도	-
최대 출력 토큰	131,072
특징	추론, 멀티모달, web_search, function_calling, structured_output, agentic_coding, 캐시
원주민 추론	아니
신규	네
지원되는 엔드포인트	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

가격

돌격	사양	요금
입력	1M 프롬프트 토큰당	<=272K $7.50; >272K $15.00
출력	생성된 토큰 1M 단위	<=272K $45.00; >272K $67.50
암묵적 캐시 읽기	1M 캐시된 입력 토큰당	<=272K $1.50; >272K $3.00

예시 요청

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "fugu-ultra", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수	유형	필수	기본 설정	설명
`max_tokens`	정수	아니	`32768`	최종 답변을 위한 최대 출력 토큰 수. 도체는 작업할 공간이 필요하기 때문에 아주 작은 값으로도 빈 출력을 반환할 수 있습니다. · 사거리: 1 – 131072
`reasoning_effort`	열거	아니	`"high"`	그 이유는 Fugu Ultra 얼마나 어려운가. 이성은 항상 작동한다. 기본값은 높다; xhigh와 max는 같은 최대 노력(더 철저하고 느리다는 의미)의 별칭입니다. · 허용: `high`, `xhigh`, `max`
`tool_web_search`	불리언	아니	거짓	내장 웹 검색 기능을 활성화하세요. 별도의 수수료는 없습니다; 검색 비용은 요청에 청구되는 오케스트레이션 토큰에 반영됩니다.
`tools`	배열	아니	`[]`	OpenAI 호환 함수 호출 도구 정의.
`tool_choice`	목적	아니	-	OpenAI 호환 도구 선택 제어.
`response_format`	목적	아니	-	구조화된 출력을 위한 OpenAI 호환 JSON 모드입니다.

주석

Fugu Ultra 다중 에이전트 지휘자로, 각 요청은 전문가 모델들의 풀을 조정하고 그들의 작업을 하나의 답변으로 구성합니다.

지연 시간과 스트리밍

복잡한 질문의 경우 답변이 몇 초에서 몇 분까지 걸릴 수 있습니다.
전체 답변은 모델이 완성되면 토큰 단위가 아니라 한 번에 반환됩니다. 스트리밍은 허용되지만, 스트리밍 토큰이 생성되는 대신 전체 응답을 마지막에 전달합니다.
아주 작은 한계가 답을 잘라내거나 비울 수 있으니 충분한 여유를 max_tokens 두세요.

능력

텍스트와 이미지 입력, 1M 토큰 컨텍스트를 포함합니다.
항상 일종의 추론. 기본값은 하이입니다; xhigh와 max는 같은 최대 노력량입니다.
함수 호출, JSON 모드, 출처를 명시하는 내장 웹 검색(별도 비용 없음).

청구

모델이 내부에서 사용하는 오케스트레이션 토큰을 포함한 전체 토큰 사용량에 대해 청구되므로 짧은 프롬프트에도 일정 비용이 발생합니다.
컨텍스트 티어드: 총 입력 토큰 272,000개 이상의 요청은 표시된 더 높은 비율을 사용합니다.

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/fugu-ultra.