Fugu Ultra

Fugu Ultra
Sakana AI · Text Generation
POST /v1/chat/completions

100만 개의 맥락, 이미지 입력, 웹 검색을 활용해 하드 디론, 코딩, 연구를 위한 프런티어 전문가 모델을 조율하는 다중 에이전트 지휘자입니다.

한눈에

필드가치
모델 IDfugu-ultra
모델 출시일2026-06-21
입력 양상텍스트, 이미지
출력 방식본문
컨텍스트 윈도우1M
무게 정밀도-
최대 출력 토큰131,072
특징추론, 멀티모달, web_search, function_calling, structured_output, agentic_coding, 캐시
원주민 추론아니
신규
지원되는 엔드포인트POST /v1/chat/completions, POST /v1/responses, POST /v1/messages

가격

돌격사양요금
입력1M 프롬프트 토큰당<=272K $7.50; >272K $15.00
출력생성된 토큰 1M 단위<=272K $45.00; >272K $67.50
암묵적 캐시 읽기1M 캐시된 입력 토큰당<=272K $1.50; >272K $3.00

예시 요청

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "fugu-ultra", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수유형필수기본 설정설명
max_tokens정수아니32768최종 답변을 위한 최대 출력 토큰 수. 도체는 작업할 공간이 필요하기 때문에 아주 작은 값으로도 빈 출력을 반환할 수 있습니다. · 사거리: 1 – 131072
reasoning_effort열거아니"high"그 이유는 Fugu Ultra 얼마나 어려운가. 이성은 항상 작동한다. 기본값은 높다; xhigh와 max는 같은 최대 노력(더 철저하고 느리다는 의미)의 별칭입니다. · 허용: high, xhigh, max
tool_web_search불리언아니거짓내장 웹 검색 기능을 활성화하세요. 별도의 수수료는 없습니다; 검색 비용은 요청에 청구되는 오케스트레이션 토큰에 반영됩니다.
tools배열아니[]OpenAI 호환 함수 호출 도구 정의.
tool_choice목적아니-OpenAI 호환 도구 선택 제어.
response_format목적아니-구조화된 출력을 위한 OpenAI 호환 JSON 모드입니다.

주석

Fugu Ultra 다중 에이전트 지휘자로, 각 요청은 전문가 모델들의 풀을 조정하고 그들의 작업을 하나의 답변으로 구성합니다.

지연 시간과 스트리밍

  • 복잡한 질문의 경우 답변이 몇 초에서 몇 분까지 걸릴 수 있습니다.
  • 전체 답변은 모델이 완성되면 토큰 단위가 아니라 한 번에 반환됩니다. 스트리밍은 허용되지만, 스트리밍 토큰이 생성되는 대신 전체 응답을 마지막에 전달합니다.
  • 아주 작은 한계가 답을 잘라내거나 비울 수 있으니 충분한 여유를 max_tokens 두세요.

능력

  • 텍스트와 이미지 입력, 1M 토큰 컨텍스트를 포함합니다.
  • 항상 일종의 추론. 기본값은 하이입니다; xhigh와 max는 같은 최대 노력량입니다.
  • 함수 호출, JSON 모드, 출처를 명시하는 내장 웹 검색(별도 비용 없음).

청구

  • 모델이 내부에서 사용하는 오케스트레이션 토큰을 포함한 전체 토큰 사용량에 대해 청구되므로 짧은 프롬프트에도 일정 비용이 발생합니다.
  • 컨텍스트 티어드: 총 입력 토큰 272,000개 이상의 요청은 표시된 더 높은 비율을 사용합니다.

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/fugu-ultra.