Fugu Ultra

Sakana AI · Text Generation
POST /v1/chat/completions100만 개의 맥락, 이미지 입력, 웹 검색을 활용해 하드 디론, 코딩, 연구를 위한 프런티어 전문가 모델을 조율하는 다중 에이전트 지휘자입니다.
한눈에
가격
예시 요청
매개변수
주석
Fugu Ultra 다중 에이전트 지휘자로, 각 요청은 전문가 모델들의 풀을 조정하고 그들의 작업을 하나의 답변으로 구성합니다.
지연 시간과 스트리밍
- 복잡한 질문의 경우 답변이 몇 초에서 몇 분까지 걸릴 수 있습니다.
- 전체 답변은 모델이 완성되면 토큰 단위가 아니라 한 번에 반환됩니다. 스트리밍은 허용되지만, 스트리밍 토큰이 생성되는 대신 전체 응답을 마지막에 전달합니다.
- 아주 작은 한계가 답을 잘라내거나 비울 수 있으니 충분한 여유를 max_tokens 두세요.
능력
- 텍스트와 이미지 입력, 1M 토큰 컨텍스트를 포함합니다.
- 항상 일종의 추론. 기본값은 하이입니다; xhigh와 max는 같은 최대 노력량입니다.
- 함수 호출, JSON 모드, 출처를 명시하는 내장 웹 검색(별도 비용 없음).
청구
- 모델이 내부에서 사용하는 오케스트레이션 토큰을 포함한 전체 토큰 사용량에 대해 청구되므로 짧은 프롬프트에도 일정 비용이 발생합니다.
- 컨텍스트 티어드: 총 입력 토큰 272,000개 이상의 요청은 표시된 더 높은 비율을 사용합니다.
Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/fugu-ultra.
