MiMo V2.5 Pro

MiMo V2.5 Pro
Xiaomi · Text Generation
POST /v1/chat/completions

에이전트 워크플로우, 복잡한 소프트웨어 엔지니어링, 장기 작업 작업을 위한 최상위 모델로, 1000+ 개의 도구 호출과 100만 개의 컨텍스트에서 작업을 지속할 수 있습니다.

한눈에

필드가치
모델 IDmimo-v2-5-pro
모델 출시일2026-04-27
입력 양상본문
출력 방식본문
컨텍스트 윈도우1M
무게 정밀도-
최대 출력 토큰128,000
특징추론, 행위적
원주민 추론아니
신규
지원되는 엔드포인트POST /v1/chat/completions, POST /v1/responses, POST /v1/messages

가격

돌격사양요금
입력1M 프롬프트 토큰당$2.175
출력생성된 토큰 1M 단위$4.35
암묵적 캐시 읽기1M 캐시된 입력 토큰당$0.018
웹 검색통화당$0.015

예시 요청

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "mimo-v2-5-pro", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수유형필수기본 설정설명
enable_thinking불리언아니맞아요확장 사고 모드를 활성화하세요. 느리긴 하지만 추론이 많은 과제를 개선합니다.
tool_web_search불리언아니거짓모델이 필요할 때 웹 검색을 수행할 수 있도록 허용하세요.
web_search_force불리언아니거짓모델이 답변하기 전에 항상 웹 검색을 실행하도록 강제하세요.
web_search_max_keyword번호아니3모델이 웹 검색 전반에 걸쳐 사용할 수 있는 최대 키워드 수. · 사거리: 1 – 5
web_search_limit번호아니5모델이 요청당 수행할 수 있는 최대 웹 검색 횟수입니다. · 범위: 1 – 10
temperature번호아니0.7샘플링 온도. 0 = 결정론적, 2 = 최대 무작위성. · 사거리: 0 – 2
top_p번호아니0.9핵 샘플링 확률 질량. 더 낮은 = 더 집중된 상태입니다. · 사거리: 0 – 1
max_tokens번호아니4096응답에 최대 토큰을 사용하세요. · 거리: 1 – 65536
stop스트링아니-최대 4개의 문자열에서 모델이 더 이상 토큰 생성을 멈춥니다.
disable_formatting불리언아니거짓EmpirioLabs 마크다운 형식(인용 [N] 재작성 + 웹 검색 사용 시 참고문헌 블록)은 건너뛰세요. 평범한 [N] 인용이 포함된 원시 상류 답변이 반환됩니다.

주석

웹 검색($0.015/call)은 호출될 때만 요금이 부과됩니다. 캐시된 입력 토큰은 큰 할인 요금으로 청구됩니다. 1000+ 도구 호출을 1000만 개의 컨텍스트에서 수행하는 복잡한 자율 워크플로우를 유지합니다.

도구별 청구 (usage.tool_usage)

이 모델이 단일 요청 내에서 웹 검색, 코드 인터프리터 등 도구를 호출할 때, 응답은 토큰 수와 함께 정규화된 usage.tool_usage 맵을 포함합니다. 아래 예시는 그 형태를 보여줍니다 - 정확한 필드명, 단위, 그리고 나타나는 도구는 제공자마다 약간 다를 수 있습니다:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

도구 수는 이미 cost_usd에 반영되어 있어 투명성을 위해 표면화되어 있어 도구별 청구를 감사할 수 있습니다. 도구가 호출되지 않았을 때는 필드가 생략됩니다.


Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/mimo-v2-5-pro.