MiMo V2.5

Xiaomi · Text Generation
POST /v1/chat/completions100만 맥락에서 네이티브 시각 및 청각 이해를 가진 멀티모달 모델로, 에이전트 워크플로우에서 다양한 모달리즘을 이론하고 행동하도록 설계되었습니다.
한눈에
가격
예시 요청
매개변수
주석
옴니모달 입력(텍스트, 이미지, 비디오, 오디오)과 텍스트 출력. 웹 검색($0.015/call)은 호출될 때만 요금이 부과됩니다. 캐시된 입력 토큰은 큰 할인 요금으로 청구됩니다.
도구별 청구 (usage.tool_usage)
이 모델이 단일 요청 내에서 웹 검색, 코드 인터프리터 등 도구를 호출할 때, 응답은 토큰 수와 함께 정규화된 usage.tool_usage 맵을 포함합니다. 아래 예시는 그 형태를 보여줍니다 - 정확한 필드명, 단위, 그리고 나타나는 도구는 제공자마다 약간 다를 수 있습니다:
도구 수는 이미 cost_usd에 반영되어 있어 투명성을 위해 표면화되어 있어 도구별 청구를 감사할 수 있습니다. 도구가 호출되지 않았을 때는 필드가 생략됩니다.
Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/mimo-v2-5.
