MiniMax M2.7 Highspeed

MiniMax M2.7 Highspeed
MiniMax · Text Generation
POST /v1/chat/completions

고속 M2.7 변형으로, 강력한 범용 성능과 강력한 에이전트 능력을 갖춘 고속 추론을 위해 조정되었습니다.

한눈에

필드가치
모델 IDminimax-m2-7-highspeed
모델 출시일2026-03-18
입력 양상본문
출력 방식본문
컨텍스트 윈도우200K
무게 정밀도-
최대 출력 토큰32,768
지역싱가포르
특징이유
원주민 추론아니
신규아니
지원되는 엔드포인트POST /v1/chat/completions, POST /v1/responses, POST /v1/messages

가격

돌격사양요금
입력1M 프롬프트 토큰당$0.30 ($0.60였다)
출력생성된 토큰 1M 단위$1.20 ($2.40였다)
암묵적 캐시 읽기1M 캐시된 입력 토큰당$0.03 ($0.06였다)
웹 검색 (Linkup)호출 시 통화당$0.013

예시 요청

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "minimax-m2-7-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수유형필수기본 설정설명
temperature번호아니1.0샘플링 온도. 0 = 결정론적, 2 = 최대 무작위성. · 사거리: 0 – 2
top_p번호아니0.95핵 샘플링 확률 질량. 더 낮은 = 더 집중된 상태입니다. · 사거리: 0 – 1
max_tokens번호아니4096응답에 최대 토큰을 사용하세요. · 사거리: 1 – 131072
stop스트링아니-최대 4개의 문자열에서 모델이 더 이상 토큰 생성을 멈춥니다.
tools배열아니-OpenAI 스타일의 함수 호출 도구 정의. 각 항목에는 이름, 설명, 매개변수가 있습니다.
tool_choice스트링아니-자동 | 없어 | 필수 | {type:function, function:{name:”…”}}. 모델이 도구를 호출해야 할 때를 제어합니다.
web_search_linkup불리언아니거짓Linkup이 제공하는 선택적 웹 검색. 활성화되면 최신 웹 소스를 쿼리로 최신 사용자 메시지를 검색하여 모델에 추가 맥락으로 제공합니다. 모델의 일반 토큰 비용 외에 요청당 고정 $0.013을 추가합니다. 기본적으로 비활성화되어 있습니다.
disable_formatting불리언아니거짓활성화되면 게이트웨이는 Linkup 웹 검색을 사용한 어시스턴트 응답에 “Sources” 풋을 추가하지 않습니다. 모델 출력이 장식이 전혀 예상되지 않는 다른 시스템으로 전송될 때 유용합니다.

주석

출력이 100~100 MHz인 M2.7과 동일한 프론티어 성능tokens/sec. 교차 사고는 항상 켜져 있습니다(토글 없음).


Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/minimax-m2-7-highspeed.