MiniMax M2.7 Highspeed

MiniMax · Text Generation

POST /v1/chat/completions

고속 M2.7 변형으로, 강력한 범용 성능과 강력한 에이전트 능력을 갖춘 고속 추론을 위해 조정되었습니다.

한눈에

필드	가치
모델 ID	`minimax-m2-7-highspeed`
모델 출시일	2026-03-18
입력 양상	본문
출력 방식	본문
컨텍스트 윈도우	200K
무게 정밀도	-
최대 출력 토큰	32,768
지역	싱가포르
특징	이유
원주민 추론	아니
신규	아니
지원되는 엔드포인트	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

가격

돌격	사양	요금
입력	1M 프롬프트 토큰당	$0.30 ($0.60였다)
출력	생성된 토큰 1M 단위	$1.20 ($2.40였다)
암묵적 캐시 읽기	1M 캐시된 입력 토큰당	$0.03 ($0.06였다)
웹 검색 (Linkup)	호출 시 통화당	$0.013

예시 요청

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "minimax-m2-7-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수	유형	필수	기본 설정	설명
`temperature`	번호	아니	`1.0`	샘플링 온도. 0 = 결정론적, 2 = 최대 무작위성. · 사거리: 0 – 2
`top_p`	번호	아니	`0.95`	핵 샘플링 확률 질량. 더 낮은 = 더 집중된 상태입니다. · 사거리: 0 – 1
`max_tokens`	번호	아니	`4096`	응답에 최대 토큰을 사용하세요. · 사거리: 1 – 131072
`stop`	스트링	아니	-	최대 4개의 문자열에서 모델이 더 이상 토큰 생성을 멈춥니다.
`tools`	배열	아니	-	OpenAI 스타일의 함수 호출 도구 정의. 각 항목에는 이름, 설명, 매개변수가 있습니다.
`tool_choice`	스트링	아니	-	자동 \| 없어 \| 필수 \| {type:function, function:{name:”…”}}. 모델이 도구를 호출해야 할 때를 제어합니다.
`web_search_linkup`	불리언	아니	거짓	Linkup이 제공하는 선택적 웹 검색. 활성화되면 최신 웹 소스를 쿼리로 최신 사용자 메시지를 검색하여 모델에 추가 맥락으로 제공합니다. 모델의 일반 토큰 비용 외에 요청당 고정 $0.013을 추가합니다. 기본적으로 비활성화되어 있습니다.
`disable_formatting`	불리언	아니	거짓	활성화되면 게이트웨이는 Linkup 웹 검색을 사용한 어시스턴트 응답에 “Sources” 풋을 추가하지 않습니다. 모델 출력이 장식이 전혀 예상되지 않는 다른 시스템으로 전송될 때 유용합니다.

주석

출력이 100~100 MHz인 M2.7과 동일한 프론티어 성능tokens/sec. 교차 사고는 항상 켜져 있습니다(토글 없음).

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/minimax-m2-7-highspeed.