Kimi K2.7 Code Highspeed

Moonshot AI · Text Generation

POST /v1/chat/completions

Kimi K2.7 Code Highspeed는 Moonshot의 에이전트 코딩 모델 중 더 빠른 서빙 계층으로, 256K 컨텍스트, 항상 연결된 추론, 이미지 및 비디오 입력을 지원합니다.

한눈에

필드	가치
모델 ID	`kimi-k2-7-code-highspeed`
모델 출시일	2026-06-16
입력 양상	텍스트, 이미지, 비디오
출력 방식	본문
컨텍스트 윈도우	256K
무게 정밀도	-
최대 출력 토큰	131,072
특징	추론, function_calling, structured_output, 멀티모달, agentic_coding, web_search
원주민 추론	아니
신규	네
지원되는 엔드포인트	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

가격

돌격	사양	요금
입력	1M 프롬프트 토큰당	$1.90
출력	생성된 토큰 1M 단위	$8.00
웹 검색	호출 시 통화당	$0.015

예시 요청

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "kimi-k2-7-code-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수	유형	필수	기본 설정	설명
`max_tokens`	번호	아니	`16384`	최대 출력 토큰. 추론 토큰은 이 한도에 포함됩니다. · 사거리: 1 – 131072
`stop`	스트링	아니	-	최대 4개의 문자열에서 모델이 더 이상 토큰 생성을 멈춥니다.
`response_format`	목적	아니	-	OpenAI 호환 JSON 모드 또는 JSON 스키마 응답 형식.
`tool_web_search`	불리언	아니	거짓	실시간 정보를 웹에서 검색하세요. 호출된 웹 검색 호출마다 요청 비용이 $0.015 증가합니다.

주석

Kimi K2.7 코드의 더 빠른 서빙 단계입니다. 텍스트, 이미지, 비디오 입력과 256K 컨텍스트, 함수 호출, JSON 모드 구조화 출력, 호출당 $0.015 내장된 웹 검색 기능을 지원합니다. 사고는 항상 켜져 있고 비활성화될 수 없다; 추론 토큰은 출력 토큰으로 청구됩니다. 온도 및 기타 샘플링 오버라이드는 무시되는데, 모델 서비스는 고정된 샘플링 설정을 사용하기 때문입니다. API를 통한 다중 단계 함수 호출은 reasoning_content 필드가 그대로 있는 어시스턴트 메시지를 재생해야 합니다.

도구별 청구 (usage.tool_usage)

이 모델이 단일 요청 내에서 내장 도구를 호출할 때, 응답은 토큰 수와 함께 정규화된 usage.tool_usage 맵을 포함합니다. 도구 수는 이미 cost_usd에 반영되어 투명성을 위해 표면에 표시되어 있습니다.

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code-highspeed.