Kimi K2.7 Code Highspeed

Kimi K2.7 Code Highspeed
Moonshot AI · Text Generation
POST /v1/chat/completions

Kimi K2.7 Code Highspeed는 Moonshot의 에이전트 코딩 모델 중 더 빠른 서빙 계층으로, 256K 컨텍스트, 항상 연결된 추론, 이미지 및 비디오 입력을 지원합니다.

한눈에

필드가치
모델 IDkimi-k2-7-code-highspeed
모델 출시일2026-06-16
입력 양상텍스트, 이미지, 비디오
출력 방식본문
컨텍스트 윈도우256K
무게 정밀도-
최대 출력 토큰131,072
특징추론, function_calling, structured_output, 멀티모달, agentic_coding, web_search
원주민 추론아니
신규
지원되는 엔드포인트POST /v1/chat/completions, POST /v1/responses, POST /v1/messages

가격

돌격사양요금
입력1M 프롬프트 토큰당$1.90
출력생성된 토큰 1M 단위$8.00
웹 검색호출 시 통화당$0.015

예시 요청

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "kimi-k2-7-code-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수유형필수기본 설정설명
max_tokens번호아니16384최대 출력 토큰. 추론 토큰은 이 한도에 포함됩니다. · 사거리: 1 – 131072
stop스트링아니-최대 4개의 문자열에서 모델이 더 이상 토큰 생성을 멈춥니다.
response_format목적아니-OpenAI 호환 JSON 모드 또는 JSON 스키마 응답 형식.
tool_web_search불리언아니거짓실시간 정보를 웹에서 검색하세요. 호출된 웹 검색 호출마다 요청 비용이 $0.015 증가합니다.

주석

Kimi K2.7 코드의 더 빠른 서빙 단계입니다. 텍스트, 이미지, 비디오 입력과 256K 컨텍스트, 함수 호출, JSON 모드 구조화 출력, 호출당 $0.015 내장된 웹 검색 기능을 지원합니다. 사고는 항상 켜져 있고 비활성화될 수 없다; 추론 토큰은 출력 토큰으로 청구됩니다. 온도 및 기타 샘플링 오버라이드는 무시되는데, 모델 서비스는 고정된 샘플링 설정을 사용하기 때문입니다. API를 통한 다중 단계 함수 호출은 reasoning_content 필드가 그대로 있는 어시스턴트 메시지를 재생해야 합니다.

도구별 청구 (usage.tool_usage)

이 모델이 단일 요청 내에서 내장 도구를 호출할 때, 응답은 토큰 수와 함께 정규화된 usage.tool_usage 맵을 포함합니다. 도구 수는 이미 cost_usd에 반영되어 투명성을 위해 표면에 표시되어 있습니다.


Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code-highspeed.