Kimi K2.6

Kimi K2.6
Moonshot AI · Text Generation
POST /v1/chat/completions

Kimi K2.6은 256K 맥락, 강력한 코딩, 텍스트, 이미지, 비디오 입력을 갖춘 Moonshot 멀티모달 추론 모델입니다.

한눈에

필드가치
모델 IDkimi-k2-6
모델 출시일2026-04-20
입력 양상텍스트, 이미지, 비디오
출력 방식본문
컨텍스트 윈도우256K
무게 정밀도-
최대 출력 토큰16,000
지역중국
특징추론, function_calling, 캐시, 멀티모달
원주민 추론아니
신규
지원되는 엔드포인트POST /v1/chat/completions, POST /v1/responses, POST /v1/messages

가격

돌격사양요금
입력1M 프롬프트 토큰당$0.8939 ($0.95였다)
출력생성된 토큰 1M 단위$3.7131 ($4.00였다)
암묵적 캐시 읽기1M 캐시된 입력 토큰당$0.1788
웹 검색 (Linkup)호출 시 통화당$0.013

예시 요청

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "kimi-k2-6", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수유형필수기본 설정설명
temperature번호아니0.7샘플링 온도. 0 = 결정론적, 2 = 최대 무작위성. · 사거리: 0 – 2
top_p번호아니0.9핵 샘플링 확률 질량. 값이 낮을수록 출력이 더 집중됩니다. · 사거리: 0 – 1
max_tokens번호아니4096최대 출력 토큰. · 범위: 1 – 16000
stop스트링아니-최대 4개의 문자열에서 모델이 더 이상 토큰 생성을 멈춥니다.
enable_thinking불리언아니맞아요답변하기 전에 추론을 가능하게 하세요.
thinking_budget번호아니32768사고할 때 추론용으로 예약된 최대 토큰이 활성화되어 있습니다. · 범위: 1 – 81920
reasoning_effort열거아니"medium"추론 노력 수준. 어떤 것도 사고를 막지 못한다. 로우, 미디엄, 하이, 최대는 선택한 모델에 맞춘 제한된 사고 예산을 설정합니다. OpenAI 스타일의 reasoning_effort 필드로 전송되었고, 모델 서비스에 대한 enable_thinking와 thinking_budget로 번역되었습니다. · 허용: none, low, medium, high, max
web_search_linkup불리언아니거짓Linkup이 제공하는 선택적 웹 검색. 활성화되면 최신 웹 소스를 쿼리로 최신 사용자 메시지를 검색하여 모델에 추가 맥락으로 제공합니다. 모델의 일반 토큰 비용 외에 요청당 고정 $0.013을 추가합니다. 기본적으로 비활성화되어 있습니다.
disable_formatting불리언아니거짓활성화되면 게이트웨이는 Linkup 웹 검색을 사용한 어시스턴트 응답에 “Sources” 풋을 추가하지 않습니다. 모델 출력이 장식이 전혀 예상되지 않는 다른 시스템으로 전송될 때 유용합니다.

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/kimi-k2-6.