Qwen3 Max Thinking | EmpirioLabs AI Docs

POST /v1/chat/completions

복잡한 작업에서 더 높은 정확도를 위해 적응형 도구 사용(검색, 메모리, 코드 인터프리터)과 테스트 시간 확장 기능을 갖춘 추론 모델.

This model is deprecated and will be retired on 2026-07-08. After that date, requests to this model will fail. Migrate to a successor model before then.

한눈에

필드	가치
모델 ID	`qwen3-max-thinking`
모델 출시일	2025-09-23
입력 양상	본문
출력 방식	본문
컨텍스트 윈도우	256K
무게 정밀도	-
최대 출력 토큰	65,536
지역	싱가포르
특징	추론, code_interpreter, web_search, 사고
원주민 추론	아니
신규	아니
지원되는 엔드포인트	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`
폐기일	2026-07-08

가격

돌격	사양	요금
입력	1M 프롬프트 토큰당	<=32K $1.08 ($1.20였다); 32K-128K $2.16 ( $2.40); 128K-256K \$ 2.70 ($3.00)
출력	생성된 토큰 1M 단위	<=32K $5.52 ($6.00였다); 32K-128K $11.04 ( $12.00); 128K-256K \$ 13.80 ($15.00)
웹 검색	요청에 따라	$0.015

예시 요청

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-max-thinking", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수	유형	필수	기본 설정	설명
`temperature`	번호	아니	`0.7`	샘플링 온도. 0 = 결정론적, 2 = 최대 무작위성. · 사거리: 0 – 2
`top_p`	번호	아니	`0.9`	핵 샘플링 확률 질량. 더 낮은 = 더 집중된 상태입니다. · 사거리: 0 – 1
`max_tokens`	번호	아니	`4096`	응답에 최대 토큰을 사용하세요. · 거리: 1 – 65536
`stop`	스트링	아니	-	최대 4개의 문자열에서 모델이 더 이상 토큰 생성을 멈춥니다.
`enable_thinking`	불리언	아니	맞아요	확장 사고 모드를 활성화하세요. 느리긴 하지만 추론이 많은 과제를 개선합니다.
`tool_web_search`	불리언	아니	거짓	모델이 필요할 때 웹 검색을 수행할 수 있도록 허용하세요.
`web_search_mode`	열거	아니	`"standard"`	표준 = 단일 검색, 완전 탐색 = 여러 번의 심층 탐색. · 허용: `standard`, `thorough`
`tool_code_interpreter`	불리언	아니	맞아요	모델이 샌드박스에서 파이썬 코드를 실행하여 데이터를 계산하거나 분석할 수 있도록 허용하세요.
`tool_web_extractor`	불리언	아니	맞아요	모델이 발견한 URL에서 콘텐츠를 가져오고 읽을 수 있도록 허용하세요.
`disable_formatting`	불리언	아니	거짓	EmpirioLabs 마크다운 형식(인용 [N] 재작성 + 웹 검색 및 도구 사용 시 참조 차단)은 건너뛰세요. 평범한 [N] 인용이 포함된 원시 상류 답변이 반환됩니다.

주석

웹 검색 모드: 표준(효율적) 또는 철저(포괄적이며 사고가 필요함).

도구별 청구 (usage.tool_usage)

이 모델이 단일 요청 내에서 웹 검색, 코드 인터프리터 등 도구를 호출할 때, 응답은 토큰 수와 함께 정규화된 usage.tool_usage 맵을 포함합니다. 아래 예시는 그 형태를 보여줍니다 - 정확한 필드명, 단위, 그리고 나타나는 도구는 제공자마다 약간 다를 수 있습니다:

1 "usage": {
2   "prompt_tokens": 123,
3   "completion_tokens": 456,
4   "cost_usd": 0.0042,
5   "tool_usage": {"web_search": 3, "code_interpreter": 1}
6 }

도구 수는 이미 cost_usd에 반영되어 있어 투명성을 위해 표면화되어 있어 도구별 청구를 감사할 수 있습니다. 도구가 호출되지 않았을 때는 필드가 생략됩니다.

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/qwen3-max-thinking.