Qwen3 Max Thinking

Qwen3 Max Thinking
Alibaba Cloud · Text Generation
POST /v1/chat/completions

복잡한 작업에서 더 높은 정확도를 위해 적응형 도구 사용(검색, 메모리, 코드 인터프리터)과 테스트 시간 확장 기능을 갖춘 추론 모델.

This model is deprecated and will be retired on 2026-07-08. After that date, requests to this model will fail. Migrate to a successor model before then.

한눈에

필드가치
모델 IDqwen3-max-thinking
모델 출시일2025-09-23
입력 양상본문
출력 방식본문
컨텍스트 윈도우256K
무게 정밀도-
최대 출력 토큰65,536
지역싱가포르
특징추론, code_interpreter, web_search, 사고
원주민 추론아니
신규아니
지원되는 엔드포인트POST /v1/chat/completions, POST /v1/responses, POST /v1/messages
폐기일2026-07-08

가격

돌격사양요금
입력1M 프롬프트 토큰당<=32K $1.08 ($1.20였다); 32K-128K $2.16 (2.40); 128K-256K \2.70 ($3.00)
출력생성된 토큰 1M 단위<=32K $5.52 ($6.00였다); 32K-128K $11.04 (12.00); 128K-256K \13.80 ($15.00)
웹 검색요청에 따라$0.015

예시 요청

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-max-thinking", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수유형필수기본 설정설명
temperature번호아니0.7샘플링 온도. 0 = 결정론적, 2 = 최대 무작위성. · 사거리: 0 – 2
top_p번호아니0.9핵 샘플링 확률 질량. 더 낮은 = 더 집중된 상태입니다. · 사거리: 0 – 1
max_tokens번호아니4096응답에 최대 토큰을 사용하세요. · 거리: 1 – 65536
stop스트링아니-최대 4개의 문자열에서 모델이 더 이상 토큰 생성을 멈춥니다.
enable_thinking불리언아니맞아요확장 사고 모드를 활성화하세요. 느리긴 하지만 추론이 많은 과제를 개선합니다.
tool_web_search불리언아니거짓모델이 필요할 때 웹 검색을 수행할 수 있도록 허용하세요.
web_search_mode열거아니"standard"표준 = 단일 검색, 완전 탐색 = 여러 번의 심층 탐색. · 허용: standard, thorough
tool_code_interpreter불리언아니맞아요모델이 샌드박스에서 파이썬 코드를 실행하여 데이터를 계산하거나 분석할 수 있도록 허용하세요.
tool_web_extractor불리언아니맞아요모델이 발견한 URL에서 콘텐츠를 가져오고 읽을 수 있도록 허용하세요.
disable_formatting불리언아니거짓EmpirioLabs 마크다운 형식(인용 [N] 재작성 + 웹 검색 및 도구 사용 시 참조 차단)은 건너뛰세요. 평범한 [N] 인용이 포함된 원시 상류 답변이 반환됩니다.

주석

웹 검색 모드: 표준(효율적) 또는 철저(포괄적이며 사고가 필요함).

도구별 청구 (usage.tool_usage)

이 모델이 단일 요청 내에서 웹 검색, 코드 인터프리터 등 도구를 호출할 때, 응답은 토큰 수와 함께 정규화된 usage.tool_usage 맵을 포함합니다. 아래 예시는 그 형태를 보여줍니다 - 정확한 필드명, 단위, 그리고 나타나는 도구는 제공자마다 약간 다를 수 있습니다:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

도구 수는 이미 cost_usd에 반영되어 있어 투명성을 위해 표면화되어 있어 도구별 청구를 감사할 수 있습니다. 도구가 호출되지 않았을 때는 필드가 생략됩니다.


Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/qwen3-max-thinking.