Qwen3 Max Preview

Qwen3 Max Preview
Alibaba Cloud · Text Generation
POST /v1/chat/completions

2.5 시리즈보다 중국-영어 이해, 복잡한 지시, 다국어 구사력, 도구 사용 능력에서 크게 향상된 미리보기 릴리스.

This model is deprecated and will be retired on 2026-09-08. After that date, requests to this model will fail. Migrate to a successor model before then.

한눈에

필드가치
모델 IDqwen3-max-preview
모델 출시일2025-09-05
입력 양상본문
출력 방식본문
컨텍스트 윈도우256K
무게 정밀도-
최대 출력 토큰65,536
지역싱가포르
특징이유, code_interpreter, web_search
원주민 추론아니
신규아니
지원되는 엔드포인트POST /v1/chat/completions, POST /v1/responses, POST /v1/messages
폐기일2026-09-08

가격

돌격사양요금
입력1M 프롬프트 토큰당<=32K $1.08 ($1.20였다); 32K-128K $2.16 (2.40); 128K-256K \2.70 ($3.00)
출력생성된 토큰 1M 단위<=32K $4.80 ($6.00였다); 32K-128K $9.60 (12.00); 128K-256K \12.00 ($15.00)

예시 요청

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-max-preview", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수유형필수기본 설정설명
temperature번호아니0.7샘플링 온도 · 사거리: 0 – 2
top_p번호아니1.0핵 샘플링 · 사거리: 0 – 1
max_tokens번호아니4096최대 출력 토큰 · 거리: 1 – 65536
frequency_penalty번호아니0토큰을 반복하면 벌칙이 있습니다. >0은 반복을 줄이고, <0은 반복을 장려합니다. · 사거리: -2 – 2
presence_penalty번호아니0새 토큰과 본 토큰에 대한 페널티. >0은 새로운 주제를 장려하고, <0은 주제에 집중하도록 권장합니다. · 사거리: -2 – 2
stop스트링아니-쉼칸 구분 파인 파톱 시퀀스
enable_thinking불리언아니맞아요모델은 step-by-step 생각한 후 대답한다.
tool_code_interpreter불리언아니거짓모델이 파이썬 코드를 작성하고 실행할 수 있도록 허용하세요.
disable_formatting불리언아니거짓EmpirioLabs 마크다운 형식(인용 [N] 재작성 + 웹 검색 및 도구 사용 시 참조 차단)은 건너뛰세요. 평범한 [N] 인용이 포함된 원시 상류 답변이 반환됩니다.

주석

딥 싱킹 + 코드 인터프리터 둘 다 선택 가능한 토글로 제공됩니다.


Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/qwen3-max-preview.