Qwen3.7 Max | EmpirioLabs AI Docs

POST /v1/chat/completions

Qwen3.7 Max는 코딩, 생산성, 장기 실행 에이전트, 심층 사고, 도구, 그리고 1M 토큰 컨텍스트를 위한 대표적인 텍스트 모델입니다.

한눈에

필드	가치
모델 ID	`qwen3-7-max`
모델 출시일	2026-05-21
입력 양상	본문
출력 방식	본문
컨텍스트 윈도우	1M
무게 정밀도	-
최대 출력 토큰	65,536
지역	싱가포르
특징	추론, web_search, code_interpreter, function_calling, agentic_coding
원주민 추론	아니
신규	네
지원되는 엔드포인트	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

가격

돌격	사양	요금
입력	1M 프롬프트 토큰당	$2.50
출력	생성된 토큰 1M 단위	$7.50
웹 검색	호출 시 통화당	$0.02
웹 추출기	호출 시 통화당	$0.02
코드 인터프리터	호출 시 통화당	$0.02

예시 요청

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-7-max", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수	유형	필수	기본 설정	설명
`temperature`	번호	아니	`0.7`	샘플링 온도. 0은 결정론적이고 2는 최대 무작위성입니다. · 사거리: 0 – 2
`top_p`	번호	아니	`0.9`	핵 샘플링 확률 질량. 값이 낮을수록 출력이 더 집중됩니다. · 사거리: 0 – 1
`max_tokens`	번호	아니	`4096`	최대 출력 토큰. · 거리: 1 – 65536
`stop`	스트링	아니	-	최대 4개의 문자열에서 모델이 더 이상 토큰 생성을 멈춥니다.
`enable_thinking`	불리언	아니	맞아요	답변하기 전에 추론을 가능하게 하세요.
`reasoning_effort`	열거	아니	`"medium"`	추론 노력 수준. 어떤 것도 사고를 막지 못한다. 로우, 미디엄, 하이, 최대는 선택한 모델에 맞춘 제한된 사고 예산을 설정합니다. · 허용: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	번호	아니	`32768`	사고할 때 추론용으로 예약된 최대 토큰이 활성화되어 있습니다. · 사거리: 1 – 64000
`tool_web_search`	불리언	아니	거짓	실시간 정보를 웹에서 검색하세요. 호출된 웹 검색 호출마다 요청 비용이 $0.02 증가합니다.
`tool_web_extractor`	불리언	아니	거짓	URL에서 콘텐츠를 추출하고 읽으세요. 웹 검색과 사고가 필요합니다. 각 호출된 웹 추출기 호출마다 요청 비용이 $0.02 증가합니다.
`tool_code_interpreter`	불리언	아니	거짓	샌드박스에서 파이썬 코드를 실행하세요. 생각이 필요해. 호출된 코드 인터프리터 호출마다 요청 비용이 $0.02 증가합니다.
`disable_formatting`	불리언	아니	거짓	지원되는 경우 EmpirioLabs 소스 포맷 없이 원본 제공자 스타일의 출력을 반환하세요.

주석

텍스트 입력만 가능합니다. 웹 검색, 웹 추출기, 코드 인터프리터는 tool_* 매개변수를 통해 노출되는 선택 내장 도구입니다. 내장된 툴 호출은 호출 시 $0.02을 추가합니다. 생각하는 토큰은 출력 토큰으로 청구됩니다.

도구별 청구 (usage.tool_usage)

이 모델이 단일 요청 내에서 내장 도구를 호출할 때, 응답은 토큰 수와 함께 정규화된 usage.tool_usage 맵을 포함합니다. 도구 수는 이미 cost_usd에 반영되어 투명성을 위해 표면에 표시되어 있습니다.

변형 모델

`:variant1`

필드	가치
모델 ID	`qwen3-7-max:variant1`
모델 출시일	2026-05-21
지역	중국
컨텍스트 윈도우	1M
무게 정밀도	-
최대 출력 토큰	65,536
특징	추론, web_search, code_interpreter, function_calling, agentic_coding
원주민 추론	아니
지원되는 엔드포인트	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

가격 책정

돌격	사양	요금
입력	1M 프롬프트 토큰당	$1.65 ($2.50였다)
출력	생성된 토큰 1M 단위	$4.951 ($7.50였다)
웹 검색	호출 시 통화당	$0.01
웹 추출기	호출 시 통화당	$0.01
코드 인터프리터	호출 시 통화당	$0.01

매개변수

매개변수	유형	필수	기본 설정	설명
`temperature`	번호	아니	`0.7`	샘플링 온도. 0은 결정론적이고 2는 최대 무작위성입니다. · 사거리: 0 – 2
`top_p`	번호	아니	`0.9`	핵 샘플링 확률 질량. 값이 낮을수록 출력이 더 집중됩니다. · 사거리: 0 – 1
`max_tokens`	번호	아니	`4096`	최대 출력 토큰. · 거리: 1 – 65536
`stop`	스트링	아니	-	최대 4개의 문자열에서 모델이 더 이상 토큰 생성을 멈춥니다.
`enable_thinking`	불리언	아니	맞아요	답변하기 전에 추론을 가능하게 하세요.
`reasoning_effort`	열거	아니	`"medium"`	추론 노력 수준. 어떤 것도 사고를 막지 못한다. 로우, 미디엄, 하이, 최대는 선택한 모델에 맞춘 제한된 사고 예산을 설정합니다. · 허용: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	번호	아니	`32768`	사고할 때 추론용으로 예약된 최대 토큰이 활성화되어 있습니다. · 사거리: 1 – 64000
`tool_web_search`	불리언	아니	거짓	실시간 정보를 웹에서 검색하세요. 호출된 웹 검색 호출마다 요청 비용이 $0.01 증가합니다.
`tool_web_extractor`	불리언	아니	거짓	URL에서 콘텐츠를 추출하고 읽으세요. 웹 검색과 사고가 필요합니다. 각 호출된 웹 추출기 호출마다 요청 비용이 $0.01 증가합니다.
`tool_code_interpreter`	불리언	아니	거짓	샌드박스에서 파이썬 코드를 실행하세요. 생각이 필요해. 호출된 코드 인터프리터 호출마다 요청 비용이 $0.01 증가합니다.
`disable_formatting`	불리언	아니	거짓	지원되는 경우 EmpirioLabs 소스 포맷 없이 원본 제공자 스타일의 출력을 반환하세요.

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/qwen3-7-max.