Qwen3.6 Flash

Qwen3.6 Flash
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Fast Qwen3.6 에이전트 코딩, 수학 추론, 공간 이해, OCR, 텍스트, 이미지, 비디오 입력을 위한 시각 언어 모델입니다.

한눈에

필드가치
모델 IDqwen3-6-flash
모델 출시일2026-04-16
입력 양상텍스트, 이미지, 비디오
출력 방식본문
컨텍스트 윈도우1M
무게 정밀도-
최대 출력 토큰65,536
지역싱가포르
특징추론, 비전, 영상, web_search, function_calling, structured_output, agentic_coding
원주민 추론아니
신규
지원되는 엔드포인트POST /v1/chat/completions, POST /v1/responses, POST /v1/messages

가격

돌격사양요금
입력1M 프롬프트 토큰당<=256K $0.25; 256K-1M $1.00
출력생성된 토큰 1M 단위<=256K $1.50; 256K-1M $4.00
웹 검색활성화된 쿼리당$0.02

예시 요청

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-6-flash", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수유형필수기본 설정설명
temperature번호아니0.7샘플링 온도. 0은 결정론적이고 2는 최대 무작위성입니다. · 사거리: 0 – 2
top_p번호아니0.9핵 샘플링 확률 질량. 값이 낮을수록 출력이 더 집중됩니다. · 사거리: 0 – 1
max_tokens번호아니4096최대 출력 토큰. · 거리: 1 – 65536
stop스트링아니-최대 4개의 문자열에서 모델이 더 이상 토큰 생성을 멈춥니다.
enable_thinking불리언아니맞아요답변하기 전에 추론을 가능하게 하세요.
reasoning_effort열거아니"medium"추론 노력 수준. 어떤 것도 사고를 막지 못한다. 로우, 미디엄, 하이, 최대는 선택한 모델에 맞춘 제한된 사고 예산을 설정합니다. OpenAI 스타일의 reasoning_effort 필드로 전송되었고, 모델 서비스에 대한 enable_thinking와 thinking_budget로 번역되었습니다. · 허용: none, low, medium, high, max
thinking_budget번호아니32768사고할 때 추론용으로 예약된 최대 토큰이 활성화되어 있습니다. · 사거리: 1 – 64000
response_format목적아니-OpenAI 호환 JSON 모드 또는 JSON 스키마 응답 형식. 엄격한 스키마에는 비사고 모드를 사용하세요.
vl_high_resolution_images불리언아니맞아요이미지 입력에는 고해상도 처리를 사용하세요.
max_pixels번호아니2621440고해상도 처리가 비활성화되었을 때 이미지당 최대 픽셀 수. · 거리: 4096 – 16777216
video_fps번호아니2초당 프레임으로 비디오 입력을 샘플링하는 것. · 범위: 0.1 – 10
tool_web_search불리언아니거짓실시간 정보를 웹에서 검색하세요. 활성화 시 요청 비용이 $0.02 증가합니다.

주석

텍스트, 이미지, 비디오 입력을 지원합니다. 웹 검색은 tool_web_search를 통해 가능하며, 활성화되면 쿼리당 $0.02 항목을 추가합니다. 생각하는 토큰은 출력 토큰으로 청구됩니다. 명시적인 캐시 제어는 지원되지 않습니다.

변형 모델

:variant1

필드가치
모델 IDqwen3-6-flash:variant1
모델 출시일2026-04-16
지역중국
컨텍스트 윈도우1M
무게 정밀도-
최대 출력 토큰65,536
특징추론, 비전, 영상, web_search, function_calling, structured_output, agentic_coding
원주민 추론아니
지원되는 엔드포인트POST /v1/chat/completions, POST /v1/responses, POST /v1/messages

가격 책정

돌격사양요금
입력1M 프롬프트 토큰당<=256K $0.165 ($0.25였음); 256K-1M $0.66 ($1.00 있었음)
출력생성된 토큰 1M 단위<=256K $0.99 ($1.50였음); 256K-1M $3.961 ($4.00 있었음)
웹 검색활성화된 쿼리당$0.01

매개변수

매개변수유형필수기본 설정설명
temperature번호아니0.7샘플링 온도. 0은 결정론적이고 2는 최대 무작위성입니다. · 사거리: 0 – 2
top_p번호아니0.9핵 샘플링 확률 질량. 값이 낮을수록 출력이 더 집중됩니다. · 사거리: 0 – 1
max_tokens번호아니4096최대 출력 토큰. · 거리: 1 – 65536
stop스트링아니-최대 4개의 문자열에서 모델이 더 이상 토큰 생성을 멈춥니다.
enable_thinking불리언아니맞아요답변하기 전에 추론을 가능하게 하세요.
reasoning_effort열거아니"medium"추론 노력 수준. 어떤 것도 사고를 막지 못한다. 로우, 미디엄, 하이, 최대는 선택한 모델에 맞춘 제한된 사고 예산을 설정합니다. OpenAI 스타일의 reasoning_effort 필드로 전송되었고, 모델 서비스에 대한 enable_thinking와 thinking_budget로 번역되었습니다. · 허용: none, low, medium, high, max
thinking_budget번호아니32768사고할 때 추론용으로 예약된 최대 토큰이 활성화되어 있습니다. · 범위: 1 – 128000
response_format목적아니-OpenAI 호환 JSON 모드 또는 JSON 스키마 응답 형식. 엄격한 스키마에는 비사고 모드를 사용하세요.
vl_high_resolution_images불리언아니맞아요이미지 입력에는 고해상도 처리를 사용하세요.
max_pixels번호아니2621440고해상도 처리가 비활성화되었을 때 이미지당 최대 픽셀 수. · 거리: 4096 – 16777216
video_fps번호아니2초당 프레임으로 비디오 입력을 샘플링하는 것. · 범위: 0.1 – 10
tool_web_search불리언아니거짓실시간 정보를 웹에서 검색하세요. 활성화 시 요청 비용이 $0.01 증가합니다.

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/qwen3-6-flash.