Qwen3.7 Plus

Alibaba Cloud · Text Generation
POST /v1/chat/completions텍스트, 이미지, 비디오, 코딩, 도구 사용, GUI 이해, 100만 컨텍스트 워크플로우를 위한 비용 효율적인 Qwen3.7 비전 언어 모델입니다.
한눈에
| 필드 | 가치 |
|---|---|
| 모델 ID | qwen3-7-plus |
| 모델 출시일 | 2026-06-01 |
| 입력 양상 | 텍스트, 이미지, 비디오 |
| 출력 방식 | 본문 |
| 컨텍스트 윈도우 | 1M |
| 무게 정밀도 | - |
| 최대 출력 토큰 | 65,536 |
| 지역 | 싱가포르 |
| 특징 | 추론, 비전, 영상, web_search, code_interpreter, function_calling, structured_output, prefix_continuation, fine_tuning, agentic_coding |
| 원주민 추론 | 아니 |
| 신규 | 네 |
| 지원되는 엔드포인트 | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
가격
| 돌격 | 사양 | 요금 |
|---|---|---|
| 입력 | 1M 프롬프트 토큰당 | <=256K $0.40; 256K-1M $1.20 |
| 출력 | 생성된 토큰 1M 단위 | <=256K $1.60; 256K-1M $4.80 |
| 웹 검색 | 통화당 | $0.03 |
| 이미지 검색 | 통화당 | $0.03 |
예시 요청
$ curl https://api.empiriolabs.ai/v1/chat/completions \ > -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \ > -H 'Content-Type: application/json' \ > -d '{"model": "qwen3-7-plus", "messages": [{"role":"user","content":"Hello"}]}'
매개변수
| 매개변수 | 유형 | 필수 | 기본 설정 | 설명 |
|---|---|---|---|---|
temperature | 번호 | 아니 | 0.7 | 샘플링 온도. 0은 결정론적이고 2는 최대 무작위성입니다. · 사거리: 0 – 2 |
top_p | 번호 | 아니 | 0.9 | 핵 샘플링 확률 질량. 값이 낮을수록 출력이 더 집중됩니다. · 사거리: 0 – 1 |
max_tokens | 번호 | 아니 | 4096 | 최대 출력 토큰. · 거리: 1 – 65536 |
stop | 스트링 | 아니 | - | 최대 4개의 문자열에서 모델이 더 이상 토큰 생성을 멈춥니다. |
enable_thinking | 불리언 | 아니 | 맞아요 | 답변하기 전에 추론을 가능하게 하세요. |
reasoning_effort | 열거 | 아니 | "medium" | 추론 노력 수준. 어떤 것도 사고를 막지 못한다. 로우, 미디엄, 하이, 최대는 선택한 모델에 맞춘 제한된 사고 예산을 설정합니다. · 허용: none, low, medium, high, max |
thinking_budget | 번호 | 아니 | 32768 | 사고할 때 추론용으로 예약된 최대 토큰이 활성화되어 있습니다. · 거리: 1 – 256000 |
response_format | 목적 | 아니 | - | OpenAI 호환 JSON 모드 또는 JSON 스키마 응답 형식. 엄격한 스키마에는 비사고 모드를 사용하세요. |
vl_high_resolution_images | 불리언 | 아니 | 맞아요 | 이미지 입력에는 고해상도 처리를 사용하세요. |
max_pixels | 번호 | 아니 | 2621440 | 고해상도 처리가 비활성화되었을 때 이미지당 최대 픽셀 수. · 거리: 4096 – 16777216 |
video_fps | 번호 | 아니 | 2 | 초당 프레임으로 비디오 입력을 샘플링하는 것. · 범위: 0.1 – 10 |
treat_images_as_video | 불리언 | 아니 | 거짓 | 이미지 연속을 비디오 프레임으로 취급하세요. |
tool_web_search | 불리언 | 아니 | 맞아요 | 실시간 정보를 웹에서 검색하세요. 호출 요청 비용에 $0.03 증가합니다. |
tool_web_extractor | 불리언 | 아니 | 맞아요 | URL에서 콘텐츠를 추출하고 읽으세요. 웹 검색과 사고가 필요합니다. |
tool_code_interpreter | 불리언 | 아니 | 맞아요 | 샌드박스에서 파이썬 코드를 실행하세요. 생각이 필요해. |
tool_web_search_image | 불리언 | 아니 | 맞아요 | 텍스트 설명에서 이미지를 웹에서 검색하세요. 호출 요청 비용에 $0.03 증가합니다. |
tool_image_search | 불리언 | 아니 | 맞아요 | 업로드된 이미지에서 비슷한 이미지를 찾아보세요. 호출 요청 비용에 $0.03 증가합니다. |
disable_formatting | 불리언 | 아니 | 거짓 | 지원되는 경우 EmpirioLabs 소스 포맷 없이 원본 제공자 스타일의 출력을 반환하세요. |
주석
256K 토큰 이상input/output 가격은 3배입니다. 웹 검색, 텍스트-이미지 검색, 이미지-이미지 검색은 호출 시에만 청구됩니다.
텍스트-이미지 검색과 이미지 간 검색은 이미지 검색 가격 행을 사용합니다. 생각하는 토큰은 출력 토큰으로 청구됩니다.
도구별 청구 (usage.tool_usage)
이 모델이 단일 요청 내에서 내장 도구를 호출할 때, 응답은 토큰 수와 함께 정규화된 usage.tool_usage 맵을 포함합니다. 도구 수는 이미 cost_usd에 반영되어 투명성을 위해 표면에 표시되어 있습니다.
변형 모델
:variant1
| 필드 | 가치 |
|---|---|
| 모델 ID | qwen3-7-plus:variant1 |
| 모델 출시일 | 2026-06-01 |
| 지역 | 중국 |
| 컨텍스트 윈도우 | 1M |
| 무게 정밀도 | - |
| 최대 출력 토큰 | 65,536 |
| 특징 | qwen3.7, 추론, 비전, 비디오, web_search, code_interpreter, function_calling, structured_output, prefix_continuation, 캐시, fine_tuning, agentic_coding |
| 원주민 추론 | 아니 |
| 지원되는 엔드포인트 | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
가격 책정
| 돌격 | 사양 | 요금 |
|---|---|---|
| 입력 | 1M 프롬프트 토큰당 | <=256K $0.276 ($0.40였음); 256K-1M $0.826 ($1.20 있었음) |
| 출력 | 생성된 토큰 1M 단위 | <=256K $1.101 ($1.60였음); 256K-1M $3.301 ($4.80 있었음) |
| 암묵적 캐시 입력 | 1M 캐시된 프롬프트 토큰당 | <=256K $0.056 ($0.08였음); 256K-1M $0.166 ($0.24 있었음) |
| 웹 검색 | 통화당 | $0.01 |
| 이미지 검색 | 통화당 | $0.01 |
매개변수
| 매개변수 | 유형 | 필수 | 기본 설정 | 설명 |
|---|---|---|---|---|
temperature | 번호 | 아니 | 0.7 | 샘플링 온도. 0은 결정론적이고 2는 최대 무작위성입니다. · 사거리: 0 – 2 |
top_p | 번호 | 아니 | 0.9 | 핵 샘플링 확률 질량. 값이 낮을수록 출력이 더 집중됩니다. · 사거리: 0 – 1 |
max_tokens | 번호 | 아니 | 4096 | 최대 출력 토큰. · 거리: 1 – 65536 |
stop | 스트링 | 아니 | - | 최대 4개의 문자열에서 모델이 더 이상 토큰 생성을 멈춥니다. |
enable_thinking | 불리언 | 아니 | 맞아요 | 답변하기 전에 추론을 가능하게 하세요. |
reasoning_effort | 열거 | 아니 | "medium" | 추론 노력 수준. 어떤 것도 사고를 막지 못한다. 로우, 미디엄, 하이, 최대는 선택한 모델에 맞춘 제한된 사고 예산을 설정합니다. · 허용: none, low, medium, high, max |
thinking_budget | 번호 | 아니 | 32768 | 사고할 때 추론용으로 예약된 최대 토큰이 활성화되어 있습니다. · 거리: 1 – 256000 |
response_format | 목적 | 아니 | - | OpenAI 호환 JSON 모드 또는 JSON 스키마 응답 형식. 엄격한 스키마에는 비사고 모드를 사용하세요. |
vl_high_resolution_images | 불리언 | 아니 | 맞아요 | 이미지 입력에는 고해상도 처리를 사용하세요. |
max_pixels | 번호 | 아니 | 2621440 | 고해상도 처리가 비활성화되었을 때 이미지당 최대 픽셀 수. · 거리: 4096 – 16777216 |
video_fps | 번호 | 아니 | 2 | 초당 프레임으로 비디오 입력을 샘플링하는 것. · 범위: 0.1 – 10 |
treat_images_as_video | 불리언 | 아니 | 거짓 | 이미지 연속을 비디오 프레임으로 취급하세요. |
tool_web_search | 불리언 | 아니 | 맞아요 | 실시간 정보를 웹에서 검색하세요. 호출 요청 비용에 $0.01 증가합니다. |
tool_web_extractor | 불리언 | 아니 | 맞아요 | URL에서 콘텐츠를 추출하고 읽으세요. 웹 검색과 사고가 필요합니다. |
tool_code_interpreter | 불리언 | 아니 | 맞아요 | 샌드박스에서 파이썬 코드를 실행하세요. 생각이 필요해. |
tool_web_search_image | 불리언 | 아니 | 맞아요 | 텍스트 설명에서 이미지를 웹에서 검색하세요. 호출 요청 비용에 $0.01 증가합니다. |
tool_image_search | 불리언 | 아니 | 맞아요 | 업로드된 이미지에서 비슷한 이미지를 찾아보세요. 호출 요청 비용에 $0.01 증가합니다. |
disable_formatting | 불리언 | 아니 | 거짓 | 지원되는 경우 EmpirioLabs 소스 포맷 없이 원본 제공자 스타일의 출력을 반환하세요. |
Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/qwen3-7-plus.
