GLM 4.6V Flash

Z.ai · Text Generation
POST /v1/chat/completions이미지, 비디오, 파일, 텍스트 이해를 위한 무료 멀티모달 GLM-4.6V 모델로, 네이티브 함수 호출이 가능합니다.
한눈에
| 필드 | 가치 |
|---|---|
| 모델 ID | glm-4-6v-flash |
| 모델 출시일 | 2025-12-08 |
| 입력 양상 | 텍스트, 이미지, 비디오, 파일 |
| 출력 방식 | 본문 |
| 컨텍스트 윈도우 | 128K |
| 무게 정밀도 | - |
| 최대 출력 토큰 | 32,768 |
| 지역 | 싱가포르 |
| 특징 | 비전, video_understanding, document_understanding, function_calling, structured_output, web_search |
| 원주민 추론 | 아니 |
| 신규 | 네 |
| 지원되는 엔드포인트 | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
가격
| 돌격 | 사양 | 요금 |
|---|---|---|
| 입력 | 1M 프롬프트 토큰당 | 무료 |
| 출력 | 생성된 토큰 1M 단위 | 무료 |
| 암묵적 캐시 읽기 | 1M 캐시된 입력 토큰당 | 무료 |
| 웹 검색 | 활성화된 경우의 요청당 | $0.033 |
예시 요청
$ curl https://api.empiriolabs.ai/v1/chat/completions \ > -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \ > -H 'Content-Type: application/json' \ > -d '{"model": "glm-4-6v-flash", "messages": [{"role":"user","content":"Hello"}]}'
매개변수
| 매개변수 | 유형 | 필수 | 기본 설정 | 설명 |
|---|---|---|---|---|
temperature | 번호 | 아니 | 1 | 샘플링 온도. 낮은 값은 더 결정론적입니다. GLM-4.7-플래시와 GLM-4.6V-플래시는 기본값이 1.0입니다; GLM-4.5-플래시는 기본값이 0.6입니다. · 사거리: 0 – 1 |
top_p | 번호 | 아니 | 0.95 | 핵 샘플링 확률 질량. Z.AI GLM-4.7, GLM-4.6, GLM-4.5 시리즈에 대해 기본값이 0.95임을 문서화하고 있습니다. · 범위: 0.01 – 1 |
max_tokens | 번호 | 아니 | 4096 | GLM-4.6V 플래시 최대 출력 토큰: 32768. · 거리: 1 – 32768 |
stop | 배열 | 아니 | - | 스톱 워드 리스트. Z.AI 현재 배열 형태의 단일 스톱 문자열을 지원합니다. |
do_sample | 불리언 | 아니 | 맞아요 | 샘플링을 활성화하세요. 거짓일 경우 온도와 top_p은 생성에 영향을 미치지 않습니다. |
enable_thinking | 불리언 | 아니 | 맞아요 | 조작 Z.AI 사고 모드. 기본 설정은 활성화되어 있습니다; GLM-4.6V-플래시는 활성화 시 자동으로 사고 여부를 결정합니다. |
thinking | 목적 | 아니 | - | 고급 사고 대상. {“type”:“enabled”} 또는 {“type”:disabled”}를 사용하세요. GLM-4.6V-플래시는 활성화 시 자동으로 사고 여부를 결정합니다. |
response_format | 목적 | 아니 | - | JSON 모드는 {“type”:“json_object”}, 일반 텍스트는 {“type”:“text”}로 설정하세요. |
tools | 배열 | 아니 | - | 기능 도구와 내장 web_search 도구가 지원됩니다. |
tool_choice | 열거 | 아니 | "auto" | 모델이 도구를 사용할 수 있는지 통제합니다. Z.AI 문서 자동 도구 선택; 도구 사용을 비활성화하는 도구는 생략하세요. · 허용 시간: auto |
tool_stream | 불리언 | 아니 | 거짓 | 스트림이 참일 때 스트림 함수-호출 도구 출력. Z.AI GLM-4.6 및 이후 모델에 대한 tool_stream 문서를 제공합니다. |
tool_web_search | 불리언 | 아니 | 거짓 | 내장 웹 검색 기능을 활성화하세요. 활성화되면 요청당 $0.033 개를 추가합니다. |
search_result | 불리언 | 아니 | 맞아요 | 웹 검색이 활성화되면 구조화된 웹 검색 결과 메타데이터를 반환합니다. |
search_prompt | 스트링 | 아니 | - | 검색 결과 요약을 위한 선택적 지침. |
count | 번호 | 아니 | 10 | 검색 결과 수. · 범위: 1 – 50 |
search_domain_filter | 스트링 | 아니 | - | 웹 검색 결과에 대한 선택적 도메인 화이트리스트. |
search_recency_filter | 열거 | 아니 | "noLimit" | 선택 가능한 웹 검색 최근성 창. · 허용: oneDay, oneWeek, oneMonth, oneYear, noLimit |
주석
기본 토큰 사용은 무료입니다. 내장 웹 검색은 tool_web_search 선택 사항이며, 활성화되면 요청당 $0.033 추가 기능이 있습니다.
Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/glm-4-6v-flash.
