Gemma 4 E4B

Gemma 4 E4B
Google · Text Generation
POST /v1/chat/completions

Gemma 4 E4B는 이미지 입력, 함수 호출, 구조화된 출력, 효율적인 명령어 팔로우를 갖춘 Google 개방형 멀티모달 채팅 모델입니다.

한눈에

필드가치
모델 IDgemma-4-e4b
모델 출시일2026-03-31
입력 양상텍스트, 이미지
출력 방식본문
컨텍스트 윈도우8K
무게 정밀도AWQ 4비트
최대 출력 토큰4,096
특징비전, function_calling, structured_output, 이성에 대한 판단
원주민 추론
신규아니
지원되는 엔드포인트POST /v1/chat/completions, POST /v1/responses, POST /v1/messages

가격

돌격사양요금
메시지 하나고정$0.03
웹 검색 (Linkup)호출 시 통화당$0.013

예시 요청

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "gemma-4-e4b", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수유형필수기본 설정설명
temperature번호아니0.7샘플링 온도. 낮은 값은 더 결정론적입니다. · 사거리: 0 – 2
top_p번호아니0.95핵 샘플링 확률 질량. · 사거리: 0 – 1
min_p번호아니0최소 토큰 확률 필터. · 사거리: 0 – 1
max_tokens정수아니4096최대 출력 토큰. · 범위: 1 – 4096
stop스트링아니-한 줄 이상을 지키는 것.
seed정수아니-선택적 결정론적 샘플링 시드. · 사거리: 0 – 2147483647
enable_thinking불리언아니맞아요최종 출력 전에 모델 추론 채널을 활성화하세요.
reasoning_effort열거아니-OpenAI 호환 힌트. 중간과 높은 모드는 사고 모드를 가능하게 합니다. · 허용: low, medium, high
presence_penalty번호아니0이미 등장한 토큰에 페널티를 적용하세요. · 사거리: -2 – 2
frequency_penalty번호아니0반복 토큰은 빈도에 따라 페널티를 받으세요. · 사거리: -2 – 2
repetition_penalty번호아니1정확한 반복 문자를 피하세요. · 사거리: 0.1 – 2
logprobs불리언아니거짓지원되는 경우 토큰 로그 확률을 반환합니다.
top_logprobs정수아니-반환해야 할 대체 토큰 로그 확률 수. · 범위: 0 – 20
tools배열아니-OpenAI 호환 기능 도구 정의.
tool_choice목적아니-OpenAI 호환 기능 도구 선택.
response_format목적아니-구조화된 JSON 출력 명령어.
stream불리언아니거짓서버에서 전송된 이벤트를 이용해 응답 델타를 스트리밍하세요.
web_search_linkup불리언아니거짓Linkup이 제공하는 선택적 웹 검색. 활성화되면 최신 웹 소스를 쿼리로 최신 사용자 메시지를 검색하여 모델에 추가 맥락으로 제공합니다. 모델의 일반 토큰 비용 외에 요청당 고정 $0.013을 추가합니다. 기본적으로 비활성화되어 있습니다.
disable_formatting불리언아니거짓활성화되면 게이트웨이는 Linkup 웹 검색을 사용한 어시스턴트 응답에 “Sources” 풋을 추가하지 않습니다. 모델 출력이 장식이 전혀 예상되지 않는 다른 시스템으로 전송될 때 유용합니다.

주석

텍스트 및 이미지 입력, 스트리밍, 함수 도구, 구조화된 JSON 출력, 시드 제어, 그리고 기본적으로 실행 중인 사고 모드를 지원합니다. 청구는 성공한 메시지마다 이루어집니다.


Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/gemma-4-e4b.