Gemma 4 E4B | EmpirioLabs AI Docs

Google · Text Generation

POST /v1/chat/completions

Gemma 4 E4B는 이미지 입력, 함수 호출, 구조화된 출력, 효율적인 명령어 팔로우를 갖춘 Google 개방형 멀티모달 채팅 모델입니다.

한눈에

필드	가치
모델 ID	`gemma-4-e4b`
모델 출시일	2026-03-31
입력 양상	텍스트, 이미지
출력 방식	본문
컨텍스트 윈도우	8K
무게 정밀도	AWQ 4비트
최대 출력 토큰	4,096
특징	비전, function_calling, structured_output, 이성에 대한 판단
원주민 추론	네
신규	아니
지원되는 엔드포인트	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

가격

돌격	사양	요금
메시지 하나	고정	$0.03
웹 검색 (Linkup)	호출 시 통화당	$0.013

예시 요청

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "gemma-4-e4b", "messages": [{"role":"user","content":"Hello"}]}'

매개변수

매개변수	유형	필수	기본 설정	설명
`temperature`	번호	아니	`0.7`	샘플링 온도. 낮은 값은 더 결정론적입니다. · 사거리: 0 – 2
`top_p`	번호	아니	`0.95`	핵 샘플링 확률 질량. · 사거리: 0 – 1
`min_p`	번호	아니	`0`	최소 토큰 확률 필터. · 사거리: 0 – 1
`max_tokens`	정수	아니	`4096`	최대 출력 토큰. · 범위: 1 – 4096
`stop`	스트링	아니	-	한 줄 이상을 지키는 것.
`seed`	정수	아니	-	선택적 결정론적 샘플링 시드. · 사거리: 0 – 2147483647
`enable_thinking`	불리언	아니	맞아요	최종 출력 전에 모델 추론 채널을 활성화하세요.
`reasoning_effort`	열거	아니	-	OpenAI 호환 힌트. 중간과 높은 모드는 사고 모드를 가능하게 합니다. · 허용: `low`, `medium`, `high`
`presence_penalty`	번호	아니	`0`	이미 등장한 토큰에 페널티를 적용하세요. · 사거리: -2 – 2
`frequency_penalty`	번호	아니	`0`	반복 토큰은 빈도에 따라 페널티를 받으세요. · 사거리: -2 – 2
`repetition_penalty`	번호	아니	`1`	정확한 반복 문자를 피하세요. · 사거리: 0.1 – 2
`logprobs`	불리언	아니	거짓	지원되는 경우 토큰 로그 확률을 반환합니다.
`top_logprobs`	정수	아니	-	반환해야 할 대체 토큰 로그 확률 수. · 범위: 0 – 20
`tools`	배열	아니	-	OpenAI 호환 기능 도구 정의.
`tool_choice`	목적	아니	-	OpenAI 호환 기능 도구 선택.
`response_format`	목적	아니	-	구조화된 JSON 출력 명령어.
`stream`	불리언	아니	거짓	서버에서 전송된 이벤트를 이용해 응답 델타를 스트리밍하세요.
`web_search_linkup`	불리언	아니	거짓	Linkup이 제공하는 선택적 웹 검색. 활성화되면 최신 웹 소스를 쿼리로 최신 사용자 메시지를 검색하여 모델에 추가 맥락으로 제공합니다. 모델의 일반 토큰 비용 외에 요청당 고정 $0.013을 추가합니다. 기본적으로 비활성화되어 있습니다.
`disable_formatting`	불리언	아니	거짓	활성화되면 게이트웨이는 Linkup 웹 검색을 사용한 어시스턴트 응답에 “Sources” 풋을 추가하지 않습니다. 모델 출력이 장식이 전혀 예상되지 않는 다른 시스템으로 전송될 때 유용합니다.

주석

텍스트 및 이미지 입력, 스트리밍, 함수 도구, 구조화된 JSON 출력, 시드 제어, 그리고 기본적으로 실행 중인 사고 모드를 지원합니다. 청구는 성공한 메시지마다 이루어집니다.

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/gemma-4-e4b.