Seed 2.0 Mini

Seed 2.0 Mini
ByteDance · Text Generation
POST /v1/chat/completions

Latenzorientiertes multimodales Modell mit 256K Kontext, vier Denkaufwandsmodi und image/video Verständnis für die Nutzung mit hoher Nebenläufigkeit.

Auf einen Blick

SpielfeldWert
Modell-IDseed-2-0-mini
Modell-Veröffentlichungsdatum2026-02-14
EingabemodalitätenText, Bild, Video, Dokument
AusgabemodalitätenText
Kontextfenster256.000
Gewichtspräzision-
Maximale Ausgabetoken128,000
RegionMalaysia
MerkmaleVision, Denken
Native SchlussfolgerungNein
NeuNein
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token<=128K $0.12; 128K-256K $0.24\
Ausgabepro 1 Million generierter Token<=128K $0.50; 128K-256K $1.00\

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "seed-2-0-mini", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein0.7Probenahmetemperatur · Reichweite: 0 – 2
top_pAnzahlNein1.0Kernprobennahme · Reichweite: 0 – 1
max_tokensAnzahlNein4096Maximale Ausgabetoken · Reichweite: 1 – 65536
frequency_penaltyAnzahlNein0Strafe für wiederholte Tokens. >0 reduziert die Wiederholung, <0 fördert sie. · Reichweite: -2 – 2
presence_penaltyAnzahlNein0Strafe für neue vs. gesehene Token. >0 fördert neue Themen, <0 ermutigt, beim Thema zu bleiben. · Reichweite: -2 – 2
stopStringNein-Komma-separierte Stop-Sequenzen
enable_thinkingBooleanNeinStimmtAktiviere den Modus für tiefes Denken und Denken.
reasoning_effortENUMNein"medium"Argumentationsaufwand-Stufe. Benutze enable_thinking=falsch, um das Schließen komplett zu deaktivieren. · Erlaubt: low, medium, high
enable_web_searchBooleanNeinfalschAktivieren Sie die BytePlus Ark MCP-Websuche.
enable_cachingBooleanNeinfalschCachet das Prompt-Präfix für ~10 Minuten, damit Folgeanfragen es wiederverwenden können, und zahlt weniger Eingabetoken für den zwischengespeicherten Teil.
image_detailENUMNein"high"Bildqualitätsstufe für Visionseingaben. · Erlaubt: low, high, xhigh
video_fpsAnzahlNein-Bilder pro Sekunde, extrahiert aus dem Videoeingang. · Reichweite: 0,2 – 5

Anmerkungen

Die Preisgestaltung ist 2x, wenn Eingabetoken >=128K. Temperatur und top_p sind serverfest (Temperatur=1, top_p=0,95), unabhängig vom Clientwert.

Pro-Werkzeug-Abrechnung (usage.tool_usage)

Wenn dieses Modell in einer einzigen Anfrage eingebaute Werkzeuge (Websuche, Code-Interpreter usw.) aufruft, trägt die Antwort eine normalisierte usage.tool_usage Map zusammen mit den Token-Zählen. Das untenstehende Beispiel zeigt die Form – genaue Feldnamen, Einheiten und welche Werkzeuge erscheinen, können je nach Anbieter leicht variieren:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

Die Anzahl der Werkzeuge ist bereits in cost_usd einbezogen – sie sind zur Transparenz sichtbar, damit man die Rechnungsabrechnung pro Tool prüfen kann. Das Feld wird weggelassen, wenn keine Werkzeuge aktiviert wurden.


Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/seed-2-0-mini.