SVI 2.0 Pro

SVI 2.0 Pro
VITA-Group / EPFL · Video Generation
POST /v1/videos/generations

WAN 2.2의 Stable Video Infinity 2.0 Pro: 정지 이미지를 이론상 무한 길이의 비디오로 확장하면서 문자 ID를 일관되게 유지합니다.

한눈에

필드가치
모델 IDsvi-2-0-pro
모델 출시일2025-12-26
입력 양상텍스트, 이미지
출력 방식비디오
컨텍스트 윈도우-
무게 정밀도혼합 FP8/BF16/FP16
특징infinite_length, character_consistency
원주민 추론
신규아니
지원되는 엔드포인트POST /v1/videos/generations

가격

돌격사양요금
480p 비디오초당$0.057
720p 비디오초당$0.17
T2V 패스트추가 요금$0.065
T2V 품질추가 요금$0.13

예시 요청

$curl https://api.empiriolabs.ai/v1/videos/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "svi-2-0-pro", "prompt": "sunrise over the ocean", "duration": 6}'

매개변수

매개변수유형필수기본 설정설명
resolution열거아니"832x480"480p는 빠르고; 720p는 느리지만 선명합니다. · 허용: 832x480, 480x832, 720x1280, 1280x720
duration번호아니18예상 탄창 길이는 초 단위입니다. · 범위: 18 – 121.5
cfg번호아니1.0신속한 준수 강화. · 범위: 1.0 – 2.0
negative_prompt스트링아니"vibrant tone, overexposed, static, blurry details, subtitles, style, artwork, painting, picture, still, overall gray, worst quality, low quality, JPEG compression residue, ugly, incomplete, extra fingers, poorly drawn hands, poorly drawn face, deformed, disfigured, malformed limbs, fused fingers, still picture, messy background, three legs, background crowd, walking backwards"피해야 할 것들을 설명하는 텍스트.
t2v_quality열거아니"quality"텍스트-비디오 파이프라인 계층입니다. ‘품질’은 더 높은 충실도를 위해 Wan 2.2 plus 참조 이미지 모델을 사용합니다; ‘Fast’는 더 저렴하고 빠른 세대를 위해 플래시 모델을 사용합니다. text-to-video 모드에서만 적용되며(image-to-video 이 단계를 건너뛰는 경우) · 허용: fast, quality

주석

이론적으로는 일관된 문자 ID를 가진 무한 길이의 비디오입니다. 이미지-비디오는 일반적으로 text-to-video보다 더 우수한 결과를 제공합니다.

제약 조건

  • 긴 영상의 경우 생성 시간이 45+분이 걸릴 수 있습니다
  • 최고의 동작을 위해: 프롬프트에서 각 세그먼트별로 연속된 행동을 설명하세요

이미지 포맷

  • JPG, JPEG, PNG, WEBP, HEIC, HEIF, BMP, TIFF, TIF

멀티씬 모드

  • 한 프롬프트에서 여러 장면을 설명할 때, 낮은 CFG(1.0-1.3)는 모델이 서로 다른 장면 전환을 해석할 수 있는 더 큰 자유를 줍니다
  • 각 장면이 문자 그대로 안내를 따라야 할 때 CFG 상승(1.5-2.0)을 올리세요

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/svi-2-0-pro.