GPU Cloud
GPU Cloud يوفر نسخ معالجة رسومات مدارة لخدمة النماذج، أو دفاتر الكتب، أو ComfyUI، أو محطة الويب، أو Ollama، أو صورة CUDA الخاصة بك. يتم حساب الفوترة بالثانية مقابل رصيدك الائتماني. اتصل بأحمال العمل الجارية عبر مسارات API EmpirioLabs المصادقة.
يمكنك إدارة الحالات من صفحة GPU Cloud في لوحة المعلومات أو من خلال واجهة برمجة التطبيقات الموثقة هنا.
كيف يعمل
- ** ضع وحدة حماية عامة** من المدون. كل صف يُظهرُ VRAM، تسعير ساعةِ، والعددِ المتاحِ بالضبط.
- اختر عبء عمل: نموذج منسقا، معرف نموذج Hugging Face، قالب، أو صورة مخصصة ل CUDA Docker.
- ** نشر هذه الحالة**. لوحاتك تظهر الحد الحالي لـ (جي بي يو) لحسابك
- انتظر الاستعداد. تمر مثيلات جديدة عبر
provisioning، ثمloading، ثمrunning. - اتصل عبر واجهة برمجة التطبيقات (API) باستخدام مفتاح واجهة برمجة التطبيقات EmpirioLabs الخاص بك.
- ** توقف أو تدمر** عندما تنتهي. الحالات المُوقفة تُفرج عن الـ (جي بي يو) والقرص الجاهز بينما تحافظ على مواصفات الوزع لبداية جديدة وتُزال باستمرار الحالات المدمرة.
الطباعة والحدود
- وتُدرج الأسعار لكل وحدة من وحدات القطاع العام في الساعة وتُدفع فواتيرها في الثانية.
- يتم تصنيف عمليات نشر وحدات معالجة الرسوميات المتعددة على أنها
listed hourly price x GPU count. - تبدأ الفوترة عندما يصل الإصدار إلى
running. - يتوقّف (بيلينغ) عندما يُتوقّف أو يُدمّر.
- فالنشر والبدء في حالة ما يتطلبان رصيدا ائتمانيا كافيا للنافذة الجارية الأولى.
- وتتوقف الحالات الجارية تلقائيا عندما لا تكون عتبة التوازن كافية.
- GPU Cloud الحدود تعتمد على نطاق الحساب. إعدادات لوحة التحكم تظهر الحد الفعلي لديك.
- ويمكن طلب حجم الأقراص من 100 GB إلى 300 GB.
فجروا الكتالوج
ويعود هذا الدليل إلى البيانات الفوقية والتسعير والتوافر الحالي.
نشر حالة
يبدأ النشر في التوفير ويعيد مثيلا في حالة provisioning. GET /v1/gpu/instances/\{id\} الاستطلاع حتى status running. إذا لم يصبح التخصيص أو الإعداد جاهزا في الوقت المناسب، ينتقل النموذج إلى error ويتم إلغاء التخصيص تلقائيا.
نشر نموذج
مرر template_slug منسقة أو الصق أي معرف مستودع Hugging Face. يتم تقديم عمليات نشر النماذج من نقطة نهاية /v1 متوافقة مع OpenAI على الحالة.
بالنسبة للمستودعات المحجوزة، مرر الرمز في env:
نشر نموذج
النماذج هي ready-to-run بيئات. وتشمل النماذج المتاحة Py Torch + JupyterLab, ComfyUI, Web Terminal, and Ollama.
نشر صورة دوكر
افحصي صورتك الخاصة وقد تفشل الصور الملتقطة من وحدة التصوير المقطعي لأن الوقت الذي يتوقّع أن تكون حاوية متوافقة مع GPU.
دورة الحياة الوظيفية
استخدام refresh لإعادة المركز، stop لإطلاق التخصيصات والتوقف، و start
تدمير الحالة يتوقف عن العمل بشكل دائم ولا يمكن التخلي عنه
الأوضاع
إتّصلْ إلى حالةِ إدارةِ
استخدم نقطة النهاية الخاصة ب Connect مع مفتاح واجهة برمجة التطبيقات EmpirioLabs الخاص بك. يدعم ردود GET، POST، PUT، PATCH، DELETE، وبث العرض.
وللنشر النموذجي، يرجى الاتصال بالنقاط النهائية المتوافقة مع النظام المتكامل على سبيل المثال:
For JupyterLab, ComfyUI, web Terminal, or Ollama, open the instance connect URL from the dashboard or send requests to the relevant connect path.
مطاردة مع نموذج الخاص بك في لوحة المتابعة
عندما تنشرين نموذجاً (أو أيّ حالة تخدم نظاماً متوافقاً مع (إف بي آي)، اللوحة تعطيك صفحة دردشة مبنية حتى تتمكني من تجربة النموذج على الفور دون كتابة أيّ رمز. إفتحي القضية من صفحة GPU Cloud واختيار ** دق مع هذا النموذج**. وصفحة الدردشة تتدفق الردود، وتدعم نظاماً فورياً ومعتاداً لمراقبة أخذ العينات (المؤقتة، من الأعلى إلى الأعلى، من الكسور القصوى)، وتسمح لكم بإلحاق صور أو سمعة للنماذج المتعددة الوسائط. وهو يصطدم بنفس المسار الموثَّق عليه للربط الذي يربطه مكتب التحقيقات الاتحادي، لذا لا توجد مجموعة إضافية ولا توجد فواتير منفصلة: فالحالة قد عُرضت بالفعل في المرتبة الثانية.
SSH and shell access
استخدم قالب Web Terminal عندما تحتاج إلى shell داخل عبء العمل، أو اعرض خدمة HTTP من حاوية مخصصة والوصول إليها عبر /v1/gpu/connect/\{instance_id\}/\{path\}.
سجلات الاستخدام و الفواتير
تظهر لوحة GPU Cloud الإنفاق على التشغيل واستهلاك بطاقة الرسوميات مدى الحياة. تشمل ردود دورة حياة API سعر النسخة، عدد وحدات معالجة الرسوميات، حالة الفوترة، والمبلغ المطلوب حتى تتمكن من التوفيق بين الاستخدام من أنظمتك الخاصة.
