GPU Cloud | EmpirioLabs AI Docs

GPU Cloud يوفر نسخ معالجة رسومات مدارة لخدمة النماذج، أو دفاتر الكتب، أو ComfyUI، أو محطة الويب، أو Ollama، أو صورة CUDA الخاصة بك. يتم حساب الفوترة بالثانية مقابل رصيدك الائتماني. اتصل بأحمال العمل الجارية عبر مسارات API EmpirioLabs المصادقة.

يمكنك إدارة الحالات من صفحة GPU Cloud في لوحة المعلومات أو من خلال واجهة برمجة التطبيقات الموثقة هنا.

كيف يعمل

** ضع وحدة حماية عامة** من المدون. كل صف يُظهرُ VRAM، تسعير ساعةِ، والعددِ المتاحِ بالضبط.
اختر عبء عمل: نموذج منسقا، معرف نموذج Hugging Face، قالب، أو صورة مخصصة ل CUDA Docker.
** نشر هذه الحالة**. لوحاتك تظهر الحد الحالي لـ (جي بي يو) لحسابك
انتظر الاستعداد. تمر مثيلات جديدة عبر provisioning، ثم loading، ثم running.
اتصل عبر واجهة برمجة التطبيقات (API) باستخدام مفتاح واجهة برمجة التطبيقات EmpirioLabs الخاص بك.
** توقف أو تدمر** عندما تنتهي. الحالات المُوقفة تُفرج عن الـ (جي بي يو) والقرص الجاهز بينما تحافظ على مواصفات الوزع لبداية جديدة وتُزال باستمرار الحالات المدمرة.

الطباعة والحدود

وتُدرج الأسعار لكل وحدة من وحدات القطاع العام في الساعة وتُدفع فواتيرها في الثانية.
يتم تصنيف عمليات نشر وحدات معالجة الرسوميات المتعددة على أنها listed hourly price x GPU count.
تبدأ الفوترة عندما يصل الإصدار إلى running.
يتوقّف (بيلينغ) عندما يُتوقّف أو يُدمّر.
فالنشر والبدء في حالة ما يتطلبان رصيدا ائتمانيا كافيا للنافذة الجارية الأولى.
وتتوقف الحالات الجارية تلقائيا عندما لا تكون عتبة التوازن كافية.
GPU Cloud الحدود تعتمد على نطاق الحساب. إعدادات لوحة التحكم تظهر الحد الفعلي لديك.
ويمكن طلب حجم الأقراص من 100 GB إلى 300 GB.

فجروا الكتالوج

ويعود هذا الدليل إلى البيانات الفوقية والتسعير والتوافر الحالي.

GET

/v1/gpu/catalog

1 curl https://api.empiriolabs.ai/v1/gpu/catalog

Try it

$ curl https://api.empiriolabs.ai/v1/gpu/catalog

1 {
2   "object": "list",
3   "data": [
4     {
5       "slug": "rtx-4090",
6       "name": "RTX 4090",
7       "vram_gb": 24,
8       "price_hourly": 0.65,
9       "available": true,
10       "available_count": 21,
11       "max_gpus": 8,
12       "regions": ["US", "EU"]
13     }
14   ]
15 }

GET

/v1/gpu/catalog/:slug

1 curl https://api.empiriolabs.ai/v1/gpu/catalog/rtx-4090

Try it

نشر حالة

يبدأ النشر في التوفير ويعيد مثيلا في حالة provisioning. GET /v1/gpu/instances/\{id\} الاستطلاع حتى status running. إذا لم يصبح التخصيص أو الإعداد جاهزا في الوقت المناسب، ينتقل النموذج إلى error ويتم إلغاء التخصيص تلقائيا.

POST

/v1/gpu/instances

1 curl -X POST https://api.empiriolabs.ai/v1/gpu/instances \
2      -H "Authorization: Bearer <token>" \
3      -H "Content-Type: application/json" \
4      -d '{
5   "gpu_slug": "rtx-4090"
6 }'

Try it

نشر نموذج

مرر template_slug منسقة أو الصق أي معرف مستودع Hugging Face. يتم تقديم عمليات نشر النماذج من نقطة نهاية /v1 متوافقة مع OpenAI على الحالة.

$ curl https://api.empiriolabs.ai/v1/gpu/instances \
>   -H "Authorization: Bearer $EMPIRIOLABS_API_KEY" \
>   -H "Content-Type: application/json" \
>   -d '{
>     "gpu_slug": "rtx-4090",
>     "mode": "model",
>     "hf_id": "Qwen/Qwen2.5-7B-Instruct"
>   }'

بالنسبة للمستودعات المحجوزة، مرر الرمز في env:

1 {
2   "gpu_slug": "a100-80gb",
3   "mode": "model",
4   "hf_id": "meta-llama/Llama-3.1-8B-Instruct",
5   "env": { "HF_TOKEN": "hf_..." }
6 }

نشر نموذج

النماذج هي ready-to-run بيئات. وتشمل النماذج المتاحة Py Torch + JupyterLab, ComfyUI, Web Terminal, and Ollama.

$ curl https://api.empiriolabs.ai/v1/gpu/instances \
>   -H "Authorization: Bearer $EMPIRIOLABS_API_KEY" \
>   -H "Content-Type: application/json" \
>   -d '{
>     "gpu_slug": "rtx-4090",
>     "mode": "template",
>     "template_slug": "pytorch-jupyter",
>     "disk_gb": 150
>   }'

نشر صورة دوكر

افحصي صورتك الخاصة وقد تفشل الصور الملتقطة من وحدة التصوير المقطعي لأن الوقت الذي يتوقّع أن تكون حاوية متوافقة مع GPU.

$ curl https://api.empiriolabs.ai/v1/gpu/instances \
>   -H "Authorization: Bearer $EMPIRIOLABS_API_KEY" \
>   -H "Content-Type: application/json" \
>   -d '{
>     "gpu_slug": "rtx-4090",
>     "mode": "custom",
>     "image": "pytorch/pytorch:2.4.0-cuda12.1-cudnn9-runtime",
>     "ports": [8000],
>     "disk_gb": 150,
>     "env": { "MY_VAR": "value" }
>   }'

دورة الحياة الوظيفية

GET

/v1/gpu/instances

1 curl https://api.empiriolabs.ai/v1/gpu/instances \
2      -H "Authorization: Bearer <token>" \
3      -H "Content-Type: application/json"

Try it

GET

/v1/gpu/instances/:instance_id

1 curl https://api.empiriolabs.ai/v1/gpu/instances/instance_id \
2      -H "Authorization: Bearer <token>" \
3      -H "Content-Type: application/json"

Try it

POST

/v1/gpu/instances/:instance_id/:action

1 curl -X POST https://api.empiriolabs.ai/v1/gpu/instances/instance_id/stop \
2      -H "Authorization: Bearer <token>" \
3      -H "Content-Type: application/json" \
4      -d '{}'

Try it

استخدام refresh لإعادة المركز، stop لإطلاق التخصيصات والتوقف، و start

$ curl -X POST https://api.empiriolabs.ai/v1/gpu/instances/$ID/stop \
>   -H "Authorization: Bearer $EMPIRIOLABS_API_KEY"

DELETE

/v1/gpu/instances/:instance_id

1 curl -X DELETE https://api.empiriolabs.ai/v1/gpu/instances/instance_id \
2      -H "Authorization: Bearer <token>" \
3      -H "Content-Type: application/json" \
4      -d '{}'

Try it

تدمير الحالة يتوقف عن العمل بشكل دائم ولا يمكن التخلي عنه

الأوضاع

الحالة	معنى
`provisioning`	ويجري تخصيص القدرات.
`loading`	إن عبء العمل يبدأ أو يدفئ.
`running`	وعبء العمل يمكن الوصول إليه من خلال طريق الاتصال وفواتير العمل نشطة.
`stopping`	ويجري تطبيق عملية وقف أو تدمير.
`stopped`	فواتير GPU متوقفة. ابدأي بنقل المواصفات المنقذة بواسطة أقراص جديدة
`error`	وفشلت عملية توفير أو تجهيز الوقت، أو لم يكتمل تخصيصها في الوقت المناسب. ويمكن أن تُنعش الحالة أو تُدمر.
`destroyed`	وقد أُزيلت القضية بصورة دائمة.

إتّصلْ إلى حالةِ إدارةِ

استخدم نقطة النهاية الخاصة ب Connect مع مفتاح واجهة برمجة التطبيقات EmpirioLabs الخاص بك. يدعم ردود GET، POST، PUT، PATCH، DELETE، وبث العرض.

GET

/v1/gpu/connect/:instance_id/:path

1 curl https://api.empiriolabs.ai/v1/gpu/connect/instance_id/v1%2Fchat%2Fcompletions \
2      -H "Authorization: Bearer <token>" \
3      -H "Content-Type: application/json"

Try it

وللنشر النموذجي، يرجى الاتصال بالنقاط النهائية المتوافقة مع النظام المتكامل على سبيل المثال:

$ curl https://api.empiriolabs.ai/v1/gpu/connect/$ID/v1/chat/completions \
>   -H "Authorization: Bearer $EMPIRIOLABS_API_KEY" \
>   -H "Content-Type: application/json" \
>   -d '{
>     "model": "Qwen/Qwen2.5-7B-Instruct",
>     "messages": [{ "role": "user", "content": "Hello!" }]
>   }'

1 from openai import OpenAI
2 
3 client = OpenAI(
4     base_url="https://api.empiriolabs.ai/v1/gpu/connect/INSTANCE_ID/v1",
5     api_key="EMPIRIOLABS_API_KEY",
6 )
7 
8 resp = client.chat.completions.create(
9     model="Qwen/Qwen2.5-7B-Instruct",
10     messages=[{"role": "user", "content": "Hello!"}],
11 )
12 print(resp.choices[0].message.content)

For JupyterLab, ComfyUI, web Terminal, or Ollama, open the instance connect URL from the dashboard or send requests to the relevant connect path.

مطاردة مع نموذج الخاص بك في لوحة المتابعة

عندما تنشرين نموذجاً (أو أيّ حالة تخدم نظاماً متوافقاً مع (إف بي آي)، اللوحة تعطيك صفحة دردشة مبنية حتى تتمكني من تجربة النموذج على الفور دون كتابة أيّ رمز. إفتحي القضية من صفحة GPU Cloud واختيار ** دق مع هذا النموذج**. وصفحة الدردشة تتدفق الردود، وتدعم نظاماً فورياً ومعتاداً لمراقبة أخذ العينات (المؤقتة، من الأعلى إلى الأعلى، من الكسور القصوى)، وتسمح لكم بإلحاق صور أو سمعة للنماذج المتعددة الوسائط. وهو يصطدم بنفس المسار الموثَّق عليه للربط الذي يربطه مكتب التحقيقات الاتحادي، لذا لا توجد مجموعة إضافية ولا توجد فواتير منفصلة: فالحالة قد عُرضت بالفعل في المرتبة الثانية.

SSH and shell access

استخدم قالب Web Terminal عندما تحتاج إلى shell داخل عبء العمل، أو اعرض خدمة HTTP من حاوية مخصصة والوصول إليها عبر /v1/gpu/connect/\{instance_id\}/\{path\}.

سجلات الاستخدام و الفواتير

تظهر لوحة GPU Cloud الإنفاق على التشغيل واستهلاك بطاقة الرسوميات مدى الحياة. تشمل ردود دورة حياة API سعر النسخة، عدد وحدات معالجة الرسوميات، حالة الفوترة، والمبلغ المطلوب حتى تتمكن من التوفيق بين الاستخدام من أنظمتك الخاصة.