Yapay Zeka API
Salad
Salad, AI, inference, training ve diğer GPU yoğun iş yükleri için düşük maliyetli, coğrafi olarak dağıtılmış işlem gücü sunan dağıtılmış bir GPU bulutudur.
Salad
Nedir Salad?
Salad, küresel bir düğüm ağı üzerinden çok sayıda tüketici GPU’suna erişim sağlayan dağıtılmış bir GPU bulut platformudur. Yapay zeka inference, model eğitimi, batch işleme, render alma ve diğer GPU yoğun iş yükleri için kullanım bazlı fiyatlandırma ve container tabanlı dağıtım ile konumlandırılır.
Nasıl kullanılır Salad?
- 1Bir Salad hesabı oluşturun ve indirimli yüksek hacimli fiyatlandırmaya ihtiyacınız varsa satış ekibiyle iletişime geçin.
- 2İş yükünüze uygun GPU türünü ve miktarını seçin.
- 3Uygulamanızı Salad Container Engine için bir Docker container olarak paketleyin.
- 4İş yükünü SaladCloud üzerinde dağıtın ve kullanılabilirliği, ölçeklendirmeyi ve kesintileri izleyin.
- 5Talep değiştikçe tek tek VM’leri yönetmeden ölçeği artırın veya azaltın.
Salad Temel özellikler
- Coğrafi olarak dağıtılmış düğümlerle dağıtılmış GPU bulutu
- Salad Container Engine üzerinden Docker container dağıtımı
- Düşük başlangıç oranlarıyla kullanım bazlı fiyatlandırma
- Yüksek ölçekli inference ve batch iş yükü desteği
- Çoklu bulut uyumlu dağıtım
- Düğümler çevrimdışı olduğunda otomatik iş yükü yeniden tahsisi
- Şifreli container’larla güvenlik izolasyonu
- VM yönetimi gerektirmez
Salad Kullanım senaryoları
- Büyük ölçekte AI inference
- Model eğitimi ve fine-tuning
- Text-to-image üretimi
- Speech-to-text transkripsiyon
- Computer vision iş yükleri
- LLM dağıtımı
- Batch işleme ve render alma
- HPC tarzı GPU iş yükleri
Salad Fiyatlar ve ücretsiz krediler
Salad, Ücretli, Özel fiyatlandırma modeliyle çalışır.
Salad Artılar ve eksiler
Artılar
- Çok düşük başlangıç GPU fiyatlandırması
- Büyük dağıtılmış GPU ağı
- Ölçeklenebilir AI inference için uygun
- Docker tabanlı dağıtım kurulumu kolaylaştırır
- Ön ödeme olmadan kullanım bazlı fiyatlandırma
Eksiler
- GPU kullanılabilirliği spot kapasite gibi kesintiye uğrayabilir
- Tipik bulut GPU’larına göre daha uzun soğuk başlangıç süreleri
- Ağdaki en yüksek vRAM 24 GB ile sınırlı
- Son derece düşük gecikmeli iş yükleri için ideal değil
Salad en çok ne için uygundur?
- Düşük maliyetli GPU inference’a ihtiyaç duyan AI ekipleri
- Model iş yüklerini hızla ölçekleyen girişimler
- Container tabanlı GPU uygulamaları dağıtan geliştiriciler
- Büyük bulutlara daha ucuz alternatif arayan işletmeler
- Spot benzeri kesintileri tolere edebilen iş yükleri