API IA
Salad
Salad è un cloud GPU distribuito che offre compute a basso costo e geodistribuito per AI, inferenza, training e altri carichi di lavoro ad alto uso di GPU.
Salad
Cos’è Salad?
Salad è una piattaforma cloud GPU distribuita che fornisce accesso a grandi quantità di GPU consumer tramite una rete globale di nodi. È pensata per AI inference, model training, batch processing, rendering e altri carichi di lavoro intensivi su GPU, con pricing basato sull’uso e deployment basato su container.
Come usare Salad?
- 1Crea un account Salad e contatta il team sales se hai bisogno di prezzi scontati per volumi elevati.
- 2Scegli il tipo di GPU e la quantità più adatti al tuo workload.
- 3Impacchetta la tua app come container Docker per Salad Container Engine.
- 4Distribuisci il workload su SaladCloud e monitora disponibilità, scaling e interruzioni.
- 5Scala verso l’alto o verso il basso in base alla domanda senza dover gestire singole VM.
Salad Funzioni principali
- Cloud GPU distribuito con nodi geodistribuiti
- Deployment di container Docker tramite Salad Container Engine
- Pricing basato sull’uso con tariffe iniziali basse
- Supporto per inferenza su larga scala e workload batch
- Deployment compatibile multi-cloud
- Riallocazione automatica del workload quando i nodi vanno offline
- Isolamento di sicurezza con container crittografati
- Nessuna gestione manuale delle VM necessaria
Salad Casi d’uso
- AI inference su larga scala
- Training e fine-tuning di modelli
- Generazione text-to-image
- Trascrizione speech-to-text
- Workload di computer vision
- Deployment di LLM
- Batch processing e rendering
- Workload GPU in stile HPC
Salad Prezzi e crediti gratuiti
Salad usa un modello A pagamento, Prezzi personalizzati.
Salad Pro e contro
Pro
- Prezzi iniziali delle GPU molto bassi
- Ampia rete distribuita di GPU
- Ottimo per AI inference scalabile
- Il deployment basato su Docker semplifica la configurazione
- Pricing basato sull’uso senza pagamenti anticipati
Contro
- La disponibilità delle GPU può essere interrotta, come nella capacity spot
- Cold start più lunghi rispetto alle GPU cloud tradizionali
- La massima vRAM disponibile sulla rete è limitata a 24 GB
- Non ideale per workload con latenza estremamente bassa
Per cosa è più adatto Salad?
- Team AI che hanno bisogno di inferenza GPU a basso costo
- Startup che devono scalare rapidamente i workload dei modelli
- Sviluppatori che distribuiscono app GPU containerizzate
- Aziende che cercano alternative più economiche ai grandi cloud
- Workload che possono tollerare interruzioni simili allo spot