API IA
Salad
Salad est une cloud GPU distribuée offrant un calcul à faible coût et réparti géographiquement pour l'IA, l'inférence, l'entraînement et d'autres charges de travail gourmandes en GPU.
Salad
Qu’est-ce que Salad?
Salad est une plateforme cloud GPU distribuée qui donne accès à un grand nombre de GPU grand public via un réseau mondial de nœuds. Elle est positionnée pour l'inférence IA, l'entraînement de modèles, le traitement par lots, le rendu et d'autres charges de travail gourmandes en GPU, avec une tarification à l'usage et un déploiement basé sur des conteneurs.
Comment utiliser Salad?
- 1Créez un compte Salad et contactez le service commercial si vous avez besoin de tarifs remisés pour des volumes élevés.
- 2Choisissez le type de GPU et la quantité adaptés à votre charge de travail.
- 3Empaquetez votre application sous forme de conteneur Docker pour Salad Container Engine.
- 4Déployez la charge de travail sur SaladCloud et surveillez la disponibilité, la mise à l'échelle et les interruptions.
- 5Faites évoluer les ressources à la hausse ou à la baisse selon la demande, sans gérer des VM individuelles.
Salad Fonctionnalités clés
- Cloud GPU distribué avec des nœuds répartis géographiquement
- Déploiement de conteneurs Docker via Salad Container Engine
- Tarification à l'usage avec des tarifs de départ bas
- Prise en charge de l'inférence à grande échelle et des charges de travail par lots
- Déploiement compatible multi-cloud
- Réaffectation automatique des charges de travail lorsque des nœuds sont hors ligne
- Isolation de sécurité avec des conteneurs chiffrés
- Aucune gestion de VM requise
Salad Cas d’usage
- Inférence IA à grande échelle
- Entraînement et fine-tuning de modèles
- Génération texte-vers-image
- Transcription speech-to-text
- Charges de travail de vision par ordinateur
- Déploiement de LLM
- Traitement par lots et rendu
- Charges de travail GPU de type HPC
Salad Tarifs et crédits gratuits
Salad fonctionne avec le modèle Payant, Tarification personnalisée.
Salad Avantages et limites
Avantages
- Tarification GPU de départ très basse
- Grand réseau GPU distribué
- Bien adapté à l'inférence IA scalable
- Le déploiement basé sur Docker simplifie la configuration
- Tarification à l'usage sans prépaiement
Limites
- La disponibilité des GPU peut être interrompue comme avec une capacité spot
- Des cold starts plus longs que sur les GPU cloud classiques
- La VRAM maximale sur le réseau est limitée à 24 GB
- Peu adapté aux charges de travail à très faible latence
À quoi Salad convient-il le mieux ?
- Équipes IA ayant besoin d'une inférence GPU à faible coût
- Startups qui font évoluer rapidement des charges de travail de modèles
- Développeurs déployant des applications GPU conteneurisées
- Entreprises recherchant des alternatives moins chères aux grands clouds
- Charges de travail pouvant tolérer des interruptions de type spot