API IA
Salad
Salad é uma cloud de GPU distribuída que oferece compute de baixo custo e geodistribuído para AI, inference, training e outras workloads intensivas em GPU.
Salad
O que é Salad?
Salad é uma plataforma de cloud de GPU distribuída que fornece acesso a um grande número de consumer GPUs através de uma rede global de nodes. É posicionada para AI inference, model training, batch processing, rendering e outras workloads intensivas em GPU, com pricing baseado em uso e deployment baseado em containers.
Como usar Salad?
- 1Crie uma conta Salad e contacte a equipa de vendas se precisar de pricing com desconto para alto volume.
- 2Escolha o tipo de GPU e a quantidade adequados para a sua workload.
- 3Empacote a sua app como um Docker container para Salad Container Engine.
- 4Faça deploy da workload no SaladCloud e monitorize availability, scaling e interruptions.
- 5Aumente ou reduza a escala conforme a procura muda, sem gerir VMs individuais.
Salad Principais recursos
- Cloud de GPU distribuída com nodes geodistribuídos
- Deployment de Docker containers via Salad Container Engine
- Pricing baseado em uso com tarifas iniciais baixas
- Suporte para inference em grande escala e batch workloads
- Deployment compatível com multi-cloud
- Reatribuição automática da workload quando os nodes ficam offline
- Isolamento de segurança com containers encriptados
- Sem necessidade de gerir VMs
Salad Casos de uso
- AI inference em escala
- Model training e fine-tuning
- Geração de text-to-image
- Transcrição speech-to-text
- Workloads de computer vision
- Deployment de LLM
- Batch processing e rendering
- Workloads de GPU ao estilo HPC
Salad Preços e créditos grátis
Salad funciona no modelo Pago, Preço personalizado.
Salad Prós e contras
Prós
- Pricing inicial de GPU muito baixo
- Grande rede distribuída de GPU
- Boa opção para AI inference escalável
- Deployment baseado em Docker simplifica a configuração
- Pricing baseado em uso sem pré-pagamentos
Contras
- A disponibilidade de GPU pode ser interrompida, como capacidade spot
- Cold starts mais longos do que em GPUs cloud típicas
- A maior vRAM na rede é limitada a 24 GB
- Não é ideal para workloads com latência extremamente baixa
Para que Salad é melhor?
- Equipas de AI que precisam de inference em GPU a baixo custo
- Startups a escalar rapidamente workloads de modelos
- Developers que fazem deployment de apps de GPU em containers
- Empresas que procuram alternativas mais baratas às grandes clouds
- Workloads que podem tolerar interrupções tipo spot