API AI
Salad
Salad คือคลาวด์ GPU แบบกระจายศูนย์ที่ให้บริการประมวลผลต้นทุนต่ำ กระจายตามภูมิภาค สำหรับงาน AI, inference, training และเวิร์กโหลดที่ใช้ GPU หนักประเภทอื่นๆ
Salad
Salad คืออะไร
Salad เป็นแพลตฟอร์มคลาวด์ GPU แบบกระจายศูนย์ที่ให้การเข้าถึง GPU สำหรับผู้บริโภคจำนวนมากผ่านเครือข่ายโหนดทั่วโลก โดยวางตำแหน่งสำหรับ AI inference, การฝึกโมเดล, batch processing, rendering และเวิร์กโหลดที่ใช้ GPU หนักอื่นๆ พร้อมการคิดค่าบริการตามการใช้งานและการดีพลอยแบบ container
วิธีใช้ Salad
- 1สร้างบัญชี Salad และติดต่อฝ่ายขายหากต้องการราคาส่วนลดสำหรับการใช้งานปริมาณมาก
- 2เลือกประเภท GPU และจำนวนที่เหมาะกับเวิร์กโหลดของคุณ
- 3แพ็กแอปของคุณเป็น Docker container สำหรับ Salad Container Engine
- 4ดีพลอยเวิร์กโหลดไปที่ SaladCloud และติดตามความพร้อมใช้งาน การสเกล และการหยุดชะงัก
- 5ปรับเพิ่มหรือลดขนาดตามความต้องการโดยไม่ต้องจัดการ VM ทีละเครื่อง
ฟีเจอร์หลักของ Salad
- คลาวด์ GPU แบบกระจายศูนย์พร้อมโหนดที่กระจายตามภูมิภาค
- ดีพลอยผ่าน Docker container ด้วย Salad Container Engine
- คิดค่าบริการตามการใช้งานพร้อมราคาเริ่มต้นต่ำ
- รองรับ inference และ batch workload ขนาดใหญ่
- รองรับการดีพลอยที่ใช้งานร่วมกับ multi-cloud
- ย้ายเวิร์กโหลดอัตโนมัติเมื่อโหนดออฟไลน์
- การแยกความปลอดภัยด้วย container ที่เข้ารหัส
- ไม่ต้องจัดการ VM เอง
เคสใช้งานของ Salad
- AI inference ขนาดใหญ่
- การฝึกและ fine-tuning โมเดล
- การสร้างภาพจากข้อความ
- การถอดเสียงพูดเป็นข้อความ
- เวิร์กโหลด computer vision
- การดีพลอย LLM
- batch processing และ rendering
- เวิร์กโหลด GPU สไตล์ HPC
ราคาและเครดิตฟรีของ Salad
Salad ใช้โมเดลราคาแบบ ชำระเงิน, ราคาที่กำหนดเอง
ข้อดีและข้อจำกัดของ Salad
ข้อดี
- ราคา GPU เริ่มต้นต่ำมาก
- เครือข่าย GPU แบบกระจายศูนย์ขนาดใหญ่
- เหมาะกับ AI inference ที่สเกลได้
- การดีพลอยแบบ Docker ช่วยให้ตั้งค่าง่าย
- คิดค่าบริการตามการใช้งานโดยไม่ต้องจ่ายล่วงหน้า
ข้อจำกัด
- ความพร้อมใช้งานของ GPU อาจถูกขัดจังหวะได้คล้าย spot capacity
- ช่วง cold start อาจนานกว่าคลาวด์ GPU ทั่วไป
- vRAM สูงสุดบนเครือข่ายจำกัดที่ 24 GB
- ไม่เหมาะกับเวิร์กโหลดที่ต้องการ latency ต่ำมาก
Salad เหมาะกับงานแบบไหน?
- ทีม AI ที่ต้องการ GPU inference ราคาประหยัด
- สตาร์ทอัพที่ต้องการสเกลเวิร์กโหลดโมเดลอย่างรวดเร็ว
- นักพัฒนาที่ดีพลอยแอป GPU แบบ container
- ธุรกิจที่มองหาทางเลือกที่ถูกกว่าคลาวด์รายใหญ่
- เวิร์กโหลดที่ยอมรับการหยุดชะงักแบบ spot-like ได้