نماذج اللغات الكبيرة (LLMs) بالذكاء الاصطناعي
Quant Picker
يساعدك Quant Picker في اختيار التكميم GGUF الأمثل لنموذج اللغة الكبير (LLM) الخاص بك من خلال الموازنة بين الجودة وطول السياق والسرعة بناءً على أجهزتك.
Quant Picker
ما هو Quant Picker؟
Quant Picker هي أداة ويب تحسب أفضل مستوى تكميم GGUF لنموذج وإعدادات أجهزة معينة، مع توفير أحجام الملفات وميزانيات السياق وتقديرات سرعة توليد الرموز.
طريقة استخدام Quant Picker
- 1أدخل اسم النموذج الخاص بك (مثل Llama 3.1 70B).
- 2حدد أجهزتك (وحدة معالجة الرسومات وذاكرة الوصول العشوائي للفيديو).
- 3حدد طول السياق المطلوب.
- 4اضبط دقة ذاكرة التخزين المؤقت KV إذا لزم الأمر.
- 5راجع التكميم الموصى به، حجم الملف، والحد الأقصى للسياق.
- 6انسخ أوامر التشغيل المقدمة لـ llama.cpp أو Ollama.
الميزات الرئيسية في Quant Picker
- يوصي بالتكميم GGUF الأمثل
- يعرض أحجام الملفات ومتطلبات الذاكرة
- يوفر تحليل ميزانية السياق
- يقدر سرعة توليد الرموز
- يقدم أوامر تشغيل قابلة للنسخ واللصق
- يقارن الجودة عبر مستويات التكميم
حالات استخدام Quant Picker
- اختيار التكميم المناسب لنموذج كبير على ذاكرة وحدة معالجة رسومات محدودة
- تحديد ما إذا كان النموذج يمكن تشغيله بسياق كافٍ
- مقارنة المفاضلات بين جودة التكميم واستخدام الموارد
أسعار Quant Picker والأرصدة المجانية
يعمل Quant Picker بنموذج مجاني.
مزايا وعيوب Quant Picker
المزايا
- توصيات دقيقة بناءً على مواصفات الأجهزة
- جداول وشروحات سهلة الفهم
- يوفر أوامر جاهزة للاستخدام
العيوب
- تقديرات السرعة نظرية وقد لا تعكس الأداء الفعلي
- مقتصرة على بيانات عرض النطاق الترددي لوحدة معالجة الرسومات NVIDIA لسقف السرعة
- يدعم فقط تنسيق GGUF
لأي استخدام يناسب Quant Picker أكثر؟
- عشاق نماذج اللغة الكبيرة الذين يشغلون النماذج محلياً
- المطورون الذين يعملون على تحسين نشر النماذج المكممة