نماذج اللغات الكبيرة (LLMs) بالذكاء الاصطناعي

Quant Picker

يساعدك Quant Picker في اختيار التكميم GGUF الأمثل لنموذج اللغة الكبير (LLM) الخاص بك من خلال الموازنة بين الجودة وطول السياق والسرعة بناءً على أجهزتك.

ما هو Quant Picker؟

Quant Picker هي أداة ويب تحسب أفضل مستوى تكميم GGUF لنموذج وإعدادات أجهزة معينة، مع توفير أحجام الملفات وميزانيات السياق وتقديرات سرعة توليد الرموز.

طريقة استخدام Quant Picker

  1. 1أدخل اسم النموذج الخاص بك (مثل Llama 3.1 70B).
  2. 2حدد أجهزتك (وحدة معالجة الرسومات وذاكرة الوصول العشوائي للفيديو).
  3. 3حدد طول السياق المطلوب.
  4. 4اضبط دقة ذاكرة التخزين المؤقت KV إذا لزم الأمر.
  5. 5راجع التكميم الموصى به، حجم الملف، والحد الأقصى للسياق.
  6. 6انسخ أوامر التشغيل المقدمة لـ llama.cpp أو Ollama.

الميزات الرئيسية في Quant Picker

  • يوصي بالتكميم GGUF الأمثل
  • يعرض أحجام الملفات ومتطلبات الذاكرة
  • يوفر تحليل ميزانية السياق
  • يقدر سرعة توليد الرموز
  • يقدم أوامر تشغيل قابلة للنسخ واللصق
  • يقارن الجودة عبر مستويات التكميم

حالات استخدام Quant Picker

  • اختيار التكميم المناسب لنموذج كبير على ذاكرة وحدة معالجة رسومات محدودة
  • تحديد ما إذا كان النموذج يمكن تشغيله بسياق كافٍ
  • مقارنة المفاضلات بين جودة التكميم واستخدام الموارد

أسعار Quant Picker والأرصدة المجانية

يعمل Quant Picker بنموذج مجاني.

مجاني

$0

جميع ميزات الأداة متاحة بدون تكلفة.

مزايا وعيوب Quant Picker

المزايا

  • توصيات دقيقة بناءً على مواصفات الأجهزة
  • جداول وشروحات سهلة الفهم
  • يوفر أوامر جاهزة للاستخدام

العيوب

  • تقديرات السرعة نظرية وقد لا تعكس الأداء الفعلي
  • مقتصرة على بيانات عرض النطاق الترددي لوحدة معالجة الرسومات NVIDIA لسقف السرعة
  • يدعم فقط تنسيق GGUF

لأي استخدام يناسب Quant Picker أكثر؟

  • عشاق نماذج اللغة الكبيرة الذين يشغلون النماذج محلياً
  • المطورون الذين يعملون على تحسين نشر النماذج المكممة

أسئلة شائعة عن Quant Picker

بدائل مجانية لـ Quant Picker

Best alternatives AI Tools to Quant Picker

MyLLM Connect logo

رفيق سطح مكتب مفتوح المصدر ومجاني يدير خادم ذكاء اصطناعي خاص على Mac/PC ويتصل بتطبيق MyLLM لنظام iOS عبر HTTPS موثوق به عبر Tailscale.

ZeroGPU logo

ZeroGPU هي طبقة كفاءة حسابية تساعد التطبيقات والوكلاء الذكاء الاصطناعي على تقليل التكاليف من خلال توجيه مهام الاستدلال عالية الحجم إلى نماذج لغوية صغيرة متخصصة عبر شبكة مدعومة بالحواف.

Claude Fable 5 logo

نموذج كلود فيبل 5 من Anthropic هو نموذج لغة ذكاء اصطناعي متطور يتمتع بأداء استثنائي في البرمجة والتحليلات والرؤية والبحث، ويتميز بمصنفات أمان متقدمة.