كشفت شركة ديب سيك الصينية عن إطار عمل جديد يحمل اسم DSpark، والذي يتيح تسريع استجابة نماذج الذكاء الاصطناعي بنسبة تصل إلى 85%، دون الحاجة للاعتماد على أحدث شرائح الذكاء الاصطناعي، مما قد يسهم في خفض تكاليف تشغيل النماذج الكبيرة.
وتأتي هذه الخطوة في وقت تواجه فيه شركات الذكاء الاصطناعي تحديات متزايدة تتعلق بتوفير القدرة الحاسوبية اللازمة لتشغيل النماذج، خاصة مع القيود الأمريكية التي تحد من وصول الشركات الصينية إلى الشرائح المتقدمة من شركات مثل إنفيديا.
أسلوب فك التشفير التوقعي
وأضافت الشركة أن هذه الآلية تسمح بتجاوز العديد من الخطوات عند صحة التوقعات، مما يؤدي إلى تقليل زمن الاستجابة بشكل ملحوظ، حيث يتم تنفيذ جميع العمليات على وحدة معالجة الرسوميات دون الحاجة لنقل أي جزء من العمل إلى المعالج المركزي.
كما يعتمد النظام على أسلوب يقوم بتوليد أجزاء صغيرة من النص دفعة واحدة، بدلاً من إنتاج كل وحدة نصية بشكل منفصل، وهو ما يساهم أيضًا في تسريع عملية الاستجابة.
ويأتي الإعلان في ظل ارتفاع الإنفاق العالمي على مراكز بيانات الذكاء الاصطناعي، بينما بدأت شركات مثل أوبر ووول مارت في فرض قيود على استخدام الموظفين للذكاء الاصطناعي بسبب ارتفاع تكلفة استهلاك وحدات المعالجة.
أرخص نماذج ديب سيك
وديب سيك ليست الوحيدة التي تعمل على تسريع استجابة نماذج الذكاء الاصطناعي، إذ أعلنت شاومي مؤخرًا أن نموذجها MiMo-V2.5-Pro-UltraSpeed أصبح قادرًا على توليد أكثر من 1000 رمز في الثانية، وهو من بين أعلى المعدلات في القطاع.

