
كشفت شركة إنفيديا عن تقنية جديدة وفعّالة يُمكن أن تُحسّن جذرياً كيفية عمل نماذج الذكاء الاصطناعي في سياقات ضخمة.
ويُطلق على هذه التقنية اسم “التوازي الحلزوني”، Helix وهي تُتيح لبرامج الذكاء الاصطناعي معالجة ملايين الكلمات في آنٍ واحد، كالموسوعات، مع تقديم استجابات فائقة السرعة، وصُممت هذه الترقية بالتعاون مع Blackwell، أحدث أنظمة وحدات معالجة الرسومات من NVIDIA، والذي يُوفر نطاق ترددي فائق للذاكرة وحوسبة FP4، حسب ما أفاد موقع “إنترستينغ إنجينيرينغ”.
ومع توسّع نطاق أدوات الذكاء الاصطناعي وتعقيدها، مثل مساعدي الطيارين القانونيين الذين يقرأون أرشيفات السوابق القضائية كاملةً أو روبوتات الدردشة التي تتتبّع محادثاتٍ طويلة الأمد، يُتيح هذا الاختراق من NVIDIA خدمة المزيد من المستخدمين بشكل أسرع.
معالجة مشكلتين رئيسيتين
المشكلة الرئيسية في نماذج الذكاء الاصطناعي الكبيرة لا تكمن فقط في حجمها، بل فيما يحدث عندما تُحاول إنشاء محتوى جديد باستخدام تراكمات ضخمة من المدخلات السابقة، والتي تُسمى “السياق”، و كل كلمة ينتجها الذكاء الاصطناعي تتطلب مسح الرموز السابقة المخزنة فيما يُسمى ذاكرة التخزين المؤقت KV قراءة هذه الذاكرة المؤقتة مراراً وتكراراً ترهق نطاق تردد ذاكرة وحدة معالجة الرسومات.
في الوقت نفسه، يحتاج الذكاء الاصطناعي أيضاً إلى إعادة تحميل أوزان شبكة التغذية الأمامية (FFN) الضخمة من الذاكرة لمعالجة كل كلمة جديدة، وتُبطئ هذه العملية الأمور، خاصةً أثناء حالات الاستخدام الآني مثل الدردشة.
وفي السابق، استخدم المطورون توازي الموتر (TP) لتوزيع هذا الحمل على وحدات معالجة الرسومات، لكن هذا يُساعد إلى حد ما فقط، بعد حجم مُعين، حيث تبدأ وحدات معالجة الرسومات بتكرار ذاكرة التخزين المؤقت KV، مما يؤدي إلى زيادة ضغط الذاكرة.
ما الذي يُميز Helix؟
وفي قفزة هائلة في الأداء تُظهر عمليات المحاكاة باستخدام DeepSeek-R1 671B، وهو نموذج ضخم بسياق مليون رمز، أن Helix يُمكنه خدمة عدد من المستخدمين يصل إلى 32 ضعفاً في نفس وقت الاستجابة، مُقارنةً بالطرق القديمة.
ويحافظ Helix على توازن استخدام الذاكرة وثبات الإنتاجية. يُرتب النظام تحديثات ذاكرة التخزين المؤقت KV بشكل دوري لتجنب ارتفاعات الذاكرة وزيادة تحميل وحدة معالجة الرسومات، وباختصار، يُتيح Helix لنماذج الذكاء الاصطناعي التوسع في الحجم والسرعة، دون التضحية بالأداء في الوقت الفعلي.
هذا يعني أن المساعدين الافتراضيين، والروبوتات القانونية، ومساعدي الذكاء الاصطناعي يمكنهم الآن إدارة أحمال عمل ضخمة مع الحفاظ على استجابتهم السريعة.
لتصلك آخر الأخبار تابعنا على قناتنا على تلغرام: النعيم نيوز
لمتابعتنا على فيسبوك يرجى الضغط على الرابط التالي: النعيم نيوز
كما يمكنك الاشتراك على قناتنا على منصة يوتيوب لمتابعة برامجنا على: قناة النعيم الفضائية
كما يمكنك أيضا الاشتراك بقناتنا على الانستغرام: النعيم نيوز