جوجل تكشف عن DiLoCo المفصولة لتسريع تدريب الذكاء الاصطناعي

ما هي بنية DiLoCo المفصولة؟

أعلنت جوجل اليوم عن إطلاق بنية DiLoCo المفصولة، وهي إطار عمل جديد صُمم لتسريع تدريب نماذج الذكاء الاصطناعي الموزعة عبر مراكز بيانات متعددة. من خلال فصل معالجة البيانات عن تنسيق الحوسبة، يستطيع النظام دفع أحمال العمل واسعة النطاق بسرعة أكبر مع الحفاظ على مرونة خط أنابيب التدريب أمام الأعطال التقنية أو مشاكل الشبكة.

تحسينات السرعة التي تهمك

تشير نتائج الاختبارات الأولية إلى أن تصميم DiLoCo المفصول يمكن أن يقلل دورات التدريب بما يصل إلى 30 ٪ مقارنةً بالأنظمة الأحادية الكبيرة السابقة لجوجل. بالنسبة لنموذج يحتاج عادةً إلى 100 ساعة من وقت GPU، قد يوفر النهج الجديد ما يقارب 30 ساعة، ما يترجم إلى توفير ملايين الدولارات للمؤسسات التي تجري آلاف التجارب كل عام.

المرونة مدمجة في النواة

أحد أكثر الفوائد إقناعاً هو قدرة البنية على تحمل الفشل. إذا تعطَّل رف من الخوادم، يعيد DiLoCo توجيه المهام تلقائيًا إلى العقد السليمة، مما يحد من انقطاع العمل إلى أقل من خمس دقائق في معظم الحالات. وفقًا للبيانات الداخلية، انخفضت معدلات فشل الوظائف الإجمالية بنحو 40 ٪ منذ بدء مرحلة التجربة الأولية.

دمج الأجهزة دون عقوبة أداء

تتيح دعم DiLoCo للأجهزة من أجيال مختلطة للمؤسسات دمج أحدث وحدات TPU مع مجموعات GPU القديمة. هذه المرونة تقلل من الإنفاق الرأسمالي لأن الشركات يمكنها الحفاظ على إنتاجية المعدات القديمة مع دمج المعجلات الأحدث تدريجيًا. تشمل المزايا الرئيسية:

توزيع الأحمال المثالي بناءً على مقاييس الأداء في الوقت الحقيقي.
توسيع سلس عبر الموارد المحلية والسحابية.
خفض استهلاك الطاقة من خلال مطابقة المهام مع أكثر الأجهزة كفاءة.

آراء خبراء الصناعة

"بنية DiLoCo المفصولة تُغيّر قواعد اللعبة لأي شخص يقوم بتدريب نماذج ضخمة على نطاق واسع،" تقول الدكتورة مايا باتيل، الباحثة الكبيرة في مجال الذكاء الاصطناعي في معهد العلوم الحاسوبية. "قدرتها على دمج الأجهزة القديمة والجديدة مع الحفاظ على معدل نقل عالٍ يمكن أن تعيد تعريف هياكل التكلفة لتطوير الذكاء الاصطناعي."

ماذا يعني هذا لمستقبل تدريب الذكاء الاصطناعي

مع تزايد حجم نماذج الذكاء الاصطناعي، تصبح الحاجة إلى خطوط تدريب فعّالة ومتسامحة مع الأخطاء أمرًا حيويًا. تعد بنية DiLoCo المفصولة من جوجل بمواكبة هذا الطلب، مقدمةً مسارًا أكثر تكيفًا وسرعة من البيانات إلى الرؤى. قد تتمتع الشركات التي تعتمد النظام مبكرًا بميزة تنافسية، حيث تقدم خدمات أكثر ذكاءً مع تقليل الإنفاق على الحوسبة.

الخلاصة: احتضان ميزة DiLoCo المفصولة

باختصار، تمثل بنية DiLoCo المفصولة خطوة هامة إلى الأمام في التدريب الموزع للذكاء الاصطناعي. أوقات تشغيل أسرع، مرونة أقوى، وإمكانية الاستفادة من الأجهزة من أجيال مختلطة معًا تُشكّل عرض قيمة جذاب. يجب على المؤسسات التي تسعى للبقاء في صدارة سباق الذكاء الاصطناعي استكشاف كيفية دمج DiLoCo في سير عملها الحالي وتسريع مسار الابتكار.