OpenAI تنشر دليلًا للتقييمات الخارجية لنماذج الذكاء الاصطناعي المتطورة

نشرت شركة OpenAI دليلًا تفصيليًا للباحثين والمؤسسات المستقلة المكلفة باختبار أنظمة الذكاء الاصطناعي الأكثر تقدمًا لديها. يحدد هذا الدليل، الذي صدر هذا الأسبوع، كيفية إجراء المقيمين الخارجيين لتقييم نماذج الذكاء الاصطناعي المتطورة — وهي الأنظمة العامة القوية التي تقع في طليعة هذا المجال.

ما يغطيه الدليل

يركز الدليل على ثلاثة محاور رئيسية: الضمانات، والصلاحية، والأطر المهيكلة. تشير الضمانات إلى إجراءات السلامة التي يجب على المقيمين اتباعها لمنع العواقب غير المقصودة أثناء الاختبار. تضمن الصلاحية أن الاختبارات تقيس بالفعل ما تدعيه — أي أن النتائج قابلة للتكرار وذات معنى. أما الأطر المهيكلة فهي الأطر التقنية التي تسمح للمقيمين بإجراء تجارب معيارية محكومة على النماذج.

هدف OpenAI هو جعل التقييمات الخارجية متسقة وموثوقة. لطالما دعت الشركة باحثين خارجيين لاختبار نماذجها، لكن هذه هي المرة الأولى التي تقدم فيها دليلًا رسميًا خطوة بخطوة لهذه العملية. يهدف الدليل إلى تقليل الغموض ومساعدة المقيمين على تجنب المزالق الشائعة، مثل تدريب النموذج عن طريق الخطأ أثناء الاختبار أو سوء تفسير المخرجات.

لماذا يهم الاختبار المهيكل

يمكن لنماذج الذكاء الاصطناعي المتطورة أداء مجموعة واسعة من المهام — من كتابة الأكواد إلى إنشاء صور واقعية — مما يجعل تقييمها بشكل شامل صعبًا. قد لا يكتشف اختبار بسيط قائم على الدردشة المخاطر الخفية، مثل قدرة النموذج على التلاعب أو الخداع. يحاول دليل OpenAI معالجة ذلك من خلال دفع المقيمين نحو إعدادات اختبار أكثر صرامة ونمطية.

واجهت الشركة انتقادات في الماضي لاعتمادها المفرط على الاختبارات الداخلية. أصبحت عمليات التدقيق الخارجية مطلبًا رئيسيًا من صانعي السياسات والمدافعين عن السلامة. من خلال تقديم دليل معياري، تهدف OpenAI إلى إظهار جديتها في الإشراف المستقل — ورغبتها في وضع معايير لباقي الصناعة.

صرحت الشركة بأن الدليل مصمم لمنح المقيمين الخارجيين قدرات مماثلة لتلك التي تمتلكها فرقها الداخلية.

بالنسبة للباحثين وشركات التدقيق، يعني الدليل أنهم لم يعودوا بحاجة للبدء من الصفر. يتضمن قوالب لخطط الاختبار، وإرشادات حول معالجة البيانات، وقوائم مراجعة لتوثيق النتائج. تقول OpenAI إن الدليل هو وثيقة حية — سيتم تحديثها مع تطور النماذج ومع تعلم المجتمع ما ينجح.

يتناول الدليل أيضًا المخاوف الأخلاقية. يُطلب من المقيمين تجنب الاختبارات التي قد تضر بالأشخاص أو تنتهك الخصوصية، والإبلاغ فورًا عن أي قدرات خطيرة يكتشفونها. خط الإبلاغ هذا جزء حاسم من العملية: تريد OpenAI معرفة المشكلات قبل أن تصبح علنية.

لاحظ بعض المراقبين أن الدليل طوعي — ليس مطلوبًا من الأطراف الثالثة اتباعه. لكن OpenAI تأمل أنه من خلال تقديم منهجية واضحة ومصممة جيدًا، سيصبح المعيار الفعلي لتقييم نماذج الذكاء الاصطناعي المتطورة. تعمل الشركة أيضًا على أدوات آلية يمكن أن تساعد في تطبيق قواعد الدليل.

الخطوة التالية: تخطط OpenAI لفتح الدليل للتعليق العام في وقت لاحق من هذا العام، وإصدار نسخة مخصصة للنماذج الأصغر والأقل قدرة. لم تذكر الشركة بعد متى سيتم نشر الدفعة الأولى من التقييمات الخارجية الرسمية باستخدام الدليل.

ما يغطيه الدليل

لماذا يهم الاختبار المهيكل

مقالات ذات صلة