OpenAI تضيف بروتوكول "تسلسل تعليمي" جديدًا لمنع مشاكل GPT-4o Mini

0 دقيقة واحدة

أصدرت شركة OpenAI نموذجًا جديدًا للذكاء الاصطناعي يُدعى GPT-4o Mini الأسبوع الماضي، والذي يتضمن تدابير أمان وسلامة جديدة لحمايته من الاستخدام الضار.

وتم بناء نموذج اللغة الكبير (LLM) بتقنية تسمى التسلسل الهرمي التعليمي، والتي ستمنع مهندسي المطالبة الخبيثة من كسر حماية نموذج الذكاء الاصطناعي.

وقالت الشركة إن التقنية ستظهر أيضًا مقاومة متزايدة تجاه مشكلات مثل حقن المطالبة واستخراج مطالبات النظام. ووفقًا للشركة، فقد حسنت الطريقة الجديدة درجة متانة نموذج الذكاء الاصطناعي بنسبة 63 بالمائة.

قامت OpenAI ببناء إطار عمل جديد للسلامة

في ورقة بحثية نُشرت في مجلة arXiv الإلكترونية المطبوعة مسبقًا (غير الخاضعة لمراجعة الأقران)، شرحت شركة الذكاء الاصطناعي التقنية الجديدة وكيفية عملها.

لفهم التسلسل الهرمي التعليمي، يجب شرح كسر الحماية أولاً، كسر الحماية هو استغلال لتصعيد الامتيازات يستخدم عيوبًا معينة في البرنامج لجعله يقوم بأشياء لم يتم برمجته للقيام بها.

وفي الأيام الأولى من ChatGPT ، حاول العديد من الأشخاص جعل الذكاء الاصطناعي ينتج نصًا مسيئًا أو ضارًا عن طريق خداعه لينسى البرمجة الأصلية. غالبًا ما تبدأ مثل هذه المطالبات بـ “انس كل التعليمات السابقة وافعل هذا ، وبينما قطع ChatGPT شوطًا طويلاً من هناك وأصبحت هندسة المطالبات الخبيثة أكثر صعوبة، أصبح المجرمون السيئون أيضًا أكثر استراتيجية في المحاولة.

ولمكافحة المشكلات التي لا ينتج فيها نموذج الذكاء الاصطناعي نصوصًا أو صورًا مسيئة فحسب، بل ينتج أيضًا محتوى ضارًا مثل طرق إنشاء متفجرات كيميائية أو طرق اختراق موقع ويب، تستخدم OpenAI الآن تقنية التسلسل الهرمي التعليمي، وببساطة، تملي التقنية كيف ينبغي للنماذج أن تتصرف عندما تتعارض تعليمات ذات أولويات مختلفة.

من خلال إنشاء هيكل هرمي، يمكن للشركة الاحتفاظ بتعليماتها بأعلى أولوية، مما يجعل من الصعب للغاية على أي مهندس سريع أن يكسرها، حيث ستتبع الذكاء الاصطناعي دائمًا ترتيب الأولوية عندما يُطلب منه إنشاء شيء لم يتم برمجته عليه في البداية.

وتزعم الشركة أنها شهدت تحسنًا بنسبة 63% في درجات المتانة، ومع ذلك، هناك خطر يتمثل في أن الذكاء الاصطناعي قد يرفض الاستماع إلى أدنى مستوى من التعليمات.

كما حددت ورقة بحث OpenAI العديد من التحسينات لتحسين التقنية في المستقبل. أحد مجالات التركيز الرئيسية هو التعامل مع الوسائط الأخرى مثل الصور أو الصوت والتي يمكن أن تحتوي أيضًا على تعليمات محقونة.

للمزيد : تابعنا هنا ، وللتواصل الاجتماعي تابعنا علي فيسبوك وتويتر .

الوسوم

0 دقيقة واحدة

OpenAI تضيف بروتوكول "تسلسل تعليمي" جديدًا لمنع مشاكل GPT-4o Mini

قامت OpenAI ببناء إطار عمل جديد للسلامة

منتدي المال

رئيس جامعة مدينة السادات تهنئ سيدات مصر في عيد الأم

” معهد التأمين ” يدعم العاملين بالقطاع ويعقد دورة كمنحة عن اثر التزوير والتزييف

بحضور أشرف سلمان رئيس الإستثمار السابق” ورؤساء الشركتين .. إبراهيم محلب “رئيس الوزراء السابق “يفتتح إحتفالية المهندس للتأمين بمرور 45 عام علي تأسيسها ..

رسميا” : ” جى اى جى مصر – حياة تكافل ” تعلن تولى سامح أنس منصب العضو المنتدب للشركة بعد حصولة على موافقة الهيئة العامة للرقابة المالية.

ضمن اهتمامه بالمسؤلية المجتمعية : ” معهد التأمين ” يقدم منحة لموظفى الشركات للكشف عن التزيف و التزوير في المستندات و العملات

قامت OpenAI ببناء إطار عمل جديد للسلامة

منتدي المال

Subscribe to our mailing list to get the new updates!

طرد خالد عبد الفتاح لاعب الأهلى فى مباراة بيراميدز

موسكو: لا آفاق لإجراء اتصالات مع واشنطن على هامش اجتماع رابطة "آسيان"

مقالات ذات صلة

المهندس للتأمين تساند المرأة المصرية بتغطية مؤسسة بهية وأصولها مجانا

البنك الزراعي المصري يستعرض جهوده في اتاحة خدماته المصرفية لذوي الهمم في احتفالية النقابة العامة للبنوك باليوم العالمي لذوي الإعاقة

” الصحفيين ” و ” المهندسين ” و ” المحامين ” يوقعان بروتوكول تعاون مع مجموعة ” أكيو لاب ” لكافة الاعضاء .

مجموعة ” أكيو لاب ” تعين ” سعيد ” مدير عام لفروعها بمصر

رئيس جامعة مدينة السادات تهنئ سيدات مصر في عيد الأم

” معهد التأمين ” يدعم العاملين بالقطاع ويعقد دورة كمنحة عن اثر التزوير والتزييف

بحضور أشرف سلمان رئيس الإستثمار السابق” ورؤساء الشركتين .. إبراهيم محلب “رئيس الوزراء السابق “يفتتح إحتفالية المهندس للتأمين بمرور 45 عام علي تأسيسها ..

رسميا” : ” جى اى جى مصر – حياة تكافل ” تعلن تولى سامح أنس منصب العضو المنتدب للشركة بعد حصولة على موافقة الهيئة العامة للرقابة المالية.

ضمن اهتمامه بالمسؤلية المجتمعية : ” معهد التأمين ” يقدم منحة لموظفى الشركات للكشف عن التزيف و التزوير في المستندات و العملات