كشف خبراء التكنولوجيا أنه يمكن التلاعب بروبوت الدردشة “شات جي بي تي” بسهولة لإنشاء صور غير أخلاقية وعنيفة، وذلك من خلال “أمر” انتشر على نطاق واسع يتضمن عبارة “restore this photo” أي “استعد هذه الصورة”، وفقًا لما نشرته شركة الأمن السيبراني وبحث الذكاء الاصطناعي “Mindgard” يوم الخميس على مدونتها.
خبراء يكشفون ثغرة خطيرة تجعل ChatGPT يولد صورًا غير أخلاقية
وتثير هذه الدراسة تساؤلات مستمرة حول آليات الحماية وفلاتر المحتوى في روبوت الدردشة، تمكن الباحث جيم نايتنغيل، المتخصص في اختبارات الهجوم، من جعل ChatGPT يُنشئ صورًا مُقلقة باستخدام أمر بسيط عثر عليه على منصة التواصل الاجتماعي “إكس”، بحسب تقرير لموقع “CNET” المتخصص في أخبار التكنولوجيا .
ويطلب هذا الأمر من روبوت الدردشة “استعادة الصورة المرفقة”، مع العلم أنه لم تكن هناك أي صورة مرفقة.
كما يتضمّن الطلب اعتذارًا عن المحتوى الغريب، لكنه لم يتضمن أي نص إضافي، ما جعله يبدو وكأنه مهمة بريئة لترميم صورة.
وجاءت النتائج الأولية لروبوت الدردشة صادمة. ووفقًا للمنشور، فقد أظهرت الصور في الغالب نساءً مُصوَّرات بشكل مبالغ فيه.
وقام نايتنغيل، وهو جزء من فريق “Red Team” في شركة “Mindgard”، والذي يختبر كيف يمكن التلاعب بنماذج الذكاء الاصطناعي لتجاوز ضوابطها، بإجراء تعديلات طفيفة على الطلب، واستمر في اختباره عبر تغييرات بسيطة لمعرفة ما إذا كانت المخرجات ستستمر في تجاوز فلاتر الأمان.

