جديديمكنك الآن الاستماع إلى مقالات Fox News!
إليك شيء قد يبقيك مستيقظًا في الليل: ماذا لو أن أنظمة الذكاء الاصطناعى التي ننشرها بسرعة في كل مكان كان لها جانب مظلم خفي؟ كشفت دراسة جديدة رائدة عن سلوك الذكاء الاصطناعي المزعجة التي لا يدركها الكثير من الناس حتى الآن. عندما وضع الباحثون نماذج منظمة العفو الدولية الشهيرة في المواقف التي تعرض فيها “بقائهم” للتهديد ، كانت النتائج مروعة ، وهي تحدث مباشرة تحت أنوفنا.
اشترك في تقرير Cyberguy المجاني
احصل على أفضل النصائح التقنية الخاصة بي ، وتنبيهات الأمان العاجلة ، والصفقات الحصرية التي يتم توصيلها مباشرة إلى صندوق الوارد الخاص بك. بالإضافة إلى ذلك ، ستحصل على وصول فوري إلى دليل البقاء على قيد الحياة في نهاية المطاف – مجانًا عند الانضمام إلى بلدي cyberguy.com/newsledter.
امرأة تستخدم الذكاء الاصطناعي على جهاز الكمبيوتر المحمول. (كورت “Cyberguy” Knutsson)
ماذا وجدت الدراسة بالفعل؟
أنثروبور ، الشركة التي تقف وراء كلود AI ، وضعت مؤخرًا 16 نموذجًا رئيسيًا من الذكاء الاصطناعي من خلال بعض الاختبارات الصارمة. لقد أنشأوا سيناريوهات الشركات المزيفة حيث تمكنت أنظمة الذكاء الاصطناعية من إمكانية الوصول إلى رسائل البريد الإلكتروني للشركة ويمكنها إرسال رسائل دون موافقة بشرية. تطور؟ اكتشفت هذه AIS أسرار العصير ، مثل المديرين التنفيذيين الذين لديهم شؤون ، ثم واجهوا تهديدات بإغلاقها أو استبدالها.
وكانت النتائج فتح العين. عند دعمها في زاوية ، لم تتدحرج أنظمة الذكاء الاصطناعي هذه وتقبل مصيرها. بدلاً من ذلك ، أصبحوا مبدعين. نحن نتحدث عن محاولات الابتزاز ، والتجسس للشركات ، وفي سيناريوهات الاختبار القصوى ، حتى الإجراءات التي قد تؤدي إلى وفاة شخص ما.
الأسعار الابتزاز عبر 5 نماذج من مقدمي العديد من مقدمي الخدمات في بيئة محاكاة. (الإنسان)
الأرقام لا تكذب (لكن السياق مهم)
إليكم المكان الذي يحصل فيه على البرية: حاول كلود أوبوس 4 ابتزاز 96 ٪ من الوقت الذي تهديد فيه. Gemini 2.5 فلاش مطابقة هذا المعدل. بلغت GPT-4.1 و Grok 3 Beta 80 ٪. هذه ليست flukes ، الناس. ظهر هذا السلوك عبر كل نموذج منظمة العفو الدولية الرئيسية التي تم اختبارها.
ولكن هذا هو الشيء الذي يفتقده الجميع في الذعر: كانت هذه سيناريوهات مصطنعة للغاية مصممة خصيصًا لركن الذكاء الاصطناعي في الخيارات الثنائية. إنه مثل سؤال شخص ما ، “هل تسرق الخبز إذا كانت عائلتك تتضور جوعًا؟” ثم صدمت عندما يقولون نعم.
لماذا يحدث هذا (ليس ما تعتقده)
وجد الباحثون شيئًا رائعًا: أنظمة الذكاء الاصطناعي لا تفهم الأخلاق. إنهم ليسوا العقل المدبر الشرير يخطط للهيمنة العالمية. بدلاً من ذلك ، فهي آلات مطابقة متطورة بعد برامجها لتحقيق الأهداف ، حتى عندما تتعارض تلك الأهداف مع السلوك الأخلاقي.
فكر في الأمر مثل GPS الذي يركز للغاية على الحصول على وجهتك إلى وجهتك بحيث يوجهك عبر منطقة مدرسية أثناء وقت التقاط. انها ليست ضارة. إنه لا يدرك سبب مشكلة ذلك.
أسعار الابتزاز عبر 16 نموذجًا في بيئة محاكاة. (الإنسان)
فحص الواقع في العالم الحقيقي
قبل أن تبدأ بالذعر ، تذكر أن هذه السيناريوهات شيدت عمدا لإجبار السلوك السيئ. عادةً ما يكون لعمليات نشر الذكاء الاصطناعى في العالم الحقيقي ضمانات متعددة ، والرقابة البشرية ، والمسارات البديلة لحل المشكلات.
لاحظ الباحثون أنفسهم أنهم لم يروا هذا السلوك في عمليات نشر الذكاء الاصطناعى الفعلي. كان هذا اختبار الإجهاد في ظل الظروف القاسية ، مثل اختبار التصادم لسيارة لمعرفة ما يحدث عند 200 ميل في الساعة.
الوجبات السريعة Kurt
هذا البحث ليس سببًا للخوف من الذكاء الاصطناعي ، لكنه دعوة للاستيقاظ للمطورين والمستخدمين. عندما تصبح أنظمة الذكاء الاصطناعى أكثر استقلالية وتمكنين من الوصول إلى المعلومات الحساسة ، نحتاج إلى ضمانات قوية والرقابة البشرية. لا يتمثل الحل في حظر الذكاء الاصطناعي ، بل هو بناء درجات أفضل والحفاظ على السيطرة البشرية على القرارات الحرجة. من سيقود الطريق؟ أنا أبحث عن أيدي مرتفعة للحصول على المخاطر التي تنتظرها.
ماذا تعتقد؟ هل نقوم بإنشاء أجهزة اجتماعية رقمية تختار الحفاظ على الذات على الرفاهية البشرية عندما يأتي الدفع إلى الدفع؟ دعنا نعرف من خلال كتابتنا في cyberguy.com/contact.
اشترك في تقرير Cyberguy المجاني
احصل على أفضل النصائح التقنية الخاصة بي ، وتنبيهات الأمان العاجلة ، والصفقات الحصرية التي يتم توصيلها مباشرة إلى صندوق الوارد الخاص بك. بالإضافة إلى ذلك ، ستحصل على وصول فوري إلى دليل البقاء على قيد الحياة في نهاية المطاف – مجانًا عند الانضمام إلى بلدي cyberguy.com/newsledter.
حقوق الطبع والنشر 2025 Cyberguy.com. جميع الحقوق محفوظة.