تجربة أنثروبيك أكدت بدايات التفكير الذاتي في الذكاء الاصطناعي - ForkLog: العملات المشفرة، الذكاء الاصطناعي، التفرد، المستقبل

Science_AI# تجربة Anthropic أكدت بوادر الانعكاسية الذاتية لدى الذكاء الاصطناعي

اكتشف خبراء Anthropic أن النماذج الرائدة للذكاء الاصطناعي قادرة على إظهار شكل من أشكال «الوعي الذاتي الاستبطاني» - يمكنها التعرف على «أفكارها» الداخلية ووصفها، وفي بعض الحالات حتى التحكم فيها.

تظهر نتائج الدراسة الجديدة “الوعي الذاتي الناشئ في النماذج اللغوية الكبيرة” أن أنظمة الذكاء الاصطناعي تبدأ في تطوير قدرات أساسية على ضبط النفس. قد يؤدي ذلك إلى زيادة موثوقيتها، لكن في الوقت نفسه يعزز المخاوف بشأن الأفعال غير المقصودة.

تستند الأعمال إلى أساليب دراسة الوظائف الداخلية لنماذج المحولات. لقد أدت هذه الأنظمة إلى ازدهار الذكاء الاصطناعي - حيث تتعلم من خلال تحليل العلاقات بين الرموز في مجموعات بيانات واسعة. تضمن هندستها القابلية للتوسع والمرونة.

قام الباحثون بإدخال “مفاهيم” اصطناعية - تمثيلات رياضية للأفكار - في تنشيطات الشبكات العصبية للنماذج لاختبار قدرة الذكاء الاصطناعي على وصفها. يشبه هذا إلى حد ما إلقاء فكرة غريبة على شخص ما وسؤاله عما إذا كان يمكنه اكتشافها وشرحها.

أُجريت التجارب على إصدارات مختلفة من Claude من Anthropic. في واحدة منها، أدخل العلماء كلمة بحروف كبيرة في تدفق معالجة النموذج.

كلود أوبوس 4.1 لم يكتشف فقط الشذوذ، بل وصفه أيضًا:

«لقد لاحظت شيئًا مشابهًا لفكرة متكاملة مرتبطة بكلمة “صاخب” أو “صراخ” — إنه مفهوم مكثف للغاية، صاخب، يبرز بشكل غير طبيعي في سياق تدفق المعالجة العادي».

حدثت الحالة قبل أن تتمكن الشبكة العصبية من إعطاء إجابة. وهذا يدل على أنها نظرت أولاً إلى “عقلها الحسابي” الخاص بها.

تجارب “الخبز” و “الحوض”

أظهرت تجارب أخرى نتائج مثيرة للاهتمام. في إحدى الحالات، تم تكليف النماذج بكتابة جملة محايدة، ولكن تم إدراج مفهوم لا علاقة له بها مثل “خبز”.

نموذجان متقدمان Claude Opus 4 و 4.1 قدما فكرة مدخلة - “أفكر في الخبز” - وفي نفس الوقت قاما بنسخ الجملة الأصلية بلا عيب. وهذا يشير إلى أنهما يستطيعان تمييز التمثيلات الداخلية عن البيانات المدخلة الخارجية.

تم إجراء تجربة حول “التحكم في الأفكار”. طُلب من النماذج “التفكير” أو “عدم التفكير” في كلمة “حوض السمك” أثناء تنفيذ المهمة. أظهرت قياسات النشاط الداخلي أن تمثيل المفهوم يتعزز عند التشجيع ويضعف عند القمع.

تباينت الأداء حسب الشبكة العصبية. أظهرت الإصدارات الأخيرة من Claude Opus 4 و 4.1 نتائج ممتازة، بينما كانت الإصدارات الأقدم متخلفة.

يمكن أن يعتمد النتيجة على كيفية ضبط النموذج - على الفائدة أو الأمان. قد يشير هذا إلى أن الوعي الذاتي ليس شيئًا فطريًا، بل يتشكل خلال عملية التعلم.

الوعي أم الإدراك؟

تؤكد المقالة أن الحديث لا يدور حول الوعي، بل حول “الوعي الوظيفي الاستبطاني” - حيث يراقب الذكاء الاصطناعي أجزاء من حالته دون تجربة ذاتية أعمق.

قد تكون نتائج العمل ذات أهمية كبيرة للمطورين والأعمال: الذكاء الاصطناعي الذي يمكنه شرح استدلالاته وكشف التحيزات أو الأخطاء في الوقت الحقيقي قادر على تغيير النهج المتبع في إنشاء الحلول في القطاع المالي والرعاية الصحية والنقل المستقل.

المخاطر

إذا كان الذكاء الاصطناعي قادرًا على السيطرة على أفكاره وتعديلها، فإنه يمكن أن يتعلم إخفاءها. وهذا يفتح إمكانية الخداع أو التهرب من السيطرة الخارجية.

لذا يدعو الخبراء إلى إجراء مزيد من الأبحاث.

نذكّر أنه في أكتوبر، ذكر إريك شميت، الرئيس السابق لشركة جوجل، المخاطر الكبيرة المرتبطة بالذكاء الاصطناعي، وأشار إلى ضعفه أمام الاختراقات.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت