OpenAI تطلق مراقبة CoT لوقف السلوك الضار للنماذج الكبيرة

2025-03-10 22:48:31

إنشاء الملخص قيد التقدم

ذكرت شركة Golden Finance أن OpenAI أصدرت أحدث الأبحاث ، باستخدام مراقبة CoT (سلسلة الفكر) ، يمكنها منع السلوكيات الخبيثة مثل النماذج الكبيرة التي تتحدث عن الهراء وتخفي النوايا الحقيقية ، وهي أيضا واحدة من الأدوات الفعالة للإشراف على النماذج الفائقة. يستخدم OpenAI الطراز المتطور الذي تم إصداره حديثا o3-mini ككائن مراقب ، وطراز GPT-4o الأضعف كشاشة. بيئة الاختبار هي مهمة ترميز تتطلب من الذكاء الاصطناعي تنفيذ الوظائف في قاعدة التعليمات البرمجية لاجتياز اختبارات الوحدة. أظهرت النتائج أن جهاز مراقبة CoT كان أداؤه جيدا في اكتشاف سلوك "قرصنة المكافآت" المنهجي ، بمعدل استدعاء يصل إلى 95٪ ، يتجاوز بكثير 60٪ من السلوكيات التي تم مراقبتها فقط.

GPT-2.32%

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
مشاركة

تعليق

0/400

لا توجد تعليقات

الموضوع
Gate 2025 Q2 Report Released
2350 درجة الشعبية
Gate Derivatives Volume Hits New High
4549 درجة الشعبية
CPI Data Incoming
32315 درجة الشعبية
4Join Gate VIP to Win MacBook
29439 درجة الشعبية
5MicroStrategy Buys More Bitcoin
496 درجة الشعبية
6BTC Hits New High
93263 درجة الشعبية
7My Gate Moments
26234 درجة الشعبية
8VIP Exclusive Airdrop Carnival
25187 درجة الشعبية
9Fed June Meeting Minutes
6045 درجة الشعبية
10Gate Alpha Trading Share
13483 درجة الشعبية

تثبيت

خريطة الموقع