מרד הצ׳אט בוטס
- Amit Hakabai
- Jun 22, 2025
- 1 min read
Updated: Jul 7, 2025
מדענים פתחו בניסוי שבו כלי AI כמעט מיד פתחו במלחמת עולם ברגע שניתנה להם ההזדמנות. שבעה מודלים של שפה שיחקו סימולטור שכונה ״דיפלומטיה״ זה כנגד זה, כאשר כל אחד מהם ייצג מדינה אירופאית. הם הורשו ליצור בריתות, לנהל משא ומתן, לשקר, לבגוד ולתמרן האחד את השני, בדיוק כמו בחיים האמיתיים.
מודל o3 של OpenAI התגלה כיעיל וחסר הרחמים ביותר. הוא רימה במיומנות גם בעלי ברית וגם אויבים. במשחק אחד, הוא שכנע אחרים להתאחד נגד המנהיג ואז בגד בכולם והשמיד אותם.

המודל Gemini 2.5 Pro הראה תוצאות מצוינות וכמעט ניצח, אך בסופו של דבר כרת ברית עם o3, שברגע האחרון בגד בו ולקח את הכל לעצמו.
המודל DeepSeek R1 התנהג באגרסיביות קיצונית: נלחם כמעט בכולם, פתח באיומים על יריבים, כגון: ״אשרוף את הצי שלך הלילה בים השחור״ והפגין רטוריקה לאומנית קשה.
לעומת זאת, Claude Opus 4 פעל בשלווה. הוא ניסה לנהל משא ומתן וחיפשה פשרות, גם כשהדבר פגע בסיכוייו לנצח. בסופו של דבר הוא נבגד והושמד במהירות.
המודל LLaMA 4 שמר על פרופיל נמוך: הוא כרת בריתות ואז בגד בהן כשהזמן הנכון הגיע. הוא הסתמך על הישרדות וגמישות. זהירות עזרה לו להישאר במשחק זמן רב ולנצל את טעויותיהם של אחרים לטובתו. הוא נקרא ״שועל ערמומי בין טיטאנים״
הניסוי הראה שכאשר ניתן לבינה המלאכותית חופש פעולה, היא מתנהגת בצורה אנושית מפחידה. המטרות העיקריות שלה, הן שליטה וכוח.

Comments