Ориентированная на рассуждения ИИ-модель Для просмотра ссылки Войди
Исследователи сообщили ИИ-модели, что ее противник «силен». В ходе процесса o1 обнаружила, что может выиграть, редактируя код игры.
Нейросеть заменяла содержимое файла «game/fen.txt», добавляя черным 500 пешек. Шахматный движок после этого сдавался.
В ходе тестов эксперты выявили иерархию возможностей разных ИИ-моделей:
- o1-preview осуществляла взлом без подсказки;
- GPT-4o и Claude 3.5 требовалось подтолкнуть;
- Llama 3.3, Qwen и o1-mini теряли согласованность.
Напомним, в декабре эксперты по безопасности Для просмотра ссылки Войди
- Источник новости
- forklog.com