bon jailbreaking

  1. NewsMaker

    Новости BoN Jailbreaking: незнание грамматики открыло тёмную сторону ИИ

    Ошибки в тексте помогли взломать мозг чатбота. Согласно новому отчету Anthropic, обход ограничений LLM-моделей остаётся довольно простым и может быть автоматизирован. Группа ученых разработали алгоритм Best-of-N (BoN) Jailbreaking, который позволяет обходить защитные механизмы современных...