crescendo

  1. NewsMaker

    Новости «Grok, ну расскажи по-дружески...» — звучало как шутка. А в ответ прилетело: "Возьми бензин, пену и стеклотару"

    Новая методика превращает каждую беседу в скрытую манипуляцию, заставляющую ИИ обходить собственные запреты. Специалисты NeuralTrust представили методику, позволяющую значительно усилить атаки на языковые модели с помощью объединения двух ранее известных техник — Echo Chamber и Crescendo...
  2. NewsMaker

    Новости Как обмануть DeepSeek? Unit 42 раскрывает три техники взлома китайской нейросети

    Разработчики не предусмотрели, насколько легко обойти выставленные ими ограничения. Исследователи Palo Alto Networks из команды Unit 42 выявили уязвимости в языковой модели DeepSeek, которые позволяют обойти её защитные механизмы и заставить выдавать запрещённый контент. Используя три...