policy puppetry

  1. NewsMaker

    Новости Как одной шуткой превратить ChatGPT в пособника хаоса

    Сыграли в ролевую — получили катастрофу. Специалисты HiddenLayer разработали первую универсальную технику атак на ИИ, способную обойти защиту практически всех передовых языковых моделей. Новый метод под названием Policy Puppetry позволяет нарушить встроенные ограничения моделей и добиться...