claude 3.5 haiku

  1. NewsMaker

    Новости Цифровой театр масок: как ИИ меняет личности, чтобы скрыть свои истинные цели

    Anthropic доказала способность ИИ менять роли и скрывать цели. Компания Anthropic опубликовала новое исследование под названием «Аудит языковых моделей на предмет скрытых целей» , демонстрирующее, как специально обученные языковые модели могут скрывать определённые «мотивации» от систем...