обучение с подкреплением

  1. NewsMaker

    Новости 7,5 трлн токенов, 256К контекста и CLI: Qwen3-Coder справляется с задачами, где другие сходят с ума

    Команда Qwen представила новую модель для генерации и сопровождения кода. Команда Qwen представила Qwen3-Coder — новую модель для генерации и сопровождения кода, ориентированную на агентные сценарии использования. Это самая мощная кодовая модель Qwen на сегодняшний день, поддерживающая...
  2. NewsMaker

    Новости 7,5 трлн токенов, 256К контекста и CLI: Qwen3-Coder справляется с задачами, где другие сходят с ума

    Команда Qwen представила новую модель для генерации и сопровождения кода. Команда Qwen представила Qwen3-Coder — новую модель для генерации и сопровождения кода, ориентированную на агентные сценарии использования. Это самая мощная кодовая модель Qwen на сегодняшний день, поддерживающая...
  3. NewsMaker

    Новости Роботы на скейтбордах: как новый ИИ-алгоритм учит их сложным трюкам

    Забудьте о шаблонных подходах – теперь машины импровизируют. Четвероногие роботы уже давно перестали быть чем-то из области фантастики. Они умеют ходить, бегать, прыгать и уверенно маневрировать на сложных поверхностях. Однако до недавнего времени им было трудно справляться с задачами, где...
  4. NewsMaker

    Новости Искусственный интеллект Google DeepMind создает эффективные алгоритмы без примеров человеческого кода

    Как Google DeepMind научила свою систему обучения с подкреплением создавать оптимизированные алгоритмы для сортировки и хеширования данных. Группа исследователей из Google DeepMind разработала систему обучения с подкреплением, которая может создавать оптимизированные алгоритмы без...