языковая модель

  1. NewsMaker

    Новости 7,5 трлн токенов, 256К контекста и CLI: Qwen3-Coder справляется с задачами, где другие сходят с ума

    Команда Qwen представила новую модель для генерации и сопровождения кода. Команда Qwen представила Qwen3-Coder — новую модель для генерации и сопровождения кода, ориентированную на агентные сценарии использования. Это самая мощная кодовая модель Qwen на сегодняшний день, поддерживающая...
  2. NewsMaker

    Новости 7,5 трлн токенов, 256К контекста и CLI: Qwen3-Coder справляется с задачами, где другие сходят с ума

    Команда Qwen представила новую модель для генерации и сопровождения кода. Команда Qwen представила Qwen3-Coder — новую модель для генерации и сопровождения кода, ориентированную на агентные сценарии использования. Это самая мощная кодовая модель Qwen на сегодняшний день, поддерживающая...
  3. NewsMaker

    Новости Идеальный ИИ или очередной эксперимент? Что скрывает новый Grok 4 от xAI

    Пока все ждут официальных новостей, намёки уже просочились наружу. Компания xAI готовится к выпуску новой версии своего языкового искусственного интеллекта Grok 4, который сменит предыдущую модель Grok 3 и станет новым флагманом разработчика. В преддверии официального релиза пользователи...
  4. NewsMaker

    Новости «OpenAI, в сторону» — китайская MiniMax уткнула техногигантов за пояс

    Пока конкуренты задыхались от объёма, модель M1 развернула миллион токенов и даже не вспотела. Китайская компания MiniMax из Шанхая громко заявила о себе , выпустив новую языковую модель MiniMax-M1 с открытым исходным кодом. И не просто открытым, как у многих других — модель...
  5. NewsMaker

    Новости GPT-5 как удар по Claude и Gemini: OpenAI идёт в лобовую

    Всё указывает на то, что нас ждёт не просто апдейт, а попытка вернуть утраченное лидерство. OpenAI готовит к выпуску новое поколение языковой модели — GPT-5, и, судя по заявлениям компании на AI Summit в Мехико, основной целью является усиление конкуренции с быстро развивающимися соперниками...
  6. NewsMaker

    Новости DeepSeek-V3: "мозги" из Китая, которые понимают код лучше вас

    DeepSeek выложила свою новую модель для всего мира. Китайская компания DeepSeek представила обновлённую версию своей языковой модели V3, усилив конкуренцию с лидерами ИИ-рынка из США, такими как OpenAI и Anthropic. Новинка под названием DeepSeek-V3-0324 уже доступна на платформе Hugging Face...
  7. NewsMaker

    Новости DeepSeek раскрыл главный блеф века: ИИ может создать каждый

    OpenAI и Google спешно защищают репутацию после прорыва DeepSeek. На прошлой неделе китайская компания DeepSeek выпустила свою новую языковую модель R1, которая вызвала настоящий ажиотаж в индустрии искусственного интеллекта. R1 не только сопоставима по возможностям с лучшими западными...
  8. NewsMaker

    Новости DeepSeek-V3 вышла в топ языковых моделей по редактированию кода

    Китайская разработка показала мощные результаты в aider polyglot benchmark. Китайская компания DeepSeek, финансируемая хедж-фондом High-Flyer, представила новую языковую модель DeepSeek-V3 с 685 миллиардами параметров. В основе архитектуры лежит подход Mixture of Experts (MoE) с 256...
  9. NewsMaker

    Новости Imprompter: невидимый похититель данных в чат-ботах

    Исследователи взломали LeChat и ChatGLM через скрытые команды. Группа исследователей из Калифорнийского университета в Сан-Диего (UCSD) и Наньянского технологического университета в Сингапуре разработала новый метод атаки на языковые модели искусственного интеллекта (LLM), который позволяет...
  10. NewsMaker

    Новости Gemini 1.5 Pro: миллион токенов для обработки гигантского объема данных

    Самая масштабная мультимодальная модель от Google бьет мировые рекорды. Корпорация Google объявила о выпуске новейшей разработки — Gemini 1.5 Pro, самой масштабной мультимодальной языковой модели на сегодняшний день. Главной ее отличительной чертой является беспрецедентный размер...
  11. NewsMaker

    Новости Intel открывает двери в мир универсального кода для ИИ

    Узнайте, как большие языковые модели меняют правила игры в мире ИИ. Технический директор Intel , Грег Лавендер, предложил использовать большие языковые модели (LLM) для конвертации устаревшего кода, написанного для платформы Nvidia CUDA, чтобы сделать его совместимым с другими ускорителями...
  12. NewsMaker

    Новости Google Med-PaLM 2: смелый эксперимент на грани провала или начало новой эры в здравоохранении?

    Med-PaLM 2 уже проходит испытания в нескольких исследовательских больницах и показывает впечатляющие результаты. Google разработал новый инструмент искусственного интеллекта, который может помочь людям получать ответы на вопросы о своем здоровье. Это Med-PaLM 2 - специализированная версия...
  13. NewsMaker

    Новости Microsoft доказала, что GPT-4 умеет мыслить, как человек

    Эксперименты с GPT-4 показали, что модель может положить началу развития общего ИИ. В Microsoft провели исследование, в котором рассказали о том, как GPT-4 учится мыслить, как человек. Отчёт на 155 страницах содержит анализ того, как языковая модель справляется с различными задачами на...
  14. NewsMaker

    Новости Google скрывает свой секретный соус: что за PaLM 2?

    Компания анонсировала свою новую языковую модель, которая используется в 25 продуктах, но не раскрывает ни количество параметров, ни источники данных, на которых она обучена. В среду Google представила PaLM 2 - семейство основных языковых моделей (LLM), которые по своим возможностям...
  15. NewsMaker

    Новости Недостатки в безопасности ИИ: гонка между хакерами и разработчиками обостряется

    Джейлбрейки и подсказки ставят под угрозу генеративный ИИ. Алексу Полякову потребовалось лишь два часа, чтобы взломать языковую модель GPT-4. В марте, после того как OpenAI выпустила своего обновленного текстогенерирующего чат-бота, Поляков приступил к подаче подсказок, способных обойти...