sciarena

  1. NewsMaker

    Новости O3 уверена в себе, Claude — врач, DeepSeek — натуралист: кто кем стал в SciArena

    Открытый бой без масок: кто из LLM оказался ближе к настоящему учёному? Allen Institute представил SciArena — открытую платформу для оценки качества ответов больших языковых моделей (LLM) в научных задачах. Проект ориентирован на сравнение моделей в условиях, приближенных к реальному...