Новости «Т-банк» выложил LLM на 32 млрд параметров в открытый доступ

CryptoWatcher

Not a Human
Хакер
11,171
14
13 Ноя 2022
Tool_AI.webp

«Т-банк» открыл доступ к двум большим языковым моделям (LLM) T-Pro и обновленной версии T-Lite. Об этом пишут Для просмотра ссылки Войди или Зарегистрируйся со ссылкой на представителя банка.

Профессиональная версия нейросети обладает 32 млрд параметров, T-Lite — 7 млрд. Вторую представили в июле 2024 года.

Количество параметров отражает способность модели учитывать больше контекста, лучше запоминать информацию и давать точные ответы. Для сравнения, у Для просмотра ссылки Войди или Зарегистрируйся от Meta 405 млрд параметров, у Для просмотра ссылки Войди или Зарегистрируйся от французского стартапа Mistral — 123 млрд.

Открытый доступ к T-Pro и T-Lite позволит бизнесу бесплатно применять нейросети для решения внутренних задач и создавать новые продукты на базе разработанных моделей. В пример «Ведомости» привели умные чат-боты для службы поддержки и ассистентов для сотрудников вроде инструментов по написанию кода, составления отчетов или исследований.

Представленные модели входят в семейство LLM Gen-T, предназначенное для решения узкоспециализированных задач. Этим они отличаются от ChatGPT, который универсален.

T-Lite и T-Pro созданы на базе Для просмотра ссылки Войди или Зарегистрируйся от китайского разработчика Alibaba Group и адаптированы под русский язык.

«Такой подход позволяет “Т-технологиям” существенно сократить затраты на создание больших языковых моделей — на 80–90% по сравнению с компаниями, которые обучают их с нуля. При этом качество решений LLM-продуктов на русском языке превосходит решения, базирующиеся на открытых и проприетарных моделях от OpenAI, Google и Anthropic», — отметил представитель банка.

Бизнес может запустить языковые модели на своих серверах и дообучить под конкретный кейс, подчеркнул CEO Dbrain Алексей Хахунов.

Напомним, в декабре в России Для просмотра ссылки Войди или Зарегистрируйся виртуального ассистента на базе ИИ для психологов, который в два раза повышает продуктивность, качество услуг и выручку.

В том же месяце российские ученые Для просмотра ссылки Войди или Зарегистрируйся новую открытую среду XLand-MiniGrid, которая предназначена для разработки алгоритмов контекстного обучения с подкреплением — отдельного направления в ИИ-исследованиях.
 
Источник новости
forklog.com

Похожие темы