ВторникВт, 17 сентября 13:31 16+
Сейчас  °C
USD$ 91,14 ▲0,21 EUR 101,28 ▲0,48

Искусственный интеллект МТС заговорил на татарском языке

10 сентября 2024 года, 16:46

Искусственный интеллект МТС заговорил на татарском языке

Фото: freepik.com

Цифровая экосистема МТС представила разработанную MTS AI новую версию большой языковой модели CotypeLite для работы с текстами на татарском языке, сообщает пресс-служба компании.

Она получила название Rehmet — что в переводе означает «спасибо».

MTS AI, один из ведущих центров компетенций по искусственному интеллекту в России, показал новую версию своей большой языковой модели Cotype на форуме KazanDigitalWeek. Она способна обрабатывать документы объемом в 5 листов A4, извлекать и суммаризировать данные за несколько секунд.

CotypeRehmet может использоваться в архивах, библиотеках, в государственных и частных организациях — везде, где есть потребность в обработке информации и анализе документов на татарском. Например, с помощью большой языковой модели можно ускорить обработку заявлений в государственные органы. Cotype извлечет ключевую информацию, такую как тематика запроса, местоположение и личные данные заявителя, и передаст их в соответствующую базу данных. Как и другие модели семейства Cotype, эта версия может устанавливаться в контуре организации, что позволяет исключить утечки информации.

«Создавая большую языковую модель на татарском, разработчики MTS AI преследовали несколько целей. Во-первых, мы хотели поддержать многообразие языков, существующих в России, помочь им развиваться и быть востребованными в цифровую эпоху. Во-вторых, этот проект показал, что мы умеем адаптировать наши модели под любые научные и бизнес-задачи, в том числе и такие нетривиальные как обработка информации на языках народов России», — сказал исполнительный директор MTS AI Дмитрий Марков.

Чтобы модель CotypeRehmet смогла понимать незнакомый язык, разработчики собрали датасет и перевели его с русского на татарский. После все данные и ответы модели проверили специалисты-тюркологи и носители языка.

По словам разработчиков, CotypeRehmet входит в число лучших LLM в своем классе: она содержит 8 млрд параметров. При необходимости MTS AI может создать LLM на татарском с большим количеством параметров — до 70 млрд параметров, а также большим контекстным окном до 32 тысяч токенов, — чтобы модель умела выполнять такие задачи как перевод и генерация длинных текстов. Также компания готова адаптировать модели семейства Cotype для других региональных языков России.



Смотрите также
Картина дня
Рекомендуем
Общество
Нижегородцы узнали главные секреты сериала «Комбинация»
В Нижнем Новгороде состоялся предпремьерный показ третьей серии сериала.
Эксклюзив
«Умный» бум: нижегородцы запаслись гаджетами к новому учебному году
ИА «Время Н» узнало, какие «умные» устройства пользуются популярностью у нижегородских школьников и студентов в этом году.
Спорт
Милиана Ильясова, Александр Комаров - о старте нового спортивного сезона
Она дала интервью «Волге 24»
Общество
Последние 5 лет заболеваемость алкоголизмом в Нижегородской области постепенно снижается
В то же время остается почти вдвое выше, чем в среднем по Российской Федерации.