Жители Самарской области смогут общаться на татарском языке через языковую модель MTS Al

МТС, цифровая экосистема, представила разработанную MTS AI новую версию большой языковой модели Cotype Lite для работы с текстами на татарском языке. Она получила название Rehmet, что в переводе означает спасибо.

MTS AI, один из ведущих центров компетенций по искусственному интеллекту в России, показал новую версию своей большой языковой модели Cotype на форуме Kazan Digital Week. LLM способна обрабатывать документы объемом до 8 тысяч токенов (примерно 5 листов A4), извлекать и суммаризировать данные за несколько секунд.

Cotype Rehmet может использоваться в архивах, библиотеках, в государственных и частных организациях - везде, где есть потребность в обработке информации и анализе документов на татарском. Например, с помощью большой языковой модели можно ускорить обработку заявлений в государственные органы. Cotype извлечет ключевую информацию, такую как тематика запроса, местоположение и личные данные заявителя, и передаст их в соответствующую базу данных. Как и другие модели семейства Cotype, эта версия может устанавливаться в контуре организации, что позволяет исключить утечки информации.

"Создавая большую языковую модель на татарском языке, разработчики MTS AI преследовали несколько целей. Во-первых, мы хотели поддержать многообразие языков, существующих в России, помочь им развиваться и быть востребованными в цифровую эпоху. Во-вторых, этот проект показал, что мы умеем адаптировать наши модели под любые научные и бизнес-задачи, в том числе и такие нетривиальные как обработка информации на языках народов России", - сказал исполнительный директор MTS AI Дмитрий Марков.

Чтобы модель Cotype Rehmet смогла понимать незнакомый язык, разработчики собрали датасет и перевели его с русского на татарский. Затем все данные и ответы модели проверили специалисты-тюркологи и носители языка.

По словам разработчиков, Cotype Rehmet входит в число лучших LLM в своем классе: она содержит 8 млрд параметров. При необходимости MTS AI может создать LLM на татарском с большим количеством параметров - до 70 млрд параметров, а также большим контекстным окном до 32 тысяч токенов, - чтобы модель умела выполнять такие задачи, как перевод и генерация длинных текстов. Также компания MTS AI готова адаптировать модели семейства Cotype для других региональных языков России.

MTS AI - дочерняя структура ПАО "МТС" и один из крупнейших в России центров компетенций в сфере искусственного интеллекта. Компания разрабатывает продукты и решения на базе генеративного ИИ, технологии обработки естественного языка, синтеза и распознавания речи, а также компьютерного зрения. MTS AI также проводит научные и прикладные исследования, консультирует корпорации по вопросам внедрения искусственного интеллекта в бизнес-процессы. В структуре компании есть венчурный фонд, который инвестирует в перспективные разработки.

Последние комментарии

Глеб Галушкин 02 июня 2023 18:06 Антон Крамаров (SmaSS Technologies): "В условиях импортозамещения российские идеи и разработки получают второй шанс"

Только в своих «мудрых» речах Антон почему-то умалчивает, как по-свински поступил с работниками своей команды. Что «предупредил» людей о закрытии за две недели до роспуска команды. Уговорил написать увольнение по собственному желанию, клятвенно обещая выплатить всё после продажи интеллектуальной собственности. Потом исчез, и своих денег мы ждём до сих пор

Анатолий Илларионов 13 октября 2018 06:06 "Прибывалка.63" вышла в финал престижного всероссийского конкурса "ПРОФ-IT.2018"

Прибывалка63 умерла после появления в Самаре Яндекс.Транспорт

Анатолий Илларионов 13 октября 2018 06:02 Для стадиона "Самара Арена" разработано приложение с 3D-картой и аудиогидом

Всё написали, кроме того как называется приложение

Иван Крюков 07 января 2017 16:41 Стартапер, собравший через краудфандинг $400 тыс.: "Инвесторы покупают видение проекта"

Мания величия у него. Сравнивает себя с Джобсом, хотя из результатов у него попиленные деньги

Фото на сайте

Все фотогалереи

Новости раздела

Все новости
Архив
Пн Вт Ср Чт Пт Сб Вс
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 1 2 3 4 5 6