В эпоху становления цифровой экономики традиционные представления о числах и данных существенно изменились. Возникла даже целая отрасль науки о больших данных (Data Science). О новых понятиях и тенденциях в этой науке, а также о ее связи с искусственным интеллектом и о роли научно-исследовательской лаборатории искусственного интеллекта в их развитии рассказала заместитель заведующего НИЛ ИИ ПГУТИ Оксана Захарова.
Большие числа - большие проблемы
Формального определения больших данных не существует. Более 60 лет назад один из крупнейших математиков ХХ века Андрей Колмогоров объяснил научному сообществу, что такое маленькие, средние и большие числа.
Вот один пример того, как появляются большие данные (Big Data). К электрической лампочке присоединены три выключателя, каждый из которых может находиться в левом или в правом положении. Существует восемь возможных вариантов совместных положений выключателей. Проводку к ним можно подвести таким образом, чтобы в каждом из восьми положений лампочка или горела, или не горела. Получится 256 возможных комбинаций. Если выключателей, допустим, пять, комбинаций будет уже 4 294 967 296. А если шесть, то число комбинаций превысит количество атомов во Вселенной.
А теперь представим, что на одну из лекций пришла тысяча человек, и лектор решил с каждым из них поздороваться за руку. При личном контакте он получит информацию о человеке (пол, примерный возраст, рост и т.д.), на основе которой можно определить, например, процентное соотношение мужчин и женщин, их средний возраст (в науке о данных это называется "разметка данных"). Если же попросить всю тысячу присутствующих обменяться рукопожатиями друг с другом, то нашему мозгу не под силу будет сосчитать общее число контактов и тем более обработать в разы увеличившееся количество сведений. Получается, тысяча - это среднее число, потому что мы осознанно не можем проанализировать такое количество элементов.
Сверхсущность или обычная ЭВМ?
Человеческий мозг с легкостью может строить теории, делать выводы и принимать решения при малом наборе сведений. А вот большие объемы данных, и даже средние, люди уже не в силах проанализировать. Для этого и создан искусственный интеллект, который формально определяют как набор методов, алгоритмов, сред и технологий для обработки данных любого типа.
Цель обработки - составление всевозможных прогнозов, разработка классификаций, выявление аномалий, а также получение нового знания, обнаружение новых интересных закономерностей в данных. И компьютер с этим справится гораздо лучше человека. Но все же надо помнить, что у машины всегда есть вероятность погрешности, пусть и минимальной. Поэтому слепо доверять ей не стоит.
Все мы знаем о существовании "трех китов" информатики: это данные, информация и знания. "Сырые" данные мы превращаем в информацию. А из нее, в свою очередь, извлекаем знания - неизвестные ранее сведения. С позиции искусственного интеллекта, информация - структурированные данные. А знания - структурированная информация. Сейчас ученые работают над автоматизацией процессов структуризации.
Однако популярность термина "искусственный интеллект" во многом объясняется его ошибочным толкованием, в частности, когда им обозначают некую искусственную сущность, наделенную разумом, которая якобы в состоянии конкурировать с людьми. Эта мысль из области древних легенд и преданий, звучащая как миф о Големе, с недавних пор реанимируется такими нашими современниками, как британский физик Стивен Хокинг (1942-2018 гг.), американский предприниматель Илон Маск и американский инженер Рэй Курцвейл, а также сторонниками создания так называемого сильного или общего ИИ.
Не будем, впрочем, говорить о данном понимании этого термина, ибо оно скорее представляет собой появившийся под влиянием научной фантастики продукт богатого воображения, а не осязаемую научную реальность, подтвержденную опытами и эмпирическими наблюдениями.
Сплели нейронные сети
Если говорить об ИИ, нельзя не упомянуть такое популярное в наше время понятие, как нейронные сети. Нейронные сети были придуманы лет 60 назад. Сегодня они стали основным инструментом глубокого обучения (Deep Learning) - методов машинного обучения, основанных на имитации работы человеческого мозга в процессе обработки данных.
Мы знаем, что в нашем мозге есть нейроны (нервные клетки), соединенные друг с другом аксонами (длинными цилиндрическими отростками нервной клетки). А с точки зрения информатики нейронная сеть - это математическая модель, в которой искусственные нейроны (простые процессоры) объединены в систему и взаимодействуют друг с другом. Так, каждый процессор периодически получает сигналы от других процессоров, а также посылает сигналы сам. И такая с виду простая сеть способна выполнять довольно сложные задачи.
Схема работы нейросети выглядит так: входные нейроны получают исходные данные, скрытые нейроны обрабатывают информацию, а выходные нейроны выводят готовый результат. Таким образом, в зависимости от характера задачи определенное количество нейронов получает входные данные, а затем передает их на скрытый средний слой. Машина ищет закономерности среди огромного количества нейронных связей и "принимает" решение.
От физического тела - к цифровому двойнику
А что потом? Data Science уже начала менять наш мир. Мы никуда не денемся от цифровизации. Окружающие нас вещи будут постепенно лишаться физического тела и переходить в виртуальность под лозунгом: "Все, что может быть лишено физического тела, будет его лишено, превратившись в цифрового двойника".
Можно предположить, что в недалеком будущем после полной цифровизации геномов белковых тел станет вероятным отправлять их цифровую копию по электронной почте. Кстати, уже сейчас наблюдается тенденция падения спроса на программистов, стали востребованы другие специалисты - компьютерные лингвисты, специалисты по машинному обучению, архитекторы виртуальности, аналитики Big Data. Особенно этот процесс будет ускоряться в связи с появлением ChatGPT.
ПГУТИ создает кадры для цифровой экономики будущего
В России в последние два года сделан серьезный шаг вперед, совершен скачок и на уровне регионов, и на уровне правительства для того, чтобы создать условия для развития искусственного интеллекта практически во всех сферах. Сегодня явно виден рост интереса к развитию и внедрению технологии искусственного интеллекта.
Поволжский государственный университет телекоммуникаций и информатики является одним из первых образовательных учреждений региона, которое оценило перспективы развития данных технологий.
В январе 2020 года в ПГУТИ была создана Научно-исследовательская лаборатория искусственного интеллекта (НИЛ ИИ). Возглавил ее Сергей Левашкин, выпускник МГУ им. М.В.Ломоносова, ученый с более чем 20-летним опытом работы в университетах и компаниях России, Северной Америки и Европы.
В контексте национальной программы "Цифровая экономика РФ" и "Плана 2030", создание НИЛ ИИ является стратегическим проектом, поскольку наука о данных, искусственный интеллект и бизнес-интеллект являются ключевыми факторами цифровой трансформации экономики.
Сегодня лаборатория занимает лидирующее положение в НИР и НИОКР университета по ИИ и решает самые разнообразные задачи, включая научно-исследовательскую работу в области науки о данных, искусственного интеллекта и машинного обучения, а также подготовку высококвалифицированных кадров для цифровой экономики.
Искусственный интеллект хорошо работает в интересах и на благо людей, если его создает и применяет грамотный, хорошо подготовленный человек.
Лаборатория обеспечивает содержанием факультатив и магистерскую программу "Наука о данных и искусственный интеллект", а также коммерческий курс "Бизнес-интеллект".
Студенческий курс содержит популярное введение в науку о больших данных и основные методы искусственного интеллекта для их обработки. Он мотивирует студентов старших курсов на поступление в магистратуру "Наука о данных и искусственный интеллект", но доступен также студентам младших курсов и самой широкой публике.
Коммерческий курс - введение в науку о больших данных и основные методы искусственного интеллекта для их обработки. Курс рассчитан на повышение цифровой грамотности управленцев, представителей коммерческих компаний и т.д. Содержит примеры приложений методов искусственного интеллекта в различных областях экономики, бизнеса, управления и т.д.
В 2022 году на базе НИЛ ИИ ПГУТИ впервые был осуществлен прием в магистратуру по профилю "Прикладной искусственный интеллект и наука о данных" по программе МГУ.
В рамках реализации программы осуществляется подготовка специалистов в области искусственного интеллекта и науки о данных, способных применять фундаментальные знания математических и естественных наук, программирования и информационных технологий при решении прикладных задач различного уровня сложности с целью удовлетворения потребностей промышленности, бизнеса и науки, муниципального и государственного управления, решения иных задач.
Активно ведется студенческая научная работа. Студенты и магистранты уже с самых ранних курсов обучения имеют возможность работать над реальными практическими задачами, осваивать новые компетенции в области искусственного интеллекта и науки о данных, принимая участие в научной и грантовой деятельности лаборатории.
Лаборатория активно ведет НИР и выигрывает различные гранты - от математического моделирования распространения вирусных заболеваний до разработки модулей для системы "Умные дороги".
Кроме того, лаборатория НИЛ ИИ входит в состав Рабочего комитета "Искусственный интеллект" НОЦ "Инженерия будущего" - это научно-образовательный центр, объединяющий науку и реальный сектор экономики. Основным направлением от ПГУТИ в области искусственного интеллекта является разработка инфокоммуникационных технологий на основе анализа BigData. Куратор направления - заведующий лабораторией Сергей Левашкин.
В горизонте текущего десятилетия задача лаборатории - обеспечить массовое внедрение искусственного интеллекта. Оно должно охватить все отрасли экономики, социальной сферы и систему госуправления.
Научный поиск НИЛ ИИ ПГУТИ
- Программное обеспечение формализации и извлечения знаний о сложных информационных объектах
- Алгоритмы и программное обеспечение машинного обучения (machine learning)
- Аналитическое программное обеспечение нового поколения (next-generation analytics)
- Мультиязычные (инвариантные к исходным языкам) и мультимодальные (инвариантные к типу контента) системы извлечения и формализации информации (nlp)
- Алгоритмы и программное обеспечение для формализации и извлечения знаний из слабоструктурированной и неструктурированной информации.
- Математические модели распространения вирусных заболеваний и их исследование методами искусственного интеллекта
- Семантико-ассоциативный анализ и синтез телекоммуникационных данных
Источник: Научно-исследовательская лаборатория искусственного интеллекта ПГУТИ
Реализованные гранты НИЛ ИИ ПГУТИ (2022 год)
- "Вирусы I": Многофакторное моделирование с применением технологий искусственного интеллекта структурно-динамического равновесия социально-экономической системы РФ при распространении пандемии (РФФИ/РНФ)
- "Вирусы II": Математическое моделирование распространения вирусных заболеваний (Минобраз/РосАтом)
- "Умные дороги": Разработка модуля интеллектуальной обработки данных системы мониторинга оптоволоконных сигналов (Haulmont).
- "СМАРТ продукты": Применение алгоритмов ИИ для компьютерного моделирования новых продуктов, товаров и услуг с заданными свойствами (Минцифры РФ).
Источник: Научно-исследовательская лаборатория искусственного интеллекта ПГУТИ
Ссылки: https://ai.psuti.ru/
https://t.me/laboratoria_psuti
Автор выражает благодарность за помощь в подготовке статьи заведующему НИЛ ИИ Сергею Павловичу Левашкину.
Последние комментарии
Берег в Рождествено у людей украл
Только в своих «мудрых» речах Антон почему-то умалчивает, как по-свински поступил с работниками своей команды. Что «предупредил» людей о закрытии за две недели до роспуска команды. Уговорил написать увольнение по собственному желанию, клятвенно обещая выплатить всё после продажи интеллектуальной собственности. Потом исчез, и своих денег мы ждём до сих пор
Прибывалка63 умерла после появления в Самаре Яндекс.Транспорт
Всё написали, кроме того как называется приложение
Мания величия у него. Сравнивает себя с Джобсом, хотя из результатов у него попиленные деньги