ГигаЧат подтвердил знания в области математики и компьютерных наук

Нейросеть Сбера ГигаЧат подтвердила уровень знаний, достаточный для успешной сдачи экзамена по направлению "Математика и компьютерные науки" на уровне выпускника магистратуры. В ходе аттестационного испытания, проведенного на базе Сколтеха, работа модели была оценена аттестационной комиссией на оценку 4 ("хорошо").

Аттестация проходила в два этапа. Сначала модель прошла тестирование на 500 уникальных вопросах закрытого типа в формате MMLU, которые были разработаны преподавателями Сколтеха. Они охватывали 9 тем в области компьютерных наук: алгоритмы и структуры данных, базы данных, кибербезопасность, программное обеспечение, программирование, сети и оборудование, специализированное ПО, управление и искусственный интеллект. Средний показатель правильных ответов модели на вопросы составил 76,9%.

Второй этап — очный экзамен с участием аттестационной комиссии, состоящей из 8 докторов технических и физико-математических наук. Эксперты комиссии выбрали 3 билета из 45, по которым проводили оценку знаний ГигаЧат. Каждый билет содержал два задания — теоретическое (проверка фундаментальных знаний в предметной области) и практическое (прикладная задача). Все задачи были разработаны специально для этого испытания и отсутствовали в открытых базах, что исключало возможность поиска готовых ответов и требовало от нейросети применения реальных знаний. Для объективной оценки глубины компетенций эксперты не только проверяли ответы, но и задавали уточняющие вопросы, просили объяснить ход рассуждений и анализировали работу модели с нестандартными формулировками.

Оценка проводилась по профильному принципу: например, при оценке ответов модели на задания по программированию решающий голос принадлежал соответствующему эксперту. Применение весовых коэффициентов позволило обеспечить максимальную объективность аттестации. По итогам очного экзамена модель набрала 7 из 10 баллов по шкале Сколтеха, что соответствует итоговой оценке 4 ("хорошо").

Ранее ГигаЧат успешно сдал ЕГЭ по обществознанию, профильные экзамены по медицине, финансам, экономике, музыковедению и другим направлениям в ведущих вузах страны.

Последние комментарии

Дмитрий Донской 02 декабря 2024 16:57 Игорь Матвеев: "Технические специалисты, обладающие знаниями в области ИТ-технологий, востребованнее, чем программисты"

Специалист по радиосвязи легко осваивает проводную связь, тогда как проводнику сложнее разобраться в радиосвязи. И это факт!

Глеб Галушкин 02 июня 2023 18:06 Антон Крамаров (SmaSS Technologies): "В условиях импортозамещения российские идеи и разработки получают второй шанс"

Только в своих «мудрых» речах Антон почему-то умалчивает, как по-свински поступил с работниками своей команды. Что «предупредил» людей о закрытии за две недели до роспуска команды. Уговорил написать увольнение по собственному желанию, клятвенно обещая выплатить всё после продажи интеллектуальной собственности. Потом исчез, и своих денег мы ждём до сих пор

Анатолий Илларионов 13 октября 2018 06:06 "Прибывалка.63" вышла в финал престижного всероссийского конкурса "ПРОФ-IT.2018"

Прибывалка63 умерла после появления в Самаре Яндекс.Транспорт

Анатолий Илларионов 13 октября 2018 06:02 Для стадиона "Самара Арена" разработано приложение с 3D-картой и аудиогидом

Всё написали, кроме того как называется приложение

Фото на сайте

Все фотогалереи

Новости раздела

Все новости
Архив
Пн Вт Ср Чт Пт Сб Вс
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5