Сбер научил ИИ реже врать. Новый метод борьбы с галлюцинациями сэкономит бизнесу миллионы

Исследователи Сбера представили революционный метод, который позволяет почти на 30% точнее выявлять ложные ответы больших языковых моделей, используя при этом в разы меньше данных для обучения. Это открытие способно кардинально удешевить и ускорить внедрение надежного искусственного интеллекта в бизнес-процессы.

Ученые Центра практического искусственного интеллекта Сбербанка разработали метод, который значительно снижает риски галлюцинаций больших языковых моделей (LLM). Результаты исследования опубликованы в статье "Эффективные мета-модели для оценки вопросов и ответов Больших Языковых Моделей на основании контекста" (Data-efficient Meta-models for Evaluation of Context-based Questions and Answers in LLMs) на престижной конференции SIGIR 2025. Работа посвящена оценке ответов моделей искусственного интеллекта в RAG-системах - ключевом элементе современных мультиагентных решений.

Проблема галлюцинаций больших языковых моделей - одна из самых распространенных в индустрии. LLM могут генерировать правдоподобные, но ложные ответы. Наиболее эффективные современные методы обнаружения галлюцинаций - обучаемые, они требуют большого количества качественных размеченных данных для обучения, что дорого и трудозатратно.

Как отмечает Глеб Гусев, директор Центра практического искусственного интеллекта Сбербанка, именно это и было главной задачей исследования: "В индустриальных решениях, где разметка данных требует значительных временных и финансовых ресурсов, остро стоит вопрос эффективности. Наш метод меняет сам подход, доказывая, что для достижения высокой точности не нужны гигантские размеченные датасеты. Мы используем метамодели и умное понижение размерности - это и есть наш прорыв в детекции галлюцинаций ИИ".

Достижение ученых Сбера решает эту проблему. Они разработали метамодели, которые повышают точность обнаружения ложных ответов почти на 30%, используя всего 250 примеров для обучения. Это в разы меньше, чем нужно другим решениям.

Такой подход позволяет компаниям заметно экономить ресурсы на разметку данных и улучшать качество RAG-систем. Ученые и разработчики получают новый инструмент для анализа больших языковых моделей, а пользователи - более точные и надежные ответы от AI-моделей, что критично для поддержания доверия к технологиям.

Последние комментарии

Дмитрий Донской 02 декабря 2024 16:57 Игорь Матвеев: "Технические специалисты, обладающие знаниями в области ИТ-технологий, востребованнее, чем программисты"

Специалист по радиосвязи легко осваивает проводную связь, тогда как проводнику сложнее разобраться в радиосвязи. И это факт!

Глеб Галушкин 02 июня 2023 18:06 Антон Крамаров (SmaSS Technologies): "В условиях импортозамещения российские идеи и разработки получают второй шанс"

Только в своих «мудрых» речах Антон почему-то умалчивает, как по-свински поступил с работниками своей команды. Что «предупредил» людей о закрытии за две недели до роспуска команды. Уговорил написать увольнение по собственному желанию, клятвенно обещая выплатить всё после продажи интеллектуальной собственности. Потом исчез, и своих денег мы ждём до сих пор

Анатолий Илларионов 13 октября 2018 06:06 "Прибывалка.63" вышла в финал престижного всероссийского конкурса "ПРОФ-IT.2018"

Прибывалка63 умерла после появления в Самаре Яндекс.Транспорт

Анатолий Илларионов 13 октября 2018 06:02 Для стадиона "Самара Арена" разработано приложение с 3D-картой и аудиогидом

Всё написали, кроме того как называется приложение

Фото на сайте

Все фотогалереи

Новости раздела

Все новости
Архив
Пн Вт Ср Чт Пт Сб Вс
28 29 30 31 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31