Сбер представил флагманскую модель для редактирования и создания изображений

Редактирование изображений в ИИ-помощнике ГигаЧат вышло на новый уровень благодаря обновлённой модели Kandinsky 6.0 Image. У пользователей появился бесплатный ИИ-инструмент редактирования профессионального уровня, без ограничений по количеству генераций. Флагманская модель работает до двух раз быстрее, лучше понимает сложные запросы и создаёт более детализированные изображения.

Фото:

Появились новые возможности редактирования: реставрация снимков, стилизация под актуальные визуальные тренды, нейрофотосессии, смена одежды и локации, ретушь и макияж. Kandinsky стал значительно лучше разбираться в актуальных темах — благодаря встроенному поиску по изображениям.

В ряде задач по качеству редактирования изображений, согласно внутренним замерам, Kandinsky конкурирует с ведущими мировыми моделями — Nano-Banana, Flux и Qwen. Все новые возможности уже доступны в ИИ-помощнике ГигаЧат — в веб-версии, мобильном приложении и мессенджерах.

Антон Фролов, старший вице-президент, руководитель блока "Развитие генеративного ИИ" Сбера:

"Редактирование и создание изображений — одна из самых популярных функций в ИИ-помощнике ГигаЧат: за все время пользователи уже создали несколько сотен миллионов картинок. Наша цель — дать каждому инструмент профессионального уровня с широкими возможностями для самых разных задач, от творчества до работы. С Kandinsky 6.0 мы сделали большой шаг в этом направлении. Также продолжаем развивать наши модели для видео — в ближайшее время пользователи ИИ-помощника получат новые возможности работы с видеоконтентом".

Продвинутое редактирование

Редактирование изображений стало профессиональным: одним текстовым запросом можно добавить объект в кадр или убрать лишнее, наложить фильтр или совместить элементы из разных изображений. Среди новых инструментов — реставрация старых и повреждённых снимков, в котором модель возвращает чёткость выцветшим и поцарапанным фотографиям. Стилизация превращает фото в иллюстрацию в стиле аниме, комикса или мультфильма. Режим нейрофотосессии позволяет сгенерировать серию новых кадров на основе одной фотографии — с другим фоном, одеждой или локацией.

Kandinsky 6.0 точнее понимает сложные многосоставные инструкции и аккуратнее делает точечные правки: если попросить поменять персонажу причёску или добавить очки, всё остальное остаётся нетронутым. Вырос уровень детализации в сложных сценах — интерьерах, сервировке стола, изображениях с большим числом людей. Ошибок и "галлюцинаций" стало меньше, текст на изображениях генерируется корректнее.

Пополнение знаний

Kandinsky 6.0 стал лучше разбираться в актуальных темах благодаря встроенному механизму поиска по изображениям (Image RAG). Если модель не знает, как выглядит объект из запроса, например, новый поп-персонаж, она ищет нужный референс. Так можно генерировать точные изображения даже тех персонажей и объектов, которые появились уже после обучения модели.

Обновлённый ИИ-помощник пригодится для:

  • быстрого редактирования фотографий: убрать лишнее из кадра, освежить старый снимок, примерить новый образ;
  • создания профессионального контента: визуала для соцсетей, стилизации под нужную эстетику, иллюстраций с постоянными персонажами;
  • дизайна и маркетинга: рекламных макетов, подбора фонов и композиций, визуализации идей без сложных программ;
  • строительства и недвижимости: вариантов планировки, визуализации отделки и дизайна интерьера;
  • электронной коммерции: создание карточек товаров, продуктовых сцен и рекламных изображений без фотостудии.

Сгенерированные изображения можно сразу использовать для создания видео — в ИИ-помощнике доступна модель Kandinsky Video для анимации статичного контента.

Как обучали новую модель

В основе Kandinsky 6.0 Image — новая архитектура Mixture of Experts (MoE), которая стала стандартом для передовых нейросетей. Её суть — в специализации: вместо того чтобы задействовать всю модель на каждый запрос, система автоматически выбирает нужных "экспертов" — отдельные блоки внутри неё. Это похоже на работу команды узких специалистов вместо одного универсала: каждый делает своё дело быстро и точно. В результате модель работает быстрее и экономнее, её проще улучшать и дорабатывать.

Последние комментарии

Дмитрий Донской 02 декабря 2024 16:57 Игорь Матвеев: "Технические специалисты, обладающие знаниями в области ИТ-технологий, востребованнее, чем программисты"

Специалист по радиосвязи легко осваивает проводную связь, тогда как проводнику сложнее разобраться в радиосвязи. И это факт!

Глеб Галушкин 02 июня 2023 18:06 Антон Крамаров (SmaSS Technologies): "В условиях импортозамещения российские идеи и разработки получают второй шанс"

Только в своих «мудрых» речах Антон почему-то умалчивает, как по-свински поступил с работниками своей команды. Что «предупредил» людей о закрытии за две недели до роспуска команды. Уговорил написать увольнение по собственному желанию, клятвенно обещая выплатить всё после продажи интеллектуальной собственности. Потом исчез, и своих денег мы ждём до сих пор

Анатолий Илларионов 13 октября 2018 06:06 "Прибывалка.63" вышла в финал престижного всероссийского конкурса "ПРОФ-IT.2018"

Прибывалка63 умерла после появления в Самаре Яндекс.Транспорт

Анатолий Илларионов 13 октября 2018 06:02 Для стадиона "Самара Арена" разработано приложение с 3D-картой и аудиогидом

Всё написали, кроме того как называется приложение

Фото на сайте

Все фотогалереи

Новости раздела

Все новости
Архив
Пн Вт Ср Чт Пт Сб Вс
30 31 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 1 2 3