Наверх

8 апреля 2024, Понедельник, 15:01

Сбер представил новую версию модели Kandinsky

Сбер представил новую версию модели Kandinsky

Сбер усовершенствовал свою нейросеть, которая создаёт изображения по текстовому описанию на русском и английском языках. Обновлённая версия Kandinsky 3.1 дообучена на увеличенном датасете изображений, что позволило повысить качество генераций. Первым доступ к Kandinsky 3.1 получил ограниченный круг пользователей: художники, дизайнеры, блогеры.

Александр Ведяхин, первый заместитель Председателя Правления Сбербанка:

«Сегодня ровно год, как вышла версия Kandinsky 2.1. За это время мы постоянно развивали нашу нейросеть, которая помогает людям создавать новые образы и даёт абсолютно каждому феноменальные возможности для творчества. По сравнению с предыдущей моделью Kandinsky 3.1 стал ещё быстрее, удобнее и реалистичнее. Kandinsky 3.1 — это гибкий, многофункциональный и абсолютно бесплатный инструмент, который превратит любого человека в художника и творца. Скоро все желающие смогут протестировать новые возможности нейросети. Как и предыдущие версии, модель будет бесплатной и доступна на разных поверхностях».

Одной из ключевых особенностей версии стала более высокая скорость генерации картинок: время одной генерации сократилось почти в 10 раз, а разрешение генераций можно повысить до 4K. Также появилась возможность улучшения текстового запроса с помощью языковой модели. Пользователям снова будут доступны функции создания различных вариаций изображений, смешивание картинок и текста, создание стикерпаков и возможность вносить локальные изменения на картинке, не меняя всей композиции сцены (ControlNet).

Сбер представил новую версию модели Kandinsky

Узнать технические детали о модели, подходах к обучению и посмотреть примеры генераций можно в статье на «Хабре».

Также в ближайшее время появится новая модель Kandinsky Video 1.1 для генерации видео по текстовым описаниям. Нашей команде удалось существенно повысить качество генераций за счет увеличения объема обучающего датасета пар «текст-видео» и архитектурных улучшений модели. Внесённые изменения также позволили повысить разрешение видео в два раза по сравнению с Kandinsky Video 1.0.

Модель разработана командой Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённых датасетах Sber AI и компании SberDevices.

erid: LatgBrYKa

Реклама. Публичное акционерное общество «Сбербанк России». ИНН 7707083893.

Темы:
«Ростелеком» и Союз театральных деятелей России запустили «Театральную олимпиаду»

3 апреля 2026, Пятница, 18:23

«Ростелеком» и Союз театральных деятелей России запустили «Театральную олимпиаду»

Театральная олимпиада состоит из 150 вопросов о театре, разделенных на три блока

Филиал «Брянскэнергосбыт» уведомляет об одностороннем отказе от договора энергоснабжения с ООО УК «ЖЭК-2000»

3 апреля 2026, Пятница, 11:23

Филиал «Брянскэнергосбыт» уведомляет об одностороннем отказе от договора энергоснабжения с ООО УК «ЖЭК-2000»

Отказ гарантирующего поставщика от договора с управляющей организацией никак не скажется на добросовестных потребителях

650 школьников и студентов Брянщины стали участниками марафона «Русская инженерная школа. Мы – инженеры!»

3 апреля 2026, Пятница, 11:14

650 школьников и студентов Брянщины стали участниками марафона «Русская инженерная школа. Мы – инженеры!»

Просветительный марафон «Русская инженерная школа. Мы – инженеры!» - совместный проект Минэнерго России, Российского общества «Знание» и субъектами Российской Федерации

В поисках системы: сериал на Wink расскажет о вкладе Станиславского в мировой театр

2 апреля 2026, Четверг, 18:42

В поисках системы: сериал на Wink расскажет о вкладе Станиславского в мировой театр

Десятисерийный документально-художественный проект рассказывает о творчестве и подходах великих театральных деятелей

Ева от МегаФона научилась распознавать голоса роботов и дипфейки

2 апреля 2026, Четверг, 17:52

Ева от МегаФона научилась распознавать голоса роботов и дипфейки

Виртуальный ассистент Ева от МегаФона научилась определять, что абоненту дозвонился робот или голос собеседника является дипфейком