ВоскресеньеВс, 1 декабря 10:09 16+
Сейчас  °C
USD$ 107,74 EUR 114,31

Сбер представил нейросеть Kandinsky 2.1

4 апреля 2023 года, 18:48

Сбер представил нейросеть Kandinsky 2.1

Специалисты Сбера разработали нейросеть Kandinsky 2.1, сообщили в пресс-службе компании.

Новая генеративная модель Сбера — Kandinsky 2.1 — способна всего за несколько секунд создавать высококачественные изображения по их текстовому описанию на естественном языке. Она также может смешивать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна (inpainting/outpainting). Модель понимает запросы на 101 языке (включая русский и английский) и умеет рисовать в различных стилях.

Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

Новая модель Kandinsky 2.1 унаследовала веса предыдущей версии, обученной на 1 млрд пар «текст — изображение», и была дополнительно обучена на 170 млн пар «текст — изображение» высокого разрешения. Затем она дообучалась на отдельно собранном датасете из 2 млн пар качественных изображений. В данный сет попали картинки с описаниями в таких традиционно сложных для нейросетей областях, как тексты и лица людей.

Нейросеть также усовершенствована за счёт новой обученной модели автоэнкодера, которая используется в том числе в качестве декодера векторных представлений изображений. Это кардинально улучшило генерацию изображений в высоком разрешении: лица, сложные объекты и так далее. Благодаря этому новая модель содержит 3,3 млрд параметров вместо 2 млрд в Kandinsky 2.0.

Кроме того, Kandinsky 2.1 использует не только закодированное текстовое описание, но и специальное представление изображения моделью CLIP. В таком виде нейросеть формирует представление картинки на основе текстовой информации и подаёт его на вход основной генеративной модели.

Модель умеет визуализировать любой контент и может применяться в различных отраслях. К примеру, в банковской сфере её можно использовать для создания персонализированных маркетинговых решений, ярких образов продуктов, привлечения и удержания внимания клиентов.

Александр Ведяхин, первый заместитель председателя правления Сбербанка:

«Обучая Kandinsky 2.1, мы учли мнения пользователей и реализовали смелую гипотезу, изучив самые передовые концепции. В результате мы разработали мощное универсальное решение для широкого круга задач на уровне лучших мировых аналогов. Оно открывает колоссальные возможности как для бизнеса, так и для населения. По сути, это ещё один важный шаг к AGI — сильному искусственному интеллекту. Думаю, у каждого найдётся задача для Kandinsky 2.1, и поэтому улучшенная модель, как и её предыдущая версия, находится в открытом доступе: протестировать её может любой желающий, причём бесплатно».

Смотрите также
Картина дня
Рекомендуем
Эксклюзив
Поздравь питомца: 30 ноября во всем мире отмечается День домашних животных
Независимые кошки и юркие рыбки, маисовые полозы и говорящие попугаи, очаровательные хомячки и пушистые самоеды… Питомцы отмечают «профессиональный» праздник — Всемирный день домашних животных, призванный напомнить об ответственности за тех, кого мы приручили. В честь события можно побаловать любимца вкусненьким, совершить доброе дело для приюта или завести нового друга. ИА «Время Н» рассказывает об истоках и традициях даты, а также делится любопытными фактами о братьях наших меньших.
Культура
«Карман России» в кошельке
ЦБ РФ с 1992 года по настоящее время выпустил несколько десятков памятных и инвестиционных монет, прямо или косвенно относящихся к Нижнему Новгороду и Нижегородской области.
Общество
Михаил Курюмов: «Нижегородцы осознают необходимость заботы о здоровье своих питомцев»
Председатель регионального комитета ветеринарии рассказал о главных его задачах в интервью ИА «Время Н».
Общество
Алексей Беляев — об итогах туристического сезона в Нижегородской области
Он дал интервью «Волге 24».