Получил доступ к Dalle-2. Вы не поверите, что может нарисовать машина… Дизайнеры больше не нужны
Блог компании RUVDS.com. Автор: Алерон. Недавно мне посчастливилось стать обладателем доступа к API Dalle-2. Если ты ещё не слышал про Dalle, то это такая CLIP-архитектура, обученная на огромном корпусе пар текст-изображение. Иначе говоря — она умеет генерировать очень качественные изображения из текста. Отличить результаты генерации от рисунков человека иногда просто невозможно! Это одновременно впечатляет и в то же время — немного шокирует.
По сравнению с предыдущей версией — DALL-E 2 умеет генерировать изображения в более высоком разрешении (1024×1024 пикселей, что в 16 раз превышает разрешение в предыдущей версии модели) да ещё и намного быстрее. Более того, DALL-E 2 позволяет редактировать уже существующие изображения.
Нет больше терпения ждать, давайте же опробуем её!
Посмотрим на несколько моих сгенерированных фаворитов

Просто вау! Dalle-2 очень точно узнаёт сущности, которые закладываются в тексте. Видно, что сетка в курсе, что такое Moscow, как выглядит Эйнштейн и как седлают панду… (Панду? Хотя писали мы про быка, ну это мелочи). Более того, обратим внимание на сохранение стилей, заданных в тексте. Сеточка хорошо различает pixel, digital и cyberpunk стили. Кайф! Давайте поиграем ещё!
Дизайнеры больше не нужны!
Допустим, мне очень нравятся красные роботы, и я хочу сделать для себя постер на стену и т.д. Поиграем в дизайнера!
- Источник(и):
- Войдите на сайт для отправки комментариев