Альфа-тестирование MidJourney V5: научилась ли нейросеть рисовать руки и неоновых котиков

Блог компании Selectel. Автор: Владимир. Недавно я писал инструкцию-обзор на четвертую версию алгоритма MidJourney. Спустя всего два месяца нам предложили альфа-версию пятой версии алгоритма. В v5 предлагают большую реалистичность и более тонкую настройку. Зачем откладывать удовольствие, давайте взглянем!

Дисклеймер: данная статья написана по первой альфа-версии алгоритма v5. В процессе разработки стиль и доступная функциональность может меняться.

Сухие факты

Сперва пробежимся по анонсу от разработчиков MJ. Вот что поменялось:

  • Расширен список стилей, в которых может рисовать нейронная сеть. Нейронная сеть более чутко относится к запросу.
  • Увеличено разрешение генерируемых изображений. Разрешение изображений v5 равно разрешению увеличенных (upscaled) изображений v4.
  • Больше деталей и меньше текста.
  • Добавлена поддержка параметра – tile, генерирующего изображения в виде тайлов с бесшовным переходом.
  • Добавлена поддержка не квадратного соотношения сторон через аргумент – ar.
  • Добавлена поддержка весов для изображений через аргумент – iw.
  • Увеличение изображений (upscale) на данный момент отключено.

Разработчики MJ отдельно упоминают, что v5 имеет меньше «собственного мнения», поэтому требует более длинных и обстоятельных описаний, а на коротких запросах могут возникнуть проблемы.

Хотя в анонсе разработчиков указано, что производительность повышена, картинки на пятой версии алгоритма генерируются в два раза дольше, то есть примерно минуту. Вероятно, это связано с высоким разрешением картинки.

Эксперименты

Начнем с простого запроса, который сравнивал v3 и v4 в прошлой статье.

Запрос: stars world time

kotiki1.pngСлева направо: третья, четвертая, пятая версии (здесь и далее по ссылкам — фулсайзы картинок).

Изображения v5 кажутся более сдержанными. К сожалению, сдержанность пятой версии алгоритма поставила крест на легкой генерации красочных неоновых котов, которые мне так полюбились.

kotiki2.pngСлева: запрос — neon cat. Справа: запрос — painted neon cat with green light.

Сдержанность — это достойная цена за повышенный реализм в генерации.

Запрос: woman portrait soft sunset light – seed 2131932819

kotiki3.pngСлева — четвертая версия MJ. Справа — пятая.

Провел опрос в своем Telegram-канале, какая генерация нравится моим подписчикам больше. Подавляющее большинство голосов — за более реалистичную версию. А какая нравится вам? Пишите в комментариях. И подписывайтесь на мой канал — рассказываю там о своих экспериментах.

Запрос: circuit of processor inside

kotiki4.pngСлева — четвертая версия. Справа — пятая.

На этом хватит случайных изображений, посмотрим, как MJv5 поборолась с некоторыми особенностями своей предшественницы.

Подробнее
Пожалуйста, оцените статью:
Пока нет голосов
Источник(и):

Хабр