Самые интересные нейросети открытого доступа

Блог компании FirstVDS. К началу 2020-х годов нейросети успели с переднего края научных разработок проникнуть в сферу общедоступных интернет-развлечений. В наши дни каждый может поэкспериментировать с генерацией текстов или изображений, сгенерировать фотореалистичного человека или кота, превратить набросок качества paint — во вполне сносный пейзаж, и всё такое прочее. И в некоторых случаях даже без регистрации и СМС (ну или почти без оных).

Crayon (бывшая Dall-E mini)

Увы, несмотря на расширение количества тестеров до миллиона, самая продвинутая нейросеть по генерации изображений на основе текста Dall-E 2 всё ещё остаётся не общедоступной. По словам разработчиков из OpenAI Илона Маска, из-за высокого качества создаваемых изображений они опасаются разного рода непредсказуемых последствий: от генерации фотореалистичного прона до создания политических фейков с провокациями.

neyroset1.png

Покуда о Dall-E 2 большинству остаётся только мечтать и листать созданные тестерами картинки, включая недавно добавленную опцию по «дорисовыванию» изображений в разные стороны — можно поэкспериментировать с упрощённой «сестрой» Dall-E 2 под названием Dall-E mini. Точнее, теперь уже Crayon.

Разработчики Борис Дайма и Педро Куэнка изменили название и адрес нейросети по настоятельной просьбе из OpenAI, чтобы не возникало путаницы с основным текущим проектом OpenAI — великой и ужасной Dall-E 2. Правда, есть подозрение, что после переименования и переноса рисовать по текстовым запросам у «младшей Dall-E» стало получаться чуть хуже. Впрочем, возможно, это уже паранойя.

neyroset2.png

Зато по запросу «как ты себя представляешь» нейросеть стала изображать различные электронные устройства. Возможно, это шутка разработчиков, а возможно, и нет. Но это, наверное, тоже паранойя!

WomboArt

Ещё один из популярнейших генераторов изображений по текстовому запросу от канадской компании Wombo, вышедший в открытый доступ к концу 2021 года. Имеет своё мобильное приложение «Dream by Wombo» и в целом генерирует картинки с прицелом именно на использование в качестве обоев на телефоне. Лучше, чтобы запрос был на английском языке.

neyroset3.png

Результаты получаются не настолько точными, как у Crayon и уж тем более Dall-E 2. Но зато картинка на выходе почти всегда изрядно красивая и атмосферная.

Можно выбрать предустановленный стиль, в котором нейросеть соорудит изображение по вашему запросу. Выбор вариантов довольно широк и сейчас (на конец июля 2022 года) включает в себя 22 разных стиля: синтвейв, фэнтэзи, стимпанк, психоделика, японские гравюры укиё-э, студия «Гибли» Хаяо Миядзаки, Сальвадор Дали и так далее. За один проход генерируется только одно изображение — зато достаточно быстро, в пределах 10–15 секунд.

Теперь, для более точной генерации изображения, можно в виде какой-то исходной картинки загрузить «базу». Правда, текстовое описание придётся добавить в любом случае: система не умеет напрямую преобразовывать изображение в аналогичное в заданном стиле.

RuDall-E / ruDALL-E Kandinsky

neyroset4.png

Под впечатлением от вирусной популярности первой версии Dall-E, построенной на архитектуре GPT-3, российские разработчики из SberAI сделали свой аналог под названием RuDall-Ehttps://rudalle.ru/. Что логично, она работает в первую очередь с запросами на русском языке.

Подробнее
Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 3 (2 votes)
Источник(и):

Хабр