Алгоритм Google, который превращает текст в картинку, стал доступен для всех

Google выложила в ограниченный доступ свою модель для генерации изображений на основе текста. Пока с алгоритмом можно взаимодействовать в двух режимах. Инженеры отметили, что Google редко публикует свои алгоритмы.

Несмотря на то, что модель Imagen выдает результат, равный по качеству OpenAI DALL-E 2 или Stability AI от Stable Diffusion, Google не анонсировал систему ранее. Теперь поисковый гигант объявил, что добавит Imagen в очень ограниченном виде в приложение AI Test Kitchen в качестве способа сбора ранних отзывов о технологии.

Приложение AI Test Kitchen запустили в начале 2022 года как способ бета-тестирования систем искусственного интеллекта. Сейчас приложение предлагает несколько способов взаимодействия с текстовой моделью Google LaMDA. Компания теперь добавила два способа взаимодействия с Imagen.

В режиме City Dreamer пользователи могут попросить модель сгенерировать элементы города, оформленного в соответствии с выбранной ими темой. Imagen создает образцы зданий и участков. При этом все проекты отображаются в виде изометрических моделей, похожих на те, что можно увидеть в SimCity.

gugl1.pngРежим City Dreamer

В режиме Wobble можно создать маленького монстра. Сначала надо выбрать из чего он будет сделан (глина, войлок, марципан, резина), а затем сгенерировать одежду и внешний вид. Модель создает монстра, дает ему имя, а затем заставляет его «танцевать».

gugl2.pngРежим Wobble

Эти взаимодействия крайне ограничены по сравнению с другими моделями преобразования текста в изображение — пользователи не могут запросить все, что им захочется. Однако это намеренное ограничение со стороны Google. Как объяснил Джош Вудворд, старший директор по управлению продуктами Google, весь смысл AI Test Kitchen заключается в том, чтобы получить отзывы клиентов и узнать о том, как пользователи будут взаимодействовать с ними. Google не стал делиться данными о том, сколько людей на самом деле используют AI Test Kitchen.

«Это очень активная, имеющая свое мнение группа пользователей, — отметили в компании. — Сервис очень полезен для определенных категорий людей — например, исследователей».

Эксперты не уверены, что Google будет продвигать продукты для широкой публики и дальше. В то же время конкуренты компании, OpenAI и Stability AI, уже коммерциализируют модели преобразования текста в изображение.

Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 5 (1 vote)
Источник(и):

ХайТек