Компьютер не смог научиться созданию оптических иллюзий

Американские разработчики представили ViperLib— датасет, содержащий почти семь тысяч изображений различных оптических иллюзий. Предполагается, что он поможет обучить компьютерные алгоритмы создавать подобные иллюзии самостоятельно. Тем не менее, у самих разработчиков, которые натренировали на ViperLib генеративно-состязательную сеть, эффективную модель построить не удалось. Препринт статьи опубликован на arXiv.

Оптическая иллюзия возникает при ошибке зрительного восприятия: статичные объекты кажутся движущимися, двухмерные объекты — объемными, а ровные фигуры — искаженными. Ее появление напрямую зависит от формы и содержания изображения: к примеру, при восприятии объектов на контрастном фоне наблюдается явление иррадиации, когда сам объект кажется больше из-за своего фона. Механизмы восприятия оптических иллюзий изучены плохо, но считается, что их причина — несоответствие между глазом (органом, который принимает информацию) и зрительной корой (отделом мозга, который эту информацию обрабатывать).

У двух концентричных кругов единые радиусы окружности, но они кажутся неровными из-за контраста и узора. viperlib.york.ac.uk

Именно из-за того, что механизм появления и восприятия оптических иллюзий плохо изучен, задача их обработки с помощью методов компьютерного зрения сильно усложняется. Решить эту задачу попробовали Роберт Уилльямс (Robert Williams) и Роман Ямпольский (Roman Yampolskiy) из Университета Луизианы. Они собрали датасет из 6725 изображений различных оптических иллюзий, разделенных на категории. На собранном датасете ученые также обучили генеративно-состязательную сеть — разновидность нейросети, архитектура которой лучше всего подходит для создания новых объектов на основе определенных данных. Результаты, однако, мало походят на настоящие оптические иллюзии.

Процесс создания изображения на основе данных из датасета. Williams & Yampolskiy / arXiv 2018

Причиной может быть неоднородность и недостаточное количество данных в датасете: например, недавно разработчикам из NVIDIA на гораздо большей базе с фотографиями знаменитостей удалось при помощи генеративно-состязательной сети создать реалистичные портреты людей. Тем не менее, ученые планируют учесть недостатки полученных изображений для дальнейшего обучения. Полный датасет доступен на сайте разработчиков. 

Оптические иллюзии находят свое место и в искусстве. О том, что такое оп-арт и кинетическое искусство вы можете прочитать в нашем материале «Мир в движении» , который мы выпустили вместе с музеем современного искусства Garage.

Автор: Елизавета Ивтушок

Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 4 (1 vote)
Источник(и):

nplus1.ru