Wolfram Alpha научился описывать содержимое любых картинок и фото

Разработчики сайта Wolfram Alpha добавили в копилку уникальных возможностей системы ещё одну удивительную функцию – распознавание любых фотографий. Каждый желающий может опробовать ImageIdentify в работе. Достаточно загрузить картинку на демонстрационный сайт и через несколько секунд вы получите ответ. Как утверждают сами разработчики – почти всегда правильный.

Стивен Вольфрам, основатель и главный идеолог компании, подробно описывает работу системы в записи в своём блоге. Стивен говорит, что 40 лет ждал момента, когда компьютеры научатся распознавать изображения, и был уверен в том, что этот момент настанет. Задача распознавания – одна из самых базовых для человека, и одна из самых сложных – для компьютерных систем и алгоритмов.

Стивен пишет, что хотя алгоритм и не всегда распознаёт изображения верно, даже его ошибки сильно напоминают человеческие.

Распознавание изображений теперь работает не только на демонстрационном сайте, но и в самом Wolfram Language. Можно задать изображение, получить его описание, а потом использовать уже само описание – получить, например, определение предмета из словарной статьи, или построить облако слов из статьи в Википедии.

geektimes-walfam-alpha-2.pnggeektimes-walfam-alpha-3.pnggeektimes-walfam-alpha-4.png

Можно написать программу, автоматически анализирующую фотографии и составляющую статистику, делающую какие-либо другие подсчёты, связанные с содержанием картинок, или разбивающую их на категории. Также функция распознавания доступна через API.

Для тренировки системы разработчики использовали десятки миллионов изображений. С точки зрения Стивена это сравнимо с тем количеством информации, которое человек получает за первые пару лет жизни. Также Стивен подробно рассказывает в блоге, как разрабатывали систему машинного обучения на нейронных сетях, и какие при этом возникали проблемы. Например, когда систему ещё не научили распознавать лица, она, обработав портрет Индианы Джонса, выдала результат «Шляпа».

geektimes-walfam-alpha-5.png

Для проверки системы Вольфрам пробовал скармливать ей разные противоречивые картинки и получал иногда странные, иногда – забавные или даже милые результаты.

geektimes-walfam-alpha-6.png

Некоторые ошибки распознавания оказались не только вполне объяснимыми, но и даже весьма «очеловеченными». Также интересным оказался опыт распознавания абстрактной живописи – эти картины работали как своеобразные «тесты Роршаха».

geektimes-walfam-alpha-7.png

В данный момент ImageIdentify способна распознавать до 10000 различных объектов. Пока она плохо справляется с распознаванием конкретных людей, произведений искусства и редких объектов.

Довольно забавно играть с системой, подсовывая ей не самые лёгкие варианты картинок и получая довольно своеобразные ответы.

geektimes-walfam-alpha-8.png

Проект Wolfram Alpha был запущен в 2009 году. Система способна отвечать на заданные ей на обычном языке вопросы, и, используя данные из открытых источников, подсчитывать ответы. Например, на вопрос, заданный со смартфона, «Какие самолёты сейчас есть у меня над головой?» система ответит, определив местоположение по GPS, и укажет список самолётов, исходя из данных по рейсам авиаперевозчиков.

Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 4.9 (11 votes)
Источник(и):

geektimes.ru