Видеть больше: ИИ против человека

Блог компании ua-hosting.company. Многие футуристы яро отстаивают мнение, что искусственный интеллект может стать погибелью человечества. Возможно, в далеком будущем и появится аналог HAL 9000, который монотонным голосом оповестит нас о том, что наше время на этой планете истекло, но это уж точно не произойдет в ближайшие десятилетия. А все дело в том, что киношные или литературные ИИ стоят выше или на той же ступени мыслительных способностей, что и человек. В реальности же это не так.

Ученые из Йоркского университета (Торонто, Канада) провели ряд экспериментов, показавших насколько ИИ уступает человеку в рамках визуального восприятия объектов. Какие эксперименты были проведены и что именно они показали? Об этом мы узнаем из доклада ученых.

Основа исследования

Одними из самых продвинутых систем искусственного интеллекта на данный момент считаются глубокие сверточные нейронные сети (DCNN от deep convolutional neural network). В аспекте компьютерного зрения лучше их не найти. DCNN также вполне неплохо количественно предсказывает нейронную реакцию в объектно-селективных зрительных областях коры головного мозга, хоть и были обнаружены некоторые расхождения между самой реакцией и предсказаниями системы.

Для того чтобы создать какую-либо систему, имитирующую человеческое восприятие информации, необходимо определить ряд важных параметров. В первую очередь, это тип информации (в данном случае, визуальные сигналы). Затем составить перечень отличительных черт, которые помогают нам идентифицировать объект — цвет, текстура, форма и т. д.

Многочисленные исследования говорят о том, что для нас важным элементом восприятия объектов является их форма. Ранее говорилось, что системы DCNN меньше полагаются на форму и больше на цвет и текстуру, чем люди. Но форма все же используется DCNN в качестве дополнительного параметра, т. е. она полностью не исключается.

В рассматриваемом нами сегодня труде ученые поставили перед собой любопытную задачу — сравнить использование форм системой DCNN и человеком, а также определить, у кого это получается лучше.

Теория форм

Объекты имеют как локальные, так и конфигурационные свойства формы. Локальное свойство формы проявляется в ограниченной области объекта и может интерпретироваться без ссылки на более отдаленные особенности формы объекта. Локальные свойства формы могут играть важную роль в распознавании как для людей, так и для искусственных систем (к примеру, ушей кролика может быть достаточно, чтобы правильно его идентифицировать), а несколько слабых локальных свойств объекта потенциально могут быть накоплены для получения относительно сильных классификаторов.

zrenie1.pngИзображение №1

Напротив, конфигурационное свойство формы является функцией не только одной или нескольких конкретных локальных особенностей, но и того, как эти особенности связаны в пространстве (пример выше).

Многие из свойств формы, которые наиболее заметны для человека (например, выпуклость или симметрия), являются конфигурационными и проявляются не локально, а только в результате целостного вычисления, которое учитывает пространственное расположение локальных особенностей формы. Эти умозаключения были подтверждены эмпирически, как с помощью психологических тестов, так и фМРТ.

До того как глубокие нейросети стали лидерами в мире искусственного интеллекта, первенство в распознавании объектов занимало компьютерное зрение (например, SIFT). Такие системы полагались в первую очередь на суммирование данных по локальным особенностям, в значительной степени игнорируя пространственные конфигурационные отношения между этими чертами.

Модели DCNN значительно превосходят эти более ранние системы распознавания. Поскольку единицы в более высоких сверточных и полностью связанных слоях имеют большие рецептивные поля, которые объединяют информацию из широко разнесенных пикселей посредством сложного нелинейного отображения, эти сети потенциально могут выйти за рамки суммы доказательств по локальным функциям для включения конфигурационной информации. Другими словами, современные DCNN системы лучше, так как могут учитывать в своем анализе объектов как локальные, так и конфигурационные свойства.

Однако, как утверждают некоторые ученые, на самом деле DCNN, обученные ImageNet, могут вести себя как классификаторы с набором функций. Хотя выводы ученых могут отражать преобладание текстурных сигналов, а не обработки формы как таковой, результаты исследований предполагают, что DCNN придают большее значение локальным сигналам формы, чем глобальным, по крайней мере, для простых геометрических форм, если сравнивать эти системы с человеком. Также эти системы кажутся относительно нечувствительными к перестройкам в конфигурации локальных частей.

Такого рода выводы поднимают весьма любопытный вопрос — чувствительны ли вообще модели глубоких нейросетей к конфигурационным свойствам формы. Чтобы ответить на этот вопрос, авторы рассматриваемого нами сегодня труда провели ряд экспериментов, о результатах которых мы и поговорим далее.

Подробнее
Пожалуйста, оцените статью:
Пока нет голосов
Источник(и):

Хабр