Дуализм в решении проблемы искусственного интеллекта

Нейрофизиолог Михаил Бурцев о попытках моделирования мозга человека, развитии логических систем и возможностях нейронных сетей

ПостНаука продолжает рассказывать о современных технологиях в проекте «Банк знаний», подготовленном совместно с Корпоративным университетом Сбербанка.

Чтобы понять, какие проблемы сегодня стоят перед искусственным интеллектом, стоит рассмотреть исторически сложившиеся подходы, в которых лежат задачи, которые нам предстоит решать в ближайшем будущем в этой области.

Искусственный интеллект как направление исследований зародился в конце XX века. Люди стали подходить к этой задаче с двух сторон. Первое очевидное решение: если мы знаем, что человек обладает интеллектом, и хотим этот интеллект воспроизвести, то со стороны биологии окажется, что он обусловлен мозгом и нервной системой, поэтому мы можем решать проблему создания интеллектуальных программ и алгоритмов путем моделирования работы мозга. Таким образом, чтобы смоделировать работу мозга, нужно взять те части, из которых он состоит, отдельные нервные клетки, то есть нейроны, и построить из них мозг, который будет решать интеллектуальные задачи. Это направление в искусственном интеллекте получило название «искусственные нейронные сети».

С другой стороны, мы можем рассматривать интеллект человека как некоторую деятельность и исследовать его с точки зрения психологии и практического решения интеллектуальных задач. При этом мы говорим, что не хотим воспроизводить интеллект как биологический объект: нам это неважно, потому что мы не будем выращивать копию человека, чтобы сделать его роботом. Мы хотим при помощи других принципов на другом материальном субстрате воспроизвести суть интеллекта, которую мы можем выделить в интеллектуальной деятельности человека.

Если первый способ — попытка смоделировать мозг, то второе направление связано с тем, что мы идем не снизу вверх, не собираем интеллект из отдельных элементов, а пытаемся его деконструировать. Имея представление о деятельности, приводящей к интеллектуальному результату, мы будем ее исследовать и пытаться найти такие алгоритмы, которые будут ее воспроизводить. Сообщество исследователей увидело, что второй путь — путь логического или символьного искусственного интеллекта — выглядел гораздо более предпочтительным. Поэтому это направление получило наиболее бурное развитие после возникновения искусственного интеллекта. Исследования по искусственным нейронным сетям не прекращались, но немного отошли на периферию.

Успешное развитие получили логические системы, системы с выводом, системы, способные играть в формальные игры. В частности, это привело к нескольким интересным наработкам в этой области: созданию систем, основанных на знаниях, когда мы пытаемся формально описать знания в некоторой предметной области, потому что для выводов нам нужны не только сами правила вывода, но и представления о сущностях, которые в данной области существуют, о том, как они взаимосвязаны друг с другом (это как раз знания в этой предметной области), и знание конкретных фактов, из которых мы хотим сделать выводы. Мы применяем правила формального вывода, получая на вход структуру нашего знания, области и факты, чтобы вывести из них другие факты, проверить на истинность какие-то утверждения или сделать прогноз. Есть знания, и есть конкретные условия задачи, которую мы решаем. Это описание предметных областей формализовалось в виде инструмента, получившего название «онтология» — это формальное описание предметной области, в котором перечислены понятия, объекты, участвующие в какой-то деятельности или в предсказании чего-то, что происходит в этой области. Формализованы правила, какие типы взаимодействия между этими объектами происходят, и заданы правила, по которым можно осуществлять рассуждение в рамках этой предметной области.

Это проявилось в том, что уже в конце 1990-х годов шахматная программа обыграла в шахматы чемпиона мира Гарри Каспарова. Фактически IBM Deep Blue, в который были заложены формальные правила игры и прогнозирования хода, мог рассчитывать небольшую глубину решения и оказался гораздо сильнее человека в формальных играх. Но оказалось, что подход, базирующийся на онтологиях, на системах, основанных на знаниях, к сожалению, не может покрыть все богатство мира: в узких областях он работает отлично, но, как только сталкивается с более широким кругом задач, он пасует и не может дообучаться, расширять свои знания, включать в них что-то новое и работать с плохо формализованными задачами — это два недостатка этого метода.

Чтобы построить такую систему, основанную на знаниях, нужно иметь экспертов в данной области и специального человека, умеющего перевести из эксперта знания и записать их в виде формальной системы. Система должна быть сконструирована таким образом, чтобы она покрывала как можно большее число случаев в реальном мире. Как показала практика, невозможно создать систему, широко применимую в какой-либо области.

Нейросетевые алгоритмы как раз обладают теми свойствами, которых нам не хватает в системах, основанных на знании. Чтобы их создать, не нужно формализовать знания эксперта — их прелесть в том, что они учатся автоматически, на примерах правильного решения задач, которые мы им даем. Есть входные данные (в нашем случае это факты из предметной области, если мы проводим аналогию с системами, основанными на знаниях), а на выходе должны быть выводы из этих фактов. Нейросеть должна на примерах входных и выходных условий обучиться выдавать правильный ответ, построив онтологию, возможно, таким способом, который человек не может предсказать.

Несмотря на то что нейросети пытались применить для решения интеллектуальных задач, сильных результатов не получалось, поэтому в начале 2000-х годов в области искусственного интеллекта наблюдался застой. Фактически словосочетание «искусственный интеллект» стало ругательством в научных кругах. Считалось, что те, кто занимается искусственным интеллектом, — шарлатаны, строящие несбыточные прогнозы. Прошло десять лет. С одной стороны, с ростом вычислительных возможностей открылось окно для создания нейросетей гораздо большего размера, с другой стороны, накопилось много данных. Здесь мы можем увидеть различие между подходами сверху вниз и снизу вверх, потому что нейросетям, в отличие от формальных подходов, необходимо много знаний, на которых можно учиться. Вы можете вытягивать знания из экспертов, закодировав их, и ваша система должна лишь немного подстроить параметры, но, если вы хотите выучить эти знания с нуля, вам нужно очень много примеров. Никто не пробовал учить нейросети на больших объемах данных, и они сами были достаточно примитивны. Когда у людей появилась возможность взять нейросеть из многих слоев, глубокую нейросеть, и обучить ее на большом объеме данных, оказалось, что нейросети могут выдавать впечатляющие результаты, превосходящие результаты систем, основанных на традиционных методах для определенного круга задач.

Таким образом, нейросети решают задачи, способ решения которых мы не можем формализовать, но требуют большого объема данных. Все началось с распознавания картинок: в течение нескольких лет нейросеть научилась распознавать и классифицировать объекты на картинках лучше, чем человек. Хотя до этого она решала эту задачу в несколько раз хуже. Триумфом последних лет стало то, что нейросеть обыграла человека в го. Алгоритм игры в го основывался на том, что нейросеть оценивала ситуацию на доске в целом, а не пыталась напрямую прогнозировать все ходы. Удалось получить гибридное решение, которое скомбинировало поиск в глубину, просчитывание вариантов, интуицию игрока, которая аппроксимировалась нейросетью и вычислялась на основании большого объема сыгранных игр в го, выработанного понимания того, какая позиция лучше или хуже. Таким образом, мы смогли сделать так, что наш алгоритм поиска рассчитывает не все варианты, а лишь предсказанные нейросетью как хорошие. Это позволяет нам значительно сократить перебор.

Сегодня мы оказываемся в положении дуализма наших подходов и методов решения задач искусственного интеллекта. С одной стороны, это подход, основанный на онтологиях. Сейчас уже построены огромные онтологии для различных областей знания, в них действительно формализовано очень много полезной информации. С другой стороны, у нас есть нейросети, пытающиеся учиться на объектах и на примерах, но найти много примеров мы можем не для всех областей знания и не для всех. В этом проблема: мы не можем использовать в них нейросети. Кажется, что будущее этой области заключается в комбинации подхода онтологий с нейросетевым. Как мы можем это сделать?

В области систем, основанных на знании, одна из проблем — это привязка конкретных сущностей наших онтологий к конкретным ситуациям, распознавание их как соответствующих той или иной ситуации, в которой наша система может делать вывод. Здесь нейросети могли бы помочь правильно распознавать ситуацию и отражать их на онтологию. С другой стороны, мы могли бы использовать онтологии, чтобы спланировать действия нашего интеллектуального агента или сделать вывод о том, каким должен быть конкретный ответ в данной ситуации. Современные нейросетевые методы, хоть и хорошо справляются с задачами классификации отличения одного от другого, не достигают эффективности, присущей системам, основанным на логике, в области планирования и долгосрочного просчитывания вариантов. Поэтому кажется, что идеальным вариантом было бы отдать на откуп нейросетям те части нашего интеллектуального агента, которые мы не можем формализовать или пока не знаем, как это сделать, а для частей, требующих рассуждения и планирования, использовать онтологии и системы, основанные на знаниях. Дело осталось за малым — придумать хороший способ это скомбинировать.

Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 4.6 (5 votes)
Источник(и):

postnauka.ru