iPavlov разросся: автопилот, голосовой помощник, машинное зрение, предиктивная аналитика, Smart City и Smart Clinic

Блог компании Leader-ID. Автор: Светлана Болгова. Пару лет назад мы делали интервью с Михаилом Бурцевым из МФТИ — создателем системы разговорного ИИ iPavlov. Очень интересный человек, который в 2015 году удачно скрестил свой талант с программами госфинансирования через «Сбер» и НТИ (АСИ).

Все началось с библиотеки DeepPavlov, которую в итоге скачали больше миллиона раз. Затем проект расползся по соседним нишам, причем мне кажется, что скоро появится целая корпорация iPavlov с целым пакетом ИИ-продуктов федерального масштаба. Насколько это хорошо или плохо, не могу сказать. Иногда случается так, что быстрый успех может вскружить голову.

Под катом — интервью с нынешним директором iPavlov Лораном Акопяном про то, какое место российские технологии занимают в мировой ИИ-индустрии, изменится ли что-то из-за сложностей с поставками «железа» и в каком направлении развивается сам iPavlov. Если все пойдет по плану, самый массовый и функциональный голосовой помощник в стране будет в приложении Госуслуг.

— Михаил Бурцев нам уже рассказывал, с чего все начиналось. Что происходит сейчас?

Как компания iPavlov существует с конца 2020 года. Ранее с 2017 года мы развивались как одноименный open-source-проект Московского физико-технического института (МФТИ). В результате появилась бесплатная библиотека DeepPavlov с открытым исходным кодом, которая занимается обработкой запросов на естественном языке (NLP, natural language processing), благодаря которой iPavlov и стал знаменит как бренд. Сегодня количество скачиваний этой библиотеки по всему миру перевалило за миллион.

С 2020-го мы продолжаем работать уже в рамках спин-офф-компании НТИ и МФТИ в области искусственного интеллекта, разрабатывая платформенные решения на базе обработки естественного языка, изображений и промышленных данных. Мы делаем продукты для промышленности, медицины и государственных структур. В общей сложности с нашими ИИ-инструментами сегодня взаимодействуют около 1,5 млн человек.

Сейчас у нас три технологические платформы:

— IVA (платформа цифровых помощников);

— EYE (платформа машинного зрения);

— ABI (платформа предиктивной аналитики).

А также две продуктовые гиперплатформы: Smart City и Smart Clinic.

pavlov1.pngИнтерфейс Smart City для мониторинга дорожной ситуации и управления трафиком

— Где их применяют?

Кейсов множество. Например, наш искусственный интеллект хорошо работает на проектах цифровизации производства. Та же платформа EYE установлена на нескольких крупных заводах. Распознавая изображение, она может, например, контролировать дефекты выпускаемой продукции.

pavlov2.pngПоиск дефектов в листовой стали при помощи платформы EYE

Дефекты можно классифицировать по типу и размеру, а ту продукцию, где дефект трактуется как брак, возвращать обратно, чтобы она не попала клиенту. Это существенная экономия на логистике, учитывая масштаб производства. Клиенты в любом случае вернули бы такой товар, а за доставку пришлось бы заплатить.

И суть тут не только в экономии. С таким инструментом контролер качества не осматривает стальные листы в пыльном цеху, а сидит в офисе, попивает чай, определяя дальнейший путь продукции через визуальный интерфейс и голосовое управление.

pavlov3.pngПроцесс эксплуатации iPavlov Defect Detection System в рамках системы видеоинспекции холоднокатаного металлопроката. Система настроена на 36 различных дефектов включая слипание, эмульсию, задир, точечную коррозию, отпечатки и другие

Технологии распознавания изображений используют в медицинских системах, например для анализа снимков пациентов. Проекты диагностики по медицинским снимкам и картам делаем на базе национального медицинского центра им. Алмазова.

pavlov4.pngИнтерфейс системы скрининга деперсонализированных электронных медицинских карт iPavlov CDSS RD Neuroscanner

Система скрининга iPavlov CDSS Rare Diseases Neuroscanner помогает выявлять орфанные (редкие) генетические заболевания у детей до 7 лет: мукополисахаридоз, болезнь Фабри, болезнь Помпе, болезнь Ниманна — Пика тип A/B (ASMD).

Это сокращает среднее время постановки диагноза с 7 до 2 лет и снижает детскую смертность на 50%.

Ниже снимок КТ органов грудной клетки, обработанный модулем для диагностики COVID-19 системы iPavlov CDSS Neuro-Imager:

pavlov5.pngНа исходный снимок нанесены маски здоровой паренхимы лёгких — оранжевого цвета. Красный цвет — у участков с признаками патологических изменений, вызванных COVID-19. Система также рассчитала проценты поражения каждого из лёгких

pavlov6.pngiPavlov CDSS Neuro-Imager распознает патологические образования по цифровым снимкам КТ/НДКТ ОГК, МРТ, ММГ и РГ/ФЛГ. В случае превышения заранее заданных критических значений система подает врачу сигнал о возможной патологии

А еще в рамках программы «Приоритет 2030» совместно с КамАЗом мы разрабатываем грузовые беспилотники. Обкатку системы начнем на трассе М11. За рулем все еще будет сидеть водитель, который выведет автомобиль на магистраль. Но в дальнейшем автомобили будут возить грузы по выделенной полосе полностью автономно с помощью компьютерного зрения, распознавания погодных условий и других технологий. Думаю, что полноценно эта система заработает уже с 2027 года.

pavlov7.pngПодсистема мониторинга программного комплекса, предназначенного для управления флотом беспилотных грузовых транспортных средств

pavlov8.pngСкриншот подсистемы аналитики

— Что касается разработки ИИ в целом, отстаем ли мы от других стран и насколько?

В целом Россия входит в пятерку стран-лидеров. Искусственный интеллект основывается на предыдущих технологических и научных достижениях, и у России их достаточно.

Мировым лидером в области развития ИИ, пожалуй, можно назвать США — как с точки зрения технологий, так и с точки зрения качества моделей. На уровень ниже Китай. Он лидер не столько по качеству технологий, сколько по масштабу цифровизации и количеству внедрений. На мой взгляд, сегодня в Китае максимально цифровое общество. А вот на следующем уровне мы и Европейский союз.

У нас есть отдельные направления, где мы среди лидеров. В частности, у нас очень хорошо цифровизованы банковский сегмент, розница и госуслуги.

Еще одна конкурентная точка — чат-боты и цифровые помощники. Наш ассистент в свое время побил Google DialogFlow в банковском секторе. Многие финансовые корпорации и компании из розничного сектора начали переходить на нашу систему IVA по проектированию цифровых ассистентов, поскольку, в отличие от Google, мы предоставляем им лицензию, по которой заказчик может самостоятельно развивать продукт для своих потребителей.

Кроме того, клиенты могут использовать разработанный нами умный интерфейс, чтобы создавать и редактировать сценарии обслуживания потребителя без знаний программирования (zero-code programming). У конкурентов все это тоже есть, но они сильно ограничивали коммерческий потенциал ИИ и искусственно завышали стоимость его внедрения и развития.

— Влияет ли на это распределение по позициям тот факт, что русский язык сложный?

Это распространенное заблуждение. Дело не в языке. Большинство алгоритмов и моделей, которые разрабатывают для распознавания естественного языка, мультиязыковые. Возможно, бывают некоторые особенности с китайским и корейским. Но для европейских языков — русского, английского и прочих — нет никакой разницы. И нет никаких сложностей с переносом проекта с одного языка на другой. Например, наш Deep Pavlov работает на огромном количестве языков, больше всего его скачивают в Америке и Китае.

Кроме того, у нас есть проекты внедрения цифровых ассистентов в странах Совета сотрудничества арабских стран Персидского залива (GCC, это ОАЭ, Саудовская Аравия, Катар, Бахрейн и других).

Гораздо большую роль играет объем инвестиций в этот сектор. США и Китай дольше и больше инвестируют, поэтому они на вершине. В США среди крупных компаний настоящая гонка голосовых ассистентов.

— Что-то изменилось с последними событиями? Нам же фактически не поставляют «железо». Будут ли проблемы в секторе машинного обучения?

Для компаний, специализирующихся на технологиях искусственного интеллекта, критично наличие суперкомпьютеров. Но в стране они уже есть. В частности, у одного из наших ключевых акционеров — МФТИ — есть собственный ЦОД, который одно время занимал пятое место в российском рейтинге именно по машинному обучению. И он очень помог нам в становлении компании.

Имеющихся мощностей в принципе на несколько лет хватит. Конечно, объем задач и обрабатываемых данных растет каждый день, что увеличивает нагрузку на вычислительные кластеры. Поэтому в какой-то момент действительно может сложиться ситуация, что темпы внедрения продуктов с машинным обучением замедлятся из-за нехватки вычислительных мощностей. И это принципиальная трудность.

Чтобы компенсировать возможный дефицит — чтобы его в принципе не возникало, — сейчас развивается много механизмов, в том числе параллельный импорт. К сожалению, мы (как компания) мало что можем сделать в этом направлении. В глобальном плане это не наша задача: софтверный бизнес не может быстро построить собственный ЦОД. Но мы видим реальную поддержку государства и его заинтересованность в решении проблемы.

— Но у вас ведь есть «план Б»?

Конкретно мы в неплохом положении, потому что изначально строили бизнес на организации партнерств с заводами, предприятиями городской инфраструктуры, с МФТИ и т. п. Мы работаем с десятью ключевыми партнерами из числа крупных промышленных групп, у которых есть свои ЦОДы. Соответственно, рассчитываем на выделение мощностей с их стороны.

В целом мы видим перспективы в международной кооперации и ставим акценты на страны вышеупомянутого Совета сотрудничества Персидского залива, с которыми у России хорошие отношения. Они вполне готовы опираться на российские софтверные продукты, особенно в области цифровизации и автономного транспорта (V-to-V и V-to-X), в частности для обновления дорожной инфраструктуры.

С той же Саудовской Аравией мы подписали соглашение еще в 2019 году. И сотрудничество продолжается. Мне кажется, выход на мировой рынок не с экспортом, а в роли полноценной международной компании, поможет решить вопрос с вычислительными мощностями для машинного обучения. Если компании есть что предложить и ее продукт действительно значим для B2B или B2G по всему миру, проблема с обучением и размещением данных решаема. Главное — быть специалистом в востребованной области.

— «Иван Павлов» — это что за продукт?

Подробнее
Пожалуйста, оцените статью:
Пока нет голосов
Источник(и):

Хабр