Сергей Николенко, Chief Research Officer компании Neuromation, рассказал BS об текущем состоянии и особенностях бизнеса, основанного на применении искусственного интеллекта.

Когда речь заходит о прогнозах для какой-то индустрии на несколько лет, я сразу напрягаюсь. Вот, например, рынок искусственного интеллекта (AI) умные аналитики из консалтинговой компании McKinsey к 2025 году оценивают от $644 млн до $126 млрд. При этом сами же замечают, что при таком разбросе оценок можно говорить и как о пузыре по типу доткомов начала двухтысячных, так и о больших перспективах рынка.

Одновременно с огромным экономическим эффектом от применения искусственного интеллекта часто говорят и о потере рабочих мест из-за него. Причем разброс мнений в прогнозах о влиянии на рынок труда не меньше, чем в предсказаниях объема рынка. Есть прогноз PWC о том, как 38% рабочих мест в США, 35% – в Германии и 21% – в Японии будут потеряны из-за “роботов”. Здесь имеется в виду вообще любая автоматизация: от чатботов, которые, возможно, начнут заменять операторов колл-центров, до беспилотных автомобилей, которые, возможно, уменьшат спрос на дальнобойщиков.

Считается, что многим профессиям есть чего бояться. Волнуются маркетологи, за которых решения всё чаще принимают стремительно умнеющие сервисы, журналисты, у которых умных программ еще нет, но заметки за них уже пишут боты, а скоро даже местные новости будут писаться специальными программами. Вряд ли высококлассным программистам есть о чём беспокоиться, но уже сейчас бывают анекдотичные случаи, когда программисты полностью автоматизируют свою работу, а потом бездельничают на рабочем месте. Ну а когда мы сможем построить настоящий “сильный” искусственный интеллект (человеческого уровня или выше), людям действительно может оказаться сложно найти себе применение.

С другой, стороны, можно ведь предположить, что AI будет и создавать рабочие места. В конце концов, до сих пор новые технологии приводили именно к созданию новых профессий, и рабочих мест становилось все больше, а не меньше.

В общем, ничего не ясно, будущее из многочисленных прогнозов всё равно представляется туманным. Но это не единственная причина, по которой мне кажется странным и не вполне продуктивным оценивать AI в бизнесе исходя из экономических прогнозов.

Конечно, бывают приложения искусственного интеллекта, которые можно внедрить в бизнес-процессы и разумно оценить полученную экономию. Например, мы в Neuromation разрабатываем систему поиска объектов на фотографиях, предназначенную для того, чтобы распознавать товары на полках супермаркетов. Такие “электронные мерчандайзеры” будут гораздо быстрее людей понимать, что на полках что-то не в порядке, и поднимать тревогу для сотрудников магазина. В результате живые мерчандайзеры смогут заниматься более “человеческими” делами, полки будут быстрее приходить в порядок, покупатели смогут находить нужные товары чаще и быстрее, и всё это выльется в несложно оцениваемую экономию для супермаркетов, небольшую в процентном выражении, но огромную в абсолютном, денежном. И экономия, которая получится в одном супермаркете, скорее всего, будет достаточно точно отражать ожидаемую экономию в другом.

Однако главные громкие успехи AI-исследований, о которых хочется писать яркие колонки в прессе, состоят не в том, чтобы улучшать уже существующие бизнес-процессы, а в том, чтобы создавать принципиально новые продукты для рынков, которых раньше никогда не существовало.

И в таких приложениях часто оказывается, что оценить бизнес-эффект от AI-исследований либо практически невозможно, либо попросту никому не нужно. Давайте разберём два конкретных примера.

Революция глубокого обучения началась около 2006 года. И первым широко используемым индустриальным приложением, которое полностью преобразилось в результате этой революции, стало в 2008-2009 годах распознавание речи. Люди давно могли построить, например, автоматическую систему распознавания нескольких десятков команд для колл-центра, но глубокое обучение вывело качество распознавания на принципиально новый уровень.

Главным бизнес-кейсом, продуктом, использовавшим улучшившиеся технологии распознавания речи, стали виртуальные помощники (virtual assistants). Apple купила Siri примерно за $200 млн, но сами разработчики вложили в нее всего $24 млн. На Siri встроили новые модели iPhone. Это использование AI в бизнесе? Безусловно, и бизнес у Apple, мягко скажем, немаленький. За Siri последовали Microsoft Cortana и Samsung Bixby, и сейчас это по сути стандарт индустрии.

Однако как оценить доход Apple от внедрения Siri, доход Microsoft от Cortana, доход Samsung от Bixby? Как выделить их эффект из общих продаж смартфонов, которые, конечно, зависят далеко не только от голосовых помощников? У нас нет возможности проверить, как продавался бы тот же самый айфон, но без Siri… С другой стороны, мы уверены, что компаниям очень выгодно, чтобы клиенты использовали именно их технологию. Именно поэтому Microsoft дает возможность пользоваться Cortana бесплатно, а Samsung практически вынуждает владельцев своих телефонов использовать Bixby. Если кратко, они просто боятся отстать от лидеров в этой сфере – Apple и Google.

Здесь мы видим, что AI-исследования добавили новую функцию, а для многих, возможно, дополнили и переопределили область применения смартфонов, но конкретный экономический эффект выделить очень сложно. Более того, если бы это даже было возможно, это было бы, скорее всего, бесполезно: доход Apple от Siri вряд ли можно как-то осмысленно использовать, чтобы оценить доход Samsung от Bixby. Здесь и эффект новизны от первого широкого внедрения на рынке, и большая структурная разница в продажах, позиционировании, всём-всём-всём… Скорее просто голосовой помощник стал “обязательной фичей”, стандартом, которому нужно соответствовать, но продажи зависят в основном от других вещей.

Другой пример. Следующей областью, где глубокое обучение полностью поменяло весь, так сказать, ландшафт исследований, стала обработка изображений. Начиная где-то с 2011 года, практически вся сложная обработка изображений ведётся глубокими свёрточными сетями. Более того, появились совершенно новые вещи, которые раньше даже и не думали делать с картинками.

Возьмём пример такой “новой вещи”, который наверняка знаком всем вам: мобильное приложение Prisma реализовало и сделало безумно популярным перенос стиля, позволив делать селфи в стиле ван Гога на фоне ковра в стиле гобелена из Байё.

Можно ли “оценить экономический эффект от внедрения переноса стиля в продукты компании Prisma Labs, Inc.”? Можно, конечно: перенос стиля был единственной причиной существования компании, так что вся её немаленькая капитализация и весь доход её создателей и инвесторов напрямую порождены этими AI-исследованиями. Кстати, отметим в скобках, что исследования проводили не создатели Prisma: они реализовали модель из статьи, вышедшей на конференции NIPS примерно годом ранее.

Однако что толку считать чужие деньги? Мы с вами не можем “внедрить перенос стиля в наш бизнес”: Prisma такая одна, и второй уже не надо. Мы можем взять на заметку, что перенос стиля делать можно (вдруг пригодится как составная часть нашего будущего продукта), и думать дальше: что ещё можно делать с изображениями? Какие есть неосознанные потребности, где можно было бы создать рынок? Или: где есть уже существующий рынок операций, которые сейчас выполняются вручную, но их можно автоматизировать при помощи последних достижений глубокого обучения?

И даже если мы вдруг ответим на этот вопрос (нет, конкретного ответа у меня нет, иначе я рассказывал бы его не в колонках, а на питчах), капитализация Prisma никак не поможет нам оценить наш собственный рынок. У нашего продукта рынок будет другой: может, больше, может, меньше, но оценивать его придётся отдельно и независимо.

Мы видим, что “AI-бизнес”, по крайней мере в своих самых ярких и запоминающихся проявлениях, направлен на то, чтобы создавать принципиально новые продукты. Иногда, как в случае Prisma, это приводит к созданию совершенно нового рынка, которого раньше просто не существовало. Иногда, как в случае Siri, это становится новой функцией уже существующего продукта и быстро начинает определять ожидания людей от этого продукта. В любом случае, истории успешных внедрений AI трудно, да и не надо, переносить на новые продукты – хотя оценить объём потенциального рынка для своей идеи, проработать разные сценарии использования и так далее нужно обязательно.

В Neuromation мы стараемся создавать именно такие прорывные приложения. Я начал статью с примера о распознавании товаров на полках супермаркета. Наше ноу-хау здесь – обучение моделей компьютерного зрения (то есть собственно тех программ, которые будут распознавать товары) на основе синтетических данных: 3D-сцен, которые мы сами создаём из разработанных нами же 3D-моделей товаров. Для этого проекта мы уже заключили контракт на 7 миллионов евро с компанией OSA Hybrid Platform, которая создаёт комплексное решение для автоматизации и улучшения ритейл-индустрии, продвигая его среди российских ритейлеров. По оценкам OSA HP, их базовое решение увеличивает среднюю выручку супермаркета на 5,4%, а в комплексе с автоматической системой распознавания товаров – на 8-9%! На первый взгляд это не тянет на революцию, но выручка двух крупнейших ритейлеров России – “Магнита” и X5 Retail Group – в 2016 году перевалила за триллион рублей у каждого, так что каждый процент от этого “пирога” превращается в очень внушительную сумму…

Другой пример подобного продукта, в котором мы тоже используем идею синтетических данных – это умные камеры для наблюдения за младенцами. Точнее, камеры самые обычные, но видео с этих камер нужно обрабатывать при помощи моделей компьютерного зрения, распознавая, дышит ли ребёнок, в какой позе спит и так далее. А данные для обучения этих моделей придётся генерировать самостоятельно: к счастью, нам неоткуда взять видеозаписи миллионов перестающих дышать младенцев…. Для этого проекта мы вступили в партнёрство с компанией MonDevices, которая уже начала завоёвывать индустрию товаров для наблюдения за младенцами – ежегодный объём этого рынка оценивается более чем в 300 миллионов долларов. Обратите внимание: хотя сам проект с математической и технической точек зрения – постановка задачи, модели компьютерного зрения, порождение данных – очень похож на наш проект в ритейл-индустрии, рынок совершенно другой, со своими законами, своим объёмом и своей стратегией продвижения.

Получается почти как у Льва Толстого, только наоборот: многие провалившиеся стартапы похожи друг на друга, но каждая история успеха уникальна. Так что на прощание желаю вам не зацикливаться на цифрах и процентах, а придумать ту самую уникальную идею, которая сделает мир лучше.