Почему далеко не все проекты по большим данным успешны, стоит ли бояться искусственного интеллекта, оставят ли технологии людей без работы, какие философские проблемы ставят перед обществом беспилотники и может ли глубинная аналитика помочь в лечении людей? Самые волнующие и острые вопросы цифровой экономики обсуждались участниками одной из самых интересных конференций по работе с данными – Teradata Universe.

За большими данными опасно не заметить главное

Этнограф Триша Ванг (Tricia Wang) продавала пончики строителям в Китае, чтобы выяснить, какую роль технологии играют в среде простых людей. Поняв, что они готовы отдать больше половины своей зарплаты за только появившийся тогда айфон, она рассказала о своем открытии компании Nokia и предостерегла о надвигающемся переделе рынка. Ей не поверили, потому что большие данные говорили об обратном, продажи росли. Впоследствии бизнес Nokia в регионе сократился вдвое.

Принятие решений на основе анализа данных – неотъемлемый признак цифрового предприятия. Инвестиции в большие данные продолжают расти, рынок оценивается в $122 млрд, но окупаемость этих инвестиций пока невысока. 73% проектов по большим данным не прибыльны. Проблема в том, что игнорируются качественные данные, убеждена Триша Ванг: «Не вся ценная информация поддается измерению. Важны не только количественные данные, но и качественные. Зачастую аналитические инструменты применяются неверно. Не задаются нужные вопросы – лишь те, которые подтверждают существующую бизнес-модель. Проводя исследования, Nokia исходила из того, что люди не знают, что такое смартфон и не мечтают о нем».

Создание хороших продуктов или услуг требует глубокого понимания, чем и как живут люди из очень разных социальных, гендерных, расовых групп. Однако в количественных данных вы не увидите изменения в культуре потребления, которая происходит сегодня: люди хотят больше участвовать в создании продукта.

Этнограф Триша Ванг продавала пончики строителям в Китае, чтобы выяснить, какую роль технологии играют в среде простых людей

Неизмеримую информацию, полученную от людей (например, эмоции), Триша называет «толстыми данные» (thick data), чтобы придать ей сопоставимый с большим данным вес. «Большие данные» – не термин в строгом понимании. Это словосочетание используется, чтобы называть бизнес-аналитику, анализ данных, управление данными, их интеграцию. Так и «толстые данные» – это этнография, интервью, личный опыт, общение, эмоции. Задача толстых данных – обнаружить неожиданное поведение. Подход особенно эффективен, когда не знаешь, что ищешь. Работая с количественными данными, аналитик зачастую уже знает, что ищет. Но поведение людей непредсказуемо.

«Наши исследования показывают, что удовлетворенность человека – не только связью, чем угодно – зиждется на трех китах: объективном факте (что он имеет), его субъективном восприятии этого и соответствии предшествующим ожиданиям. Не достаточно просто замерять технические характеристики сети и стараться улучшить их везде и всюду, нужно понимать, как воспринимаются людьми эти технические характеристики. А также понимать ожидания людей», – рассказал в интервью CNews Леонид Ткаченко, директор департамента стратегического маркетинга МТС. – У нас на рассмотрении идея записывать все транзакции клиента с метриками качества и потом проводить опросы. Так мы сможем построить модели, позволяющие связать факты и их субъективную оценку. Скажем, есть какая-то локальная проблема в сети, но одну группу людей она беспокоит, а другую – нет. Получается, когда ты смотришь только на слой объективной информации, – ты многого не видишь и многое оцениваешь некорректно».

«В любом бизнесе есть очень талантливые люди, которые работают непосредственно с клиентами. Ценность сотрудников колл-центров незаслуженно занижена, потому что им платят меньше, или потому что они живут в провинции. Но бывает, что это самые умные люди в компании. В результате важная информация, которой они обладают, теряется. Имеет смысл начать работу с «толстыми данными» с общения с сотрудниками, которые контактируют с клиентами. Бизнес-аналитики должны быть на передовой – с продавцами и маркетологами», – рекомендует этнограф.

Зеркало заднего вида

«Говорить о победе искусственного интеллекта над человеческим разумом сегодня так же рано, как беспокоиться о перенаселении на Марсе. Мы слишком далеки от этого», – иронизирует Стивен Бробст (Stephen Brobst), технический директор Teradata.

Сегодня в целом ряде компаний работа с данными ограничивается настройкой отчетности, однако не стоит сводить функции аналитики к «зеркалу заднего вида», считает он. Смотреть вперед позволяют машинное обучение, искусственный интеллект, многослойные нейронные сети. «Число компаний, которые сейчас действительно этим занимаются, очень невелико. Это Linkedin, Netflix, Ebay – мы находимся в самом начале пути. Как говорится, будущее уже здесь, но оно недостаточно распространено», – шутит эксперт.

«Если вы тратите более 50% ресурсов подразделения аналитики на отчетность – надо что-то менять, потому что отчетность – не та сфера, где генерируется ценность для компании», – убежден Бробст. Сегодня многие руководители проводят большую часть своего рабочего времени в поисках информации, необходимой для принятия решений. И по мере того как данных становится все больше, задача усложняется. Глубинная аналитика (deep learning) помогает автоматизировать поиск иголки в стогу сена, чтобы руководители могли сконцентрироваться именно на принятии решений. По прогнозам Gartner, искусственный интеллект войдет в список 5 главных приоритетов для инвестирования к 2020 г.

Глубинная аналитика преимущественно основывается на многослойных нейронных сетях. И хотя об этой технологии впервые заговорили десятки лет назад, в последнее время наблюдается всплеск ее практического применения. Например, PayPal благодаря глубинной аналитике сократил на 50% число ошибок, когда легитимные транзакции рассматривались как мошеннические. Это существенный результат, считает Бробст.

Стивен Бробст, Teradata: Если вы тратите более 50% ресурсов подразделения аналитики на отчетность – надо что-то менять

Прогнозирование спроса, противодействие мошенничеству и прогнозирование поломок – основные направления, в которых сегодня наиболее эффективен искусственный интеллект. По мнению Gartner, к 2019 г. в этих направлениях глубинная аналитика будет показывать наилучшие результаты. Технический директор Teradata добавляет к этому списку поиск по изображениям, рекомендации покупок, чат-боты. Распознавание изображений – одно из самых распространенных применений глубинной аналитики.

При этом новые технологии не заменяют, но дополняют старые. На 95% машинное обучение строится на линейной регрессии. «Глубинная аналитика эффективна в генерализации данных. Малослойное обучение (shallow learning) хорошо находит исключения и особые правила. Комбинация лучших практик позволяет создавать лучшие модели», – поясняет Стивен Бробст. Очень многие технологии глубинной аналитики строятся на свободном ПО, одно из самых популярных сегодня – Tensorflow.

Черный ящик

Парадокс развития технологий заключается в том, что человек знает о машинах несопоставимо больше, чем о собственном теле. Сегодня в мире набирает популярность прецизионная медицина. Стратегия индивидуального лечения строится исходя из огромного количества информации о ДНК, результатах обследований, наследственности.

Компания Teradata работает в этом направлении с фармацевтическими компаниями и лечебными учреждениями. «Когда дело доходит до использования очень продвинутых моделей, система говорит доктору, какое именно лечение он должен назначить, – рассказывает Стивен Бробст. – Однако анализируемых данных так много, что база для принятия решения врачу уже не совсем ясна». 

Один из главных недостатков глубинной аналитики состоит в том, что процесс обработки данных непрозрачен. Проблема того, как «провалиться» к исходным данным, до сих пор не решена.

Другой пример – скоринговая система, построенная на инструментах машинного обучения. Если вас спросят, почему вы этому человеку дали кредит, а этому нет, вы не сможете ответить, кроме того, что такое решение дал черный ящик.

По прогнозам IDC, непрозрачность когнитивных инструментов искусственного обучения приведет к тому, что 10% пользователей откажутся от этих решений. Технология хороша для оптимизации внутренних процессов, но пока не подходит для принятия решений, которые оказывают прямое влияние на клиента.

Широкое применение искусственного интеллекта пока не стало реальностью. Его еще рано использовать для принятия стратегических решений. Однако он уже доказал свою эффективность в отдельных кейсах и в принятии решений на уровне операционного управления.

«Новые технологии позволяют решать прежде невыполнимые задачи. Чтобы быть успешными и обеспечить свое завтра, мы должны понимать возможности и ограничения, которые предоставляют нам и нашим конкурентам современные технологи», – подчеркнул Андрей Алексеенко, генеральный директор Teradata в России.

Новые технологии оставят людей без работы?

Беспилотные автомобили, магазины с электронными кассами (или вовсе без касс), боты, обслуживающие клиентов, персональные помощники – все эти технологические тренды, безусловно, окажут свое влияние на рынок труда. Некоторые профессии уйдут, но люди не останутся без работы, так как появятся новые должности. 

Спрос на ученых по данным (data scientists) остается гораздо выше предложения. Но даже их работа поменяется, потому что нейронные сети будут делать большую часть их прежней работы. За аналитиками же останется принятия решений о применении тех или иных полученных знаний. 

Социально-культурная зрелость ученых по данным многими признается одним из важных критериев профессионализма. Умение интегрировать количественную и качественную информацию Триша Ванг считает определяющим.

«У нас каждая проектная группа, работающая с кейсом, плотно общается с бизнес-заказчиками, все вместе всё обсуждают, никто не варится в собственном соку. Нет вертикали, когда аналитики сидят где-то далеко в отдельном от всех своем мире. Поэтому количественные данные сразу накладываются на опыт общения с клиентами, который есть в различных подразделениях МТС», – делится опытом Леонид Ткаченко, МТС.

Запрограммировать убийство

Представьте, вы едете за рулем по мокрой дороге. Впереди женщина с детьми и коляской начинает переходить дорогу на красный цвет. На тротуаре ожидает зеленого сигнала светофора пожилая женщина. Затормозить вы не успеваете, и вам предстоит решить: сбить женщину с детьми, или вывернув руль, сбить пожилую даму на тротуаре. С одной стороны, ценность жизни молодой матери с детьми выше, чем престарелой дамы, которая уже в конце своего жизненного пути. Но женщина с детьми при этом нарушает правила, а пожилая женщина – нет. Выбор за вами, и в любом случае неверного решения здесь нет.

А если речь идет о беспилотном автомобиле? Тогда выбор должен быть запрограммирован. Разработчик готов запрограммировать что угодно, но ему надо сказать – что сделать. И здесь принять решение предстоит обществу, которое на сегодняшний день не готово справиться с этой философской дилеммой. Другая вариация той же проблемы – беспилотник, летящий в толпу, или убьет несколько людей, или въедет в стену, пожертвовав жизнью пассажира. Ценность нескольких жизней выше одной, это очевидно, но, как оказалось, люди не хотят машин, запрограммированных на убийство владельца.

Стремительное развитие технологий заставляет общество, бизнес и каждого из нас задуматься о новых философских проблемах, о своем месте в цифровой экономике. Будущее уже здесь, и надо быть готовым к моменту, когда оно станет достаточно распространено.