Рынок бизнес-аналитики растет быстрее рынка ИТ в целом за счет все большей популярности современных BI-платформ, которые сформировались в последние несколько лет в ответ на новые потребности заказчиков в доступности, гибкости и глубоком анализе данных. BI-системы превращаются из сложного инструмента, управление, в средство подготовки отчетности, настаиваемое пользователем в соответствии с его индивидуальными предпочтениями. Тем не менее, по мнению Gartner, темпы роста рынка BI будут постепенно снижаться – с 63,6% в 2015 г. до 19% к 2020 г. благодаря усилению на нем конкуренции и соответственному снижению цен на предлагаемые решения. Перспективы отрасли обсудили участники секции «Business Intelligence», организованной CNews Conferences в рамках CNews FORUM 2017.
Банки в авангарде внедрения BI
Банки традиционно выступают «передовиками» по части внедрения BI. О настоящем и будущем хранилища данных Сбербанка рассказал Борис Рабинович, директор Центра Компетенций развития BI технологий, Сбербанк-Технологии. В том, что касалось вопросов аналитики и управленческой отчетности, банк много лет развивал решения на платформе Oracle, используя Informatica для сбора данных и Teradata в качестве хранилища. Но в какой-то момент объемы данных стали настолько большими (прогноз прироста сырых данных на 2017 год – 28 ПБ, это 78 ТБ в день), а доллар стал стоить так много рублей, что банк задумался о переходе на другие платформы и сделал ставку на open source. Сбербанк планирует до конца 2017 года загрузить в облако данных на Hadoop 71 систему-источник, с этой целью был запущен проект «Фабрика данных», в который вовлечено порядка 70 аджайл-команд.
Уровень амбиций банка очень высок – построить хранилище данных на Hadoop, что в таком масштабе и с такой сложностью никто раньше в мире не делал. Поэтому необходимо выполнить двадцать шесть пилотов для выбора ключевых архитектурных элементов платформы.
«Шаг за шагом мы раздвигаем границы изведанного. Мы пробуем понимаем, что можно, что нельзя. Когда мы на тыкаемся на то что нельзя, мы думаем, что можно успокоиться, и тут оказывается, что за те несколько месяцев, что мы это исследовали, на рынке появилось другое решение, которое позволяет сделать то, что нам нужно. И мы продолжаем свой поиск,» - сказал Борис Рабинович.
Кстати, переход на open source платформы почти всегда сопровождается и принятием концепции DevOps, что позволяет гораздо быстрее внедрять изменения. Не миновала эта доля и Сбербанк. Теперь новые функции и патчи проходят путь от среды разработки до продакшн не за три месяца, как раньше, а за две недели.
Вне зависимости от того, насколько прогрессивная у вас техническая архитектура, процесс построения управления данными имеет критически важное значение. Потому что под любой цифрой или графиком, который видит топ-менеджер на своем гаджете, лежит огромный массив данных, и любая ошибка в одном маленьком справочнике в одной из сотен ИТ-систем может повлечь колоссальную ошибку в отображении результатов деятельности банка и привести к принятию неправильных решений, отметила Светлана Бова, директор департамента аналитических систем Росбанка.
Причем это только одна сторона проблемы, обусловленная требованиями бизнеса. Кроме того, банкам «помогают» регуляторы в лице ЦБ и органов власти, которые запрашивают все больше и больше детализированной информации.
Чтобы у потребителей аналитической информации не возникало сомнений в ее интерпретации, организации в первую очередь нужно создать единый глоссарий бизнес-терминов. Иначе говоря, все подразделения должны найти общий язык и это проблема совсем не технологическая. Второй момент связан с качеством данных. Здесь надо определить, какие данные в каком формате нужны и что, собственно, есть правильный формат. Немаловажным компонентом является также построение управления цепочкой жизненного цикла данных и отслеживания взаимозависимостей (data linage). Все вместе это помогает быстрее внедрять изменения в бизнес-процессы и в ИТ-системы.
Но всегда ли нужно стремиться к тому, чтобы данные были безупречно полными и правильными? Всегда ли овчинка стоит выделки? Опыт показывает, что нет. Например, когда Росбанк оценил, во сколько обойдется выверка адресов клиентов и приведение их к стандарту КЛАДР, то было решено от этого отказаться, потому что эффект для бизнеса от этой работы был бы ничтожно мал.
Управление стоимостью – завершающий блок процесса управления данными, позволяет понять и оцифровать, как качество того или иного показателя или того или иного поля в системе влияет на маржу банка, на оценку рисков, как долго стоит его и тратить инфраструктурные мощности.
Весь этот комплекс вопросов входит в зону ответственности CDO – Chief Data Officer. Когда в Росбанке пришли пониманию, что пора ввести такую должность, эта почетная миссия была возложена на человека внутри ИТ. Однако оказалось, что это не тот путь. Все-таки за данные должен отвечать человек, находящийся ближе к бизнесу и финансам, поэтому в итоге офис CDO был создан департаменте управления изменениями, который отвечает за все инновации.
Пример трансформации, когда крупный бизнес становится ИТ-бизнесом и данные становятся товаром. ИТ-кластер это пример построения экосистемы партнеров для компаний, которые переходят в цифровую экономику.