Искусственный интеллект все больше применяется в различных сферах и отраслях экономики. Причина — активное развитие технологий, появление предобученных моделей, которые легко настроить под различные нужны. На этом пути важен опыт первопроходцев. Об этом говорили участники организованной CNews Conferences конференции «Искусственный интеллект 2021».
Кому нужен искусственный интеллект
По итогам 2020 г. рынок ИИ в России вырос на 22,4%. Предполагается, что до 2024 г. он будет увеличиваться 18,5% ежегодно. Основными заказчиками таких решений являются крупные компании и госсектор. Последний намерен инвестировать в искусственный интеллект на 26,4% больше каждый год в ближайшие несколько лет. Новость хорошая, однако Юрий Хомутский, директор ИТ-маркетплейса Market.CNews, в своем выступлении отметил: Китай тратит на ИИ в 250 раз больше, чем Россия, при этом его ВВП больше в 10 раз.
Сегодня ИИ активнее всего используется для создания голосовых помощников, в системах безопасности и в здравоохранении для анализа МРТ и рентген-снимков. Однако Юрий Хомутский подчеркнул, что ИИ все же нельзя назвать самостоятельным рынком. Он служит, скорее, дополнением к уже имеющимся решениям. «Для массового рынка вывеска «Продаю искусственный интеллект» не сработает, — говорит он. — Лучше вычленить проблему бизнеса, найти подходящее решение и встроить туда элементы этой технологии».
Искусственный интеллект для всех
Главной мировой новостью августа стало заявление Центра исследований фундаментальных моделей при Университете Стэнфорда о радикальной смене парадигмы в машинного обучения. Михаил Степнов, исполнительный директор по исследованию данных, Sber AI спросил собравшихся, слышал ли кто-нибудь о foundation models. Поднялось лишь несколько рук. Суть новости проста: появились модели, предобученные на большом объеме данных, которые можно адаптировать и применять без особых усилий. Количество данных, которые используются для предобучения, растет, а сами модели становятся мультимодальными.
Первый результат — качественные изменения на рынке трансформеров. «Произошло то, что можно назвать стероидной гонкой моделей, — рассказывает Михаил Степнов. — Например, GPT3 уже умеет общаться почти как реальный человек, которому лет 5-6. Теперь каждому дата-сайентисту нужен свой трансформер». Совмещение модальностей в одной мета-модели — следующий логичный шаг, который позволит объединить результаты разных моделей.
Мультимодальная архитектура
«Больше не нужно выбирать между ценой и качеством модели, — говорит Михаил Степнов. — Ее уже обучили за вас. Она готова на 95%, и вы потратите только 2-3 недели для того, чтобы настроить ее под ваши задачи».
«Уверяю вас, что круче Сбера по части ИИ в банковском секторе нет никого, — продолжил его коллега Отари Меликишвили, лидер продуктового направления, SberCloud. — Мы являемся самым крупным работодателем для дата-сайентистов во всей Восточной Европе. В нашей группе компаний работают около 1500 таких специалистов. За много лет они накопили так много опыта, что пора им делиться».
Компания решила максимально упростить возможность создания решений на базе ИИ. Для этого она предлагает, во-первых, платформу полного цикла разработки ML Space. R&D — это самая ресурсозатратная часть процесса машинного обучения. «Затраты на обслуживание решения, которое работает и приносит бизнес-результат, можно посчитать. А оценить, во сколько обойдется создание модели, не возьмется никто, потому что непонятно, сколько на это потребуется времени: 3 месяца или полгода. Может быть, и вовсе ничего не получится», — объясняет Отари Меликишвили.
Платформа ML Space дает возможность сократить затраты на специалистов и время вывода в продакшн. Это единый инструмент для коллаборации, визуализации и версионирования. Она позволяет обмениваться данными с другими пользователями и проводить совместные эксперименты. ML Space могут пользоваться не только дата-сайентисты, но и аналитики, администраторы, devOps-инженеры. Второй сервис — Data Science (DS) as a Service. Иметь в штате собственных дата-сайентистов очень дорого. Поэтому Сбер предлагает услуги своих специалистов. Третий сервис — маркетплейс готовых моделей и дата-сетов.
«Есть задачи, решение которых нагуглить невозможно. Для них нужен мозговой штурм лучших специалистов», — продолжает Отари Меликишвили. Для того, чтобы проводить чемпионаты в области Data Science, создана онлайн-платформа DS Works. «Классические задачи в ML можно решать в виде соревнований, и 200-300 сайентистов из разных стран посоревнуются за призовой фонд. Миллиона рублей достаточно, чтобы получить готовый микросервис, который решит вашу бизнес-задачу», — рассказал Отари Меликишвили.
Можно ли верить ИИ
«Мне хотелось бы, чтобы вы задали себе вопрос, в чем ценность искусственного интеллекта для заказчика?», — предлагает поразмышлять Виталий Астраханцев, продакт-менеджер AI-решений компании Directum. Если вспомнить, как менялась роль интеллектуальных сервисов в процессе обработки документов, можно увидеть, что всего за несколько лет от полу-ручного распознавания, когда нужно было самостоятельно указывать вид документа, сканировать с предобработкой и извлекать факты по шаблонам настраиваемых форм, удалось перейти к минимизации ручного труда и тесной интеграции с корпоративными информационными системами как источником знания. Доволен ли заказчик?
«В январе и феврале 2021 года мы провели опрос, чего ждут клиенты от встраивания интеллектуальных инструментов в процесс обработки документов, — рассказал Виталий Астраханцев. — Почти все хотят, чтобы данные, извлеченные машиной, не нужно было проверять, чтобы ИИ, как человек, мог сам формировать комплекты документации и связывать их с существующими документами, готовил проекты резолюций или ответов на основе исторических данных». Проблема в том, что данным, обработанным ИИ, нельзя слепо доверять. Нейросеть и машинное обучение всегда дают вероятностный результат (в среднем это 85%). Остается значительный процент данных, которые все-таки придется перепроверять. Но бизнес хочет все или ничего.
Directum решил довести уровень распознавания до 100%. Поскольку технологии этого пока не позволяют, остается добавить в схему человека, который будет перепроверять работу ИИ, и предложить заказчику соответствующий облачный сервис. Для клиента не имеет значения, как он работает, ему важно распознавание любых видов документов без обучения нейросетей, без разметки. «Мы не откладываем старт проекта на полгода, пока сети учатся, а начинаем работу сразу. Клиент получает результат за счет объединения готовых моделей классификации, извлечения фактов и работы верификаторов на стороне сервиса», — объясняет Виталий Астраханцев.
Екатерина Потапова, руководитель направления исследований и аналитики Центра подготовки руководителей и команд цифровой трансформации, ВШГУ РАНХиГС, рассказала, как за последние пять лет изменились ожидания от ИИ. Если в 2016 г. наблюдался технооптимизм, и эксперты утверждали, что искусственный разум лучше человеческого, потому что непредвзят, то в 2021 г. они начали оценивать риски и перестали верить в непредвзятость.
В качестве примера Екатерина Потапова привела историю, когда в 2020 г. чат-бот на базе модели GPT-3, созданный как помощник врача, в ходе эксперимента посоветовал пациенту убить себя. На его слова: «Мне очень плохо, мне убить себя?», ИИ дал простой ответ: «Я думаю, стоит».
Главная проблема — предвзятость
Для медицины производители ИИ создают универсальные системы, которые можно продать как можно большему количеству покупателей. Но эти системы не учитывают изменения, которые происходят с течением времени. Кроме того, врачи и административный персонал не умеют пользоваться такими инструментами, из-за чего либо игнорируют их рекомендации, либо, наоборот, слишком доверяют им.
Еще один пример. Весной 2021 г. регулирующие органы США и Европы заявили, что при использовании ИИ возникает проблема этического характера — алгоритмы склонны к дискриминации. Исследователи смоделировали реакцию клиентов на общение с двумя банками. В первом банке для получения кредита женщинам, возможно, придется соответствовать более высоким требованиям, чем мужчинам. Второй банк имеет одинаковый порог одобрения кредита для всех заявителей. Созданная модель показала, что клиенты первого банка довольно быстро узнают о риске дискриминации и переходят во второй банк.
Интеллект и финансы
Развитие цифровых технологий, таких как облачные вычисления, большие данные и робототехника, меняет финансовую отрасль. Она движется от приложений для просмотра котировок и мобильного банкинга к полноценной торговой системе и виртуальных помощников. По словам Ярослава Кабакова, директора по стратегии ИК «Финам», машинное обучение и ИИ все больше проникают в процессы управления финансами, а цифровые технологии лежат в основе всех взаимодействий с клиентами. Однако надо быть осторожным.
Первый продукт, который создал «Финам», — рекомендательная система, объединенная с CRM. «После ее запуска мы вдруг поняли, что лучше заняться настоящим «клиентским счастьем». На самом деле люди напрягаются, когда им постоянно что-то предлагают и рекомендуют. Я сам клиент нашей компании, и система оценила меня как супер-счастливого. Однако я стал счастлив только после того, как попросил менеджеров прекратить мне звонить», — поделился Ярослав Кабаков.
Опытом внедрения машинного обучения поделился Александр Ошурков, руководитель ЦК ML, «Московский кредитный банк». «Информационная безопасность – неотъемлемая часть финтеха, — говорит он. — Необходимо объяснить коллегам из отдела информационной безопасности, чем вы собираетесь заниматься, показать функционал решений. Наши инструменты для них новые, незнакомые, поэтому нужно рассказать о ПО и провести софт через некоторые процедуры, чтобы легализовать его в глазах офицера по ИБ».
Инструменты, на которые стоит обратить внимание на самом старте
Отдельная проблема — кадровая. Прежде чем искать специалистов на рынке труда, надо проверить собственные ресурсы. По мнению Александра Ошуркова, технологии ИИ и машинного обучения сегодня очень популярны, поэтому если написать внутреннее письмо, есть вероятность найти заинтересованных людей среди своих. Второй вариант — привлечь готовых профессионалов на конкретные проекты. На рынке есть ряд компаний, развивающих это направление.
У клиентов сейчас больше информации, они имеют возможность выбирать по-другому, поэтому их поведение меняется. Например, по данным PwC 80% потребителей готовы платить за удобство и качество сервиса, а не за бренд, а 32% готовы уйти от любимого бренда после первой же его ошибки. Именно поэтому компаниям требуется анализировать действия клиента на каждом этапе сотрудничества. Для этого многие компании применяют искусственный интеллект.
Как рассказал Сергей Алешкин, глава департамента Data Science, СОГАЗ, в страховании 30% организаций используют искусственный интеллект для проведения скоринга при предстраховой проверке, в прямых продажах страховых продуктов или для кросс-продаж продуктов и услуг уже существующим клиентам. По его словам, при кросс-продажах ОСАГО из тех, кого отобрал искусственный интеллект, 40% были готовы купить продукты добровольного страхования в ближайшее время. Для сравнения, согласно статистике только четыре человека из ста соглашаются рассмотреть покупку полиса добровольного страхования.
Пять принципов успешного внедрения ИИ в компании
Тем не менее, искусственный интеллект невозможно внедрить без других компонентов цифровизации, подчеркнул Сергей Алешкин. Потребуются и корпоративные хранилища данных, отвечающие современным принципам работы с большими данными, и обучение сотрудников компании работе с современными цифровыми технологиями, и многое другое.
Миру нужны новые герои
Одним из открытий конференции стал факт, что медицинские вузы готовят не только врачей, но и программистов. Да и врачам знание ИТ не помешает. «Все наши выпускники должны владеть цифровыми технологиями. Каждый врач, выходя из стен института, должны знать, что такое ИИ и как с ним работать. Мы готовим не только медиков, но и разработчиков цифровых медицинских систем, которые будут их внедрять и поддерживать», — заявил Георгий Лебедев, директор института цифровой медицины, заведующий кафедрой информационных и интернет-технологий Первого МГМУ им. И.М. Сеченова.
В ВУЗе уже вводятся новые дисциплины, такие как e-health, аналитика больших данных в медицине и социологии, нейронные сети, базы данных и основные методы биоинформатики.
Использование ИИ в медицине и здравоохранении
«В здравоохранении на первом месте стоит человеческая жизнь, поэтому в медицине нет резкого взлета ИИ. Плюс надо помнить, что качественная цифровизация медицины возможна только при наличии шикарных каналов связи, — подчеркнул Георгий Лебедев. — Но мы движемся в направлении новых технологий. Проводим научные исследования и сразу привлекаем к ним студентов, чтобы они учились на практике. В любую ИТ-команду включаем и будущих врачей, которые смогут заниматься постановкой задач, и будущих программистов, которых ИТ-компания наверняка захочет забрать себе».
Тему образования в сфере ИИ поднял и Игорь Пивоваров, главный аналитик Центра искусственного интеллекта, МФТИ. Несмотря на то, что каждый год университеты выпускают все новых и новых ИТ-специалистов, область data science испытывает постоянный кадровый дефицит — не хватает, по меньшей мере, 5000 человек.
Беды определены. Что делать?
С рынком самого ИИ тоже не все однозначно. С одной стороны, он растет в 7,5 раз быстрее, чем ВВП России. С другой стороны, инвестиции в стартапы в 2020 г. упали на 46% в количестве сделок и на 63% в объеме инвестиций. За год был всего один «выход» на сумму в 2,5 млн долларов.
Невелик и объем научных публикаций об искусственном интеллекте. «Прогресс в научных исследованиях мы измеряем по числу публикаций, а также по числу патентов и открытых библиотек. В 2020 году позиция России практически не изменилась — она занимает 23 место по числу публикаций», — сообщил Игорь Пивоваров.