Кафедра анализа данных и машинного обучения Факультета информационных технологий и анализа больших данных

Петросов Давид Арегович

Ведущий научный сотрудник

Компании из какой сферы чаще всего заказывают высокотехнологичные решения, чему учат в магистратуре по программе «Технологии блокчейн и криптовалюты» и какая технология окажется самой обсуждаемой в 2019, рассказал профессор Владимир Игоревич Соловьев, руководи​тель департамента анализа данных, принятия решений и финансовых технологий Финансового университета при Правительстве Российской Федерации.

Владимир Соловьев 

- Какие новые проекты были запущены в 2018 году?

Во-первых, наш проект по распознаванию разворотов рыночных трендов​, который мы начали в 2017 году по заказу УК «Альфа-Капитал», получил развитие. Этим решением, которое в прошлом году показало доходность почти 29% - почти в два раза больше чем в среднем по рынку, заинтересовались в Правительстве. В 2018 году мы по заданию Правительства стали развивать эту систему и создали новый алгоритм, основанный на сверточных нейронных сетях, который уже показывает хорошую эффективность, при том что он обучен пока на малом количестве рыночных картинок. В дальнейшем наша разработка сможет использоваться в Банке России, Аналитическом центре при Правительстве Российской Федерации и т.д.

Помимо этого, у нас появилось много проектов для решения задач кредитного скоринга для разных банков. Речь идет не о стандартном кредитном скоринге в потребительском кредитовании, которым никого не удивишь, а о решениях для открытия новых сегментов.

Так, один из таких сегментов – клиенты с просроченными задолженностями по кредитам. Сейчас банки таким заемщикам отказывают в кредитовании, даже если просроченная задолженность составляет всего один рубль. Но ведь если гражданин Иванов задолжал всего рубль и просрочил выплату на три дня, то это, скорее всего, какая-то техническая ошибка, которая не говорит о его неплатежеспособности. Машинное обучение способно помочь банкам предсказать, каковы риски работы с такими клиентами в зависимости от параметров их предыдущих задолженностей.

- Из каких сфер чаще всего приходят заказчики?

Главная тенденция этого года – это интерес к технологиям у компаний из финансового сектора. Если еще в прошлом году банки не хотели инвестировать в подобные задачи, то во втором полугодии 2018 года банковских заказчиков стало много. До этого все общение с банкирами сводилось к тому, как сэкономить и где еще сократить персонал. В 2018 году финансовые компании заинтересовались высокими технологиями и начали активно в них инвестировать.

В 2019 году, по моим ожиданиям, банковских проектов у нас станет еще больше, и они будут масштабнее.

- Что ждут от высокотехнологичных решений заказчики чаще всего? Экономии?

Сейчас у компаний, которые начинают внедрять машинное обучение и другие высокотехнологичные решения, есть огромное преимущество. Это время быстрых побед, и те, кто будут первыми, смогут получить максимальный эффект от внедрения таких решений. В зависимости от масштаба организации речь может идти о многомиллионных выгодах.

Запросы от заказчиков можно поделить на две основные категории. Первая - когда компания хочет быстро повысить эффективность существующих процессов. Например, хочет, чтобы их станки ломались на 5% реже, поэтому готова внедрить систему интернета вещей.

Вторая категория запросов - и их доля растет - это когда заказчики хотят не улучшить что-то существующее, а с помощью технологий открыть новые рынки. Например, как зная фамилию, имя и телефон потенциального клиента определить, какой продукт ему нужен. Такая задача уже сложнее, поскольку требует работы с цифровым следом, который оставляет человек в сети: в каких сообществах состоит, кто его друзья, чем они интересуются и так далее.

- В 2018 году в университете начал работать проект по измерению уровня вовлеченности студентов с помощью искусственного интеллекта​. Есть ли предварительные результаты этого эксперимента?

Сам проект начался с того, что наш партнер – корпорация Microsoft – подарила нам несколько датчиков, контроллеров и видеокамер. Мы попробовали их использовать для развития наших компетенций в области Интернета вещей, но не в промышленном процессе, а в учебном - решили измерять вовлеченность студентов в образовательный процесс.

Сейчас камерами оборудованы аудитории главного корпуса университета - всего около 200 камер  в 60 аудиториях.

Идет только второй семестр эксперимента, но уже видно, что динамика положительная – вовлеченность растет, во многом благодаря тому, что преподаватели сами начали сравнивать динамику, интересуются показателями вовлеченности.

- Как этот эксперимент приняли преподаватели и студенты университета?

Сначала у многих был страх, что плохо обученная система будет показывать недостоверные результаты, а администрация, не подумав, будет увольнять преподавателей, если уровень вовлеченности студентов на их занятиях будет низким. Но со временем все увидели, что такого не произошло.

Когда люди перестали говорить, что система плохая и оценивает неправильно, мы поняли, что они сами оценивают себя приблизительно так же, как и искусственный интеллект.

У студентов был определенный дискомфорт только в самом начале эксперимента, особенно когда камеры начинали двигаться. Сейчас они поняли, что это элемент обеспечения качества образования, безопасности. Теперь в соцсетях они советуют друг другу вести себя прилично на занятиях.

- Вы рассказывали о проекте другим университетам?

У нас уже стоит очередь из вузов, которые интересуются системой оценки вовлеченности студентов.

Казахский национальный университет имени аль-Фараби решил опробовать у себя такую же систему, сейчас мы начинаем пилотный проект. Есть еще несколько университетов, с которыми переговоры на финальной стадии, но окончательного решения не принято.

Такое решение может быть использовано не только в вузах, но и в других потребительских сферах – в автосервисах, банках при общении с клиентом, в торговых центрах, в кинотеатрах при просмотре рекламы и так далее.

- 2019 год только начался, но учебный год в самом разгаре. Изменился ли подход к образовательному процессу в университете по сравнению с предыдущими годами?

Наш подход трансформировался во многих аспектах. За два с половиной года нам удалось перестроить процессы так, чтобы образование стало более прикладным и современным.

Во-первых, весной 2018 года мы выпустили учебник по математике для студентов первого курса всех экономических направлений подготовки. Раньше математика преподавалась экономистам как упрощенный вариант математической подготовки в технических вузах, которые готовят инженеров, способных спроектировать конструкцию в чистом поле с помощью ручки, бумаги и логарифмической линейки. Наш учебник ориентирован именно на студентов-экономистов: математика в нем дается в четкой параллели с экономическими дисциплинами, все вычисления производятся не на бумаге, а в компьютерных средах – Excel или открытой среде R.

Во-вторых, мы ввели на втором курсе дисциплину «Анализ данных». Раньше студентов-второкурсников учили теории вероятности и математической статистике, где им давали решать интересные, но упрощенные задачи на адаптированных данных. Новый курс предлагает анализировать вероятностно-статистическими методами реальную рыночную информацию. Студенты экономических направлений получают по пять акций и в течение года смотрят, что происходят с ценными бумагами. Так они на практике получают новые знания о рыночных процессах. По этой дисциплине также вышел учебник​, значительно отличающийся от всех других книг по теории вероятностей и математической статистике.

- Коснулись ли изменения и магистратуры?

Да. Наш фокус – прикладная наука, поэтому в этом году мы решили перестроить магистерскую программу по машинному обучению. Со следующего года студенты будут учиться по обновленной программе, в которой уделяется больше внимания последним достижениям в области нейронных сетей, обработке текстовой информации, компьютерному зрению. Магистерскую программу по интеллектуальным информационным технологиям тоже обновили, усилив уклон в обработку больших данных.

В этой сфере нельзя стоять на месте. Программа, которая была хороша два года назад, сейчас жизненно нуждается в изменениях. Если традиционные университеты занимаются тем, что просто учат, то мы так делать не можем. Учить студентов технологиям, которые постоянно меняются, по учебникам, которые вышли 3-5 лет назад, нельзя.

Но главное достижение – это то, что мы фундаментально пересмотрели подход к профильным программам. Раньше у нас была магистратура по программе “Количественные методы", и ее цель была подготовить выпускников к работе в самых разных областях – и считать эффективность продаж в торговых сетях, и строить модели оценки платежеспособности заемщиков в банках, и рассчитывать возраст дожития в страховых компаниях.  Но на практике в одной программе оказывались студенты с очень разными интересами.

Когда мы сделали четко сфокусированные магистерские программы – по машинному обучению, по обработке данных, по технологиям блокчейн​ - ситуация радикально изменилась, популярность магистерских программ резко выросла. Магистранты сразу потянулись. В группах оказались люди с приблизительно одинаковой специализацией, интересами и умениями. 

- Программа по технологиям блокчейн – это ответ на прошлогодний всплеск интереса к криптовалютам?

Наша программа по блокчейну и криптовалютам запустилась впервые в 2018 году. Это был первый набор в магистратуру в России по такому направлению. Но сама программа, конечно, не о том, как, имея 50 рублей, заработать 50 миллионов, а потом их потерять.

Программа посвящена тому, как устроен мир криптовалют и блокчейна с точки зрения технологий, алгоритмов, какие модели бизнеса в нем применимы, что можно реализовать на этих технологиях.

В прошлом году все думали, что каждая организация должна завести свою криптовалюту и сделать что-то на блокчейне. Теперь стало понятно, что эта технология нужна не везде.

- А сами студенты как-то изменились?

Изменился интерес к нам как к университету. В 2018 году у нас небывалый всплеск числа платных студентов, и это происходит не за счет сокращения бюджетных мест. Если раньше на направление «Прикладная математика и информатика» было 2-3 «платника» на 100 бюджетников, то в этом году рост многократный – 51 внебюджетный студент на 71 бюджетного.

Это связано не только с тем, что Россия прошла демографическую яму. В нашу пользу сыграло и сарафанное радио: репутация университета выросла. Мы становимся заметными как университет, который готовит не только финансистов и экономистов, но и специалистов по анализу и обработке данных.

- Планируются ли какие-то изменения в образовательном процессе в 2019 году?

Наша задача – это чтобы у каждого магистранта выпускная квалификационная работа была проектом по заказу бизнеса и с контрактом, в котором прописана и ответственность исполнителя, то есть магистранта, и ответственность университета. С таким контрактом уровень доверия бизнеса к нам как к разработчикам будет совсем другим.

- В 2017 году все говорили о криптовалютах и блокчейне, в 2018  – об искусственном интеллекте, а какая технология станет главной темой 2019 года?

Я жду более активного развития Интернета вещей и сервисов для анализа аудио- и видиозаписей. Я думаю, что скоро появятся потребительские решения для поиска в видеозаписях, аналогичные тому, как ищут в тексте с помощью Ctrl + F. С распознаванием голоса сложнее. Существуют сервисы, которые уже сейчас распознают речь и трансформируют ее в печатный текст, но их качество пока не идеально. 

Главной революцией, которую я жду, но которая вряд ли состоится в 2019 году, – это трансформация отношения общества к технологиям. Сейчас самый острый вопрос – это вопрос ответственности. Если система, основанная на искусственном интеллекте, приняла неправильное решение, то кто несет ответственность, кто будет исправлять ошибку? Это пока не ясно ни на уровне организаций, ни на уровне государства, ни на уровне общества.

Со временем лавина таких вопросов будет нарастать. Что будет, когда появится по-настоящему сильный искусственный интеллект, который сможет понимать смыслы? Возникнет множество этических вопросов: что делать, если вас полюбил ИИ, что бывает за жестокое обращение с ИИ и так далее.