Вопрос-ответная система на естественном языке. Платформа на базе алгоритмов глубинного машинного обучения для создания разговорного искусственного интеллекта, призванного отвечать на вопросы в заданной предметной области с помощью данных из крупной универсальной базы знаний (Wikidata). Отличается низкой долей неверных ответов.
В ходе исследовательского проекта решены следующие задачи:
• Структурирование вопросов в рамках предметной области
• Создание методологии, сбор и разметка большого объема исходных данных (вопросов)
• Идентификация сути запроса (интента)
• Выявление нетипичных именованных сущностей и сущностей с привязкой к ее типу
• Создание локальной версии крупной универасальной базы знаний
• Нечеткий поиск сущности в базе знаний
• Фильтрация кандидатов с использованием типизации сущностей
• Выбор наилучшего кандидата и признание отсутствия хорошего ответа
• Генерация ответа
Сфера применения: решение может быть использовано для построения вопрос-ответных систем поддержки клиентов, чат-ботов.
Подробнее о создании чатбота — в интервью доцента Департамента анализа данных, принятия решений и финансовых технологий Екатерины Владимировны Романовой.
Техническое описание: для построения модели была использована платформа iPavlov, для которой было реализован ряд специализированных компонент и было проведено дообучение нескольких стандартных моделей проекта.
Участники проекта: доцент, к.э.н. С.В. Макрушин, инженеры Н.В. Блохин, Н.А. Титов, бакалавр Е. А. Емелин, доцент, к.ф-м.н. Е.В. Романова
Работа выполнена в рамках коммерческого заказа.