Кафедра анализа данных и машинного обучения Факультета информационных технологий и анализа больших данных

Петросов Давид Арегович

Ведущий научный сотрудник

"Умная" разметка договоров

Компания -заказчик имеет интенсивный входящий поток заявок. Каждая заявка представляет собой договор, составленный в произвольной форме. В этих договорах содержится определенная информация, которую операторы компании заносят в базу данных. Раньше эта работа производилась вручную, что требовало содержания штата операторов. Нашей задачей было построение прототипа программы и пользовательского интерфейса, который бы позволял автоматизировать процесс обработки входящих документов, агрегировать историю и обучать интеллектуальную систему, способную со  временем вытеснить оператора-человека в задаче выделения данных из документов.​

Сфера применения: данная система может использоваться, после определенной адаптации, для автоматизации задач разметки документов любого вида, будь то входящая корреспонденция, внутренние документы или что-то еще. Система может использоваться в двух режимах: как визуальный интерфейс для разметки документов и как система машинного обучения для автоматизации такой разметки.

Технологическое описание: система использует стек веб-технологий для построение визуального интерфейса. Фронт-энд написан на JavaScript, серверная часть - на Python. Система использует формальное описание схемы данных, представляющих интерес для заказчика и формирует базу интеллектуальных правил выделения данных в документах. Подсистема машинного обучения также использует базу правил в сочетании с текстовыми эмбеддингами. 

Участники проекта: Разработчики - Коротеев М.В., доц. ДАДПРиФТ, Скиба Ольга - студент ПМиИТ.

Инициативная разработка департамента.