Кафедра анализа данных и машинного обучения Факультета информационных технологий и анализа больших данных

Петросов Давид Арегович

Ведущий научный сотрудник

Анализ структуры графа Википедии

В исследовании с помощью анализа метрик теории сложных сетей были выявлены закономерности категоризации и организации статей Википедии. В частности, было показано, что более 30% всех ссылок между статьями русскоязычной Википедии образовано с помощью навигационных блоков. Учет данной особенности может существенно повлиять на качество алгоритмов машинного обучения, использующих для обучения данные из Википедии.

Сфера применения: решение может быть использовано для повышения качества систем искусственного интеллекта, использующих статьи Википедии как источник данных для обучения. 

Техническое описание: для построения модели был проведен анализ аномалий на метриках теории сложных сетей, построенных для сети статей Википедии. Для решения задачи использовалась графовая база данных neo4j.

Участники проекта: доцент, к.э.н. С.В. Макрушин

Работа выполнена – в рамках НИР