В исследовании с помощью анализа метрик теории сложных сетей были выявлены закономерности категоризации и организации статей Википедии. В частности, было показано, что более 30% всех ссылок между статьями русскоязычной Википедии образовано с помощью навигационных блоков. Учет данной особенности может существенно повлиять на качество алгоритмов машинного обучения, использующих для обучения данные из Википедии.
Сфера применения: решение может быть использовано для повышения качества систем искусственного интеллекта, использующих статьи Википедии как источник данных для обучения.
Техническое описание: для построения модели был проведен анализ аномалий на метриках теории сложных сетей, построенных для сети статей Википедии. Для решения задачи использовалась графовая база данных neo4j.
Участники проекта: доцент, к.э.н. С.В. Макрушин
Работа выполнена – в рамках НИР