Proceedings of the International scientific and practical conference ―Science, Technology and Culture: Interaction, Evolution and Progress‖ (December 21-23, 2025) / Publisher website: www.naukainfo.com. – Copenhagen, Denmark, 2026. – 161 p.
63 Результати досліджень Ключовим етапом роботи стала перевірка ефективності алгоритмів навчання без учителя для задачі виявлення підміни автора. Порівнювалися два методи векторизації: Default (NLP підхід на основі слів) та Stylometry (підхід на основі символьних n-грам). Таблиця 1. Порівняння ефективності алгоритмів детекції аномалій Algorithm Method AUC-ROC True False Isolation Forest Stylometry 0.389257 14/50 157/350 Isolation Forest Default 0.237314 0/50 87/350 Isolation Forest Stylometry 0.770000 25/50 56/350 Isolation Forest Default 0.636629 18/50 50/350 One-Class SVM Stylometry 0.805486 37/50 140/350 One-Class SVM Default 0.680286 38/50 211/350 SGD Linear SVM Stylometry 0.729371 50/50 349/350 SGD Linear SVM Default 0.598857 50/50 342/350 Аналіз даних таблиці показав: 1. Метод Stylometry (n-грами) стабільно перевершує стандартний NLP за показником AUC-ROC. Це підтверджує, що структура слів несе більше інформації про особу автора, ніж словниковий запас. 2. Найкращий результат надав алгоритм One-Class SVM зі стилометричними ознаками (0.805). Він забезпечує оптимальний баланс між виявленням атак та кількістю хибних спрацювань. 3. Алгоритм SGD Linear SVM, хоч і виявив усі атаки, продемонстрував неприйнятно високий рівень хибних тривог (близький до 100%), що робить його непридатним для реальних систем. Висновки
Made with FlippingBook
RkJQdWJsaXNoZXIy MTAxMzIwNA==