Proceedings of the International scientific and practical conference ―Science, Technology and Culture: Interaction, Evolution and Progress‖ (December 21-23, 2025) / Publisher website: www.naukainfo.com. – Copenhagen, Denmark, 2026. – 161 p.
61 Одним із перспективних інструментів, що дозволяє вирішити цю проблему в рамках розвідки з відкритих джерел (OSINT) , є метод кількісного аналізу авторського стилю – стилометрія. Відомо, що кожен автор має унікальний «стилістичний відбиток» (ідіолект), який проявляється у несвідомому використанні специфічних мовних конструкцій, пунктуації та патернів кодування [1]. Актуальність задачі Серед актуальних проблем атрибуції кіберзагроз та аналізу даних в OSINT можна виділити такі [2]: 1. Зміна семантичного домену. Стандартні NLP-моделі (наприклад, BERT) часто «вивчають тему», а не автора. Коли зловмисник змінює контекст спілкування, точність ідентифікації критично знижується. 2. Обфускація програмного коду. Розробники шкідливого ПЗ застосовують пакувальники та обфускатори. Лексичні методи аналізу дають високий рівень помилкових спрацювань (False Positive). 3. Компрометація облікових записів. Необхідність виявлення ситуацій, коли легітимний акаунт захоплюється зловмисником, вимагає аналізу поведінкових аномалій, а не лише факту входу в систему. У цій роботі пропонується архітектура системи для автоматизованої атрибуції текстів та програмного коду, яка базується на аналізі мікро- синтаксичних ознак та «технічного шуму» (n-грами, службові слова, відступи в коді). Архітектура рішення Загальну схему алгоритму стилометричного аналізу для підтримки OSINT- розслідувань подано на рис. 1.
Made with FlippingBook
RkJQdWJsaXNoZXIy MTAxMzIwNA==