СИСТЕМА ВИЯВЛЕННЯ ФЕЙКОВИХ НОВИН ЗА ДОПОМОГОЮ DATA SCIENCE

Автор(и)

  • Володимир Маркович Базилевич Національний університет «Чернігівська політехніка» http://orcid.org/0000-0001-8935-446X
  • Марія Дмитрівна Прибитько Національний університет «Чернігівська політехніка»

Ключові слова:

Python, фейк, фейкова новина, правдива новина, класифікатор

Анотація

Актуальність теми дослідження. На сьогодні актуальним є завдання аналізу правдивості інформації в новинах, якими заповнені всі існуючі канали отримання інформації. Її актуальність пов’язана з необхідністю запобігання паніки через отримання недостовірної інформації, розвінчування псевдонаукових фактів, що можуть загрожувати життю людей, боротьба з політичною пропагандою та інші.

Постановка проблеми. Ця робота фокусується на понятті розробки системи виявлення фейкових новин, аналізі існуючих систем та їх принципів роботи, принципів побудови їх алгоритмів та особливостях їх використання. 

Аналіз останніх досліджень та публікацій. Були розглянуті останні публікації у відкритому доступі, статистичні дані, звіти корпорацій.

Виділення недосліджених частин загальної проблеми. Аналіз файлу буде виконаний за допомогою трьох методів/класифікаторів і без використання PassiveAgressive класифікатора. Обчислення та виведення результатів виконується за допомогою побудови матриць помилок та розрахування точності.

Постановка завдання. Основною метою роботи є створення на основі розглянутих матеріалів системи виявлення фейкових новин та досягти найбільш можливої точності.

Виклад основного матеріалу. Обрано вхідні дані для дослідження, проведена їх підготовка та аналіз. Проведено дослідження даних за допомогою методів/класифікаторів Логістичної регресії, Дерева рішень та Рандомного лісу. Обчислена точність виявлення фейкових новин.

Висновки відповідно до статті. Запропонована система дозволяє класифікувати новини як «фейкові» або «правдиві» з точністю 98-99 %. 

Біографії авторів

Володимир Маркович Базилевич, Національний університет «Чернігівська політехніка»

кандидат економічних наук, доцент

Марія Дмитрівна Прибитько, Національний університет «Чернігівська політехніка»

здобувачка вищої освіти

Посилання

Mishevski F. Detecting Fake News With Python And Machine Learning. URL: https://ichi.pro/ru/obnaruzenie-fejkovyh-novostej-s-pomos-u-python-i-masinnogo-obucenia272146875193862.

Detecting Fake News with Python. URL: https://data-flair.training/blogs/advanced-pythonproject-detecting-fake-news.

Claire Wardle Fake news. It’s complicated. URL: https://firstdraftnews.org/latest/fake-newscomplicated.

Fake and real news dataset. URL: https://www.kaggle.com/clmentbisaillon/fake-and-real-newsdataset.

TF-IDF. URL: https://en.wikipedia.org/wiki/Tf%E2%80%93idf.

Confusion matrix. URL: https://scikit-learn.org/stable/auto_examples/model_selection/ plot_confusion_matrix.html.

##submission.downloads##

Номер

Розділ

ІНФОРМАЦІЙНО-КОМП’ЮТЕРНІ ТЕХНОЛОГІЇ