СИСТЕМА ВИЯВЛЕННЯ ФЕЙКОВИХ НОВИН ЗА ДОПОМОГОЮ DATA SCIENCE

Автор(и)

  • Володимир Базилевич Національний університет «Чернігівська політехніка», Україна https://orcid.org/0000-0001-8935-446X
  • Марія Прибитько Національний університет «Чернігівська політехніка», Україна

DOI:

https://doi.org/10.25140/2411-5363-2020-4(22)-91-95%20

Ключові слова:

фейк; фейкова новина; правдива новина; класифікатор

Анотація

Актуальність теми дослідження. Великий об’єм інформації, що став традиційним для інформаційного суспільства, створює нові виклики для людства. На заміну проблемі складного доступу до інформації, що була актуальна раніше, приходить нова проблема: структуризації та фільтрування інформації. Серед загального потоку інформаційного шуму актуальним стає питання виокремлення правди. У цьому контексті важливим постає питання не лише розвитку критичного мислення, але й розробки технічних засобів виявлення фейків.

Постановка проблеми. Ця робота фокусується на понятті розробки системи виявлення фейкових новин, аналізі існуючих систем та їхніх принципів роботи, принципів побудови їхніх алгоритмів та особливостях їх використання.

Аналіз останніх досліджень та публікацій. Були розглянуті останні публікації у відкритому доступі, статистичні дані, звіти корпорацій.

Виділення недосліджених частин загальної проблеми. Аналіз файлу буде виконаний за допомогою трьох методів/класифікаторів і без використання PassiveAgressive класифікатора. Обчислення та виведення результатів виконується за допомогою побудови матриць помилок та розрахування точності.

Постановка задачі. Основною метою роботи є створення на основі розглянутих матеріалів систему виявлення фейкових новин та досягти найбільш можливої точності.

Виклад основного матеріалу. Обрано вхідні дані для дослідження, проведена їх підготовка та аналіз. Проведено дослідження даних за допомогою методів/класифікаторів Логістичної регресії, Дерева рішень та Рандомного лісу. Обчислена точність виявлення фейкових новин.

Висновки відповідно до статті. Запропонована система дозволяє класифікувати новини як «фейкові» або «правдиві» з точністю 98-99 %.

Біографії авторів

Володимир Базилевич , Національний університет «Чернігівська політехніка»

кандидат економічних наук, доцент

Марія Прибитько , Національний університет «Чернігівська політехніка»

здобувачка вищої освіти

Посилання

Mishevski F. Detecting Fake News With Python And Machine Learning. URL: https://ichi.pro/ru/ obnaruzenie-fejkovyh-novostej-s-pomos-u-python-i-masinnogo-obucenia-272146875193862.

Detecting Fake News with Python. URL: https://data-flair.training/blogs/advanced-python- project-detecting-fake-news.

Claire Wardle Fake news. It’s complicated. URL: https://firstdraftnews.org/latest/fake-news- complicated.

Fake and real news dataset. URL: https://www.kaggle.com/clmentbisaillon/fake-and-real- news-dataset.

TF-IDF. URL: https://en.wikipedia.org/wiki/Tf%E2%80%93idf.

Logistic regression. URL: https://en.wikipedia.org/wiki/Logistic_regression

Saishruthi Swaminathan Logistic Regression – Detailed Overview. URL: https://towardsdatascience.com/logistic-regression-detailed-overview-46c4da4303bc.

Дерево решений (Decision Trees) – Detailed Overview. URL: https://wiki.loginom.ru/ articles/decision-trees.html.

Random forest. URL: https://en.wikipedia.org/wiki/Random_forest.

Confusion matrix. URL: https://scikit-learn.org/stable/auto_examples/model_selection/ plot_confusion_matrix.html.

##submission.downloads##

Опубліковано

2021-07-02

Як цитувати

Базилевич , В. ., & Прибитько , М. (2021). СИСТЕМА ВИЯВЛЕННЯ ФЕЙКОВИХ НОВИН ЗА ДОПОМОГОЮ DATA SCIENCE. Технічні науки та технології, (4(22), 91–95. https://doi.org/10.25140/2411-5363-2020-4(22)-91-95

Номер

Розділ

ІНФОРМАЦІЙНО-КОМП’ЮТЕРНІ ТЕХНОЛОГІЇ