СИСТЕМА ВИЯВЛЕННЯ ФЕЙКОВИХ НОВИН ЗА ДОПОМОГОЮ DATA SCIENCE
DOI:
https://doi.org/10.25140/2411-5363-2020-4(22)-91-95%20Ключові слова:
фейк; фейкова новина; правдива новина; класифікаторАнотація
Актуальність теми дослідження. Великий об’єм інформації, що став традиційним для інформаційного суспільства, створює нові виклики для людства. На заміну проблемі складного доступу до інформації, що була актуальна раніше, приходить нова проблема: структуризації та фільтрування інформації. Серед загального потоку інформаційного шуму актуальним стає питання виокремлення правди. У цьому контексті важливим постає питання не лише розвитку критичного мислення, але й розробки технічних засобів виявлення фейків.
Постановка проблеми. Ця робота фокусується на понятті розробки системи виявлення фейкових новин, аналізі існуючих систем та їхніх принципів роботи, принципів побудови їхніх алгоритмів та особливостях їх використання.
Аналіз останніх досліджень та публікацій. Були розглянуті останні публікації у відкритому доступі, статистичні дані, звіти корпорацій.
Виділення недосліджених частин загальної проблеми. Аналіз файлу буде виконаний за допомогою трьох методів/класифікаторів і без використання PassiveAgressive класифікатора. Обчислення та виведення результатів виконується за допомогою побудови матриць помилок та розрахування точності.
Постановка задачі. Основною метою роботи є створення на основі розглянутих матеріалів систему виявлення фейкових новин та досягти найбільш можливої точності.
Виклад основного матеріалу. Обрано вхідні дані для дослідження, проведена їх підготовка та аналіз. Проведено дослідження даних за допомогою методів/класифікаторів Логістичної регресії, Дерева рішень та Рандомного лісу. Обчислена точність виявлення фейкових новин.
Висновки відповідно до статті. Запропонована система дозволяє класифікувати новини як «фейкові» або «правдиві» з точністю 98-99 %.
Посилання
Mishevski F. Detecting Fake News With Python And Machine Learning. URL: https://ichi.pro/ru/ obnaruzenie-fejkovyh-novostej-s-pomos-u-python-i-masinnogo-obucenia-272146875193862.
Detecting Fake News with Python. URL: https://data-flair.training/blogs/advanced-python- project-detecting-fake-news.
Claire Wardle Fake news. It’s complicated. URL: https://firstdraftnews.org/latest/fake-news- complicated.
Fake and real news dataset. URL: https://www.kaggle.com/clmentbisaillon/fake-and-real- news-dataset.
TF-IDF. URL: https://en.wikipedia.org/wiki/Tf%E2%80%93idf.
Logistic regression. URL: https://en.wikipedia.org/wiki/Logistic_regression
Saishruthi Swaminathan Logistic Regression – Detailed Overview. URL: https://towardsdatascience.com/logistic-regression-detailed-overview-46c4da4303bc.
Дерево решений (Decision Trees) – Detailed Overview. URL: https://wiki.loginom.ru/ articles/decision-trees.html.
Random forest. URL: https://en.wikipedia.org/wiki/Random_forest.
Confusion matrix. URL: https://scikit-learn.org/stable/auto_examples/model_selection/ plot_confusion_matrix.html.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial 4.0 International License.