Порівняльний аналіз алгоритмів машинного навчання для систем прогнозування серцево-судинних захворювань

Автор(и)

  • Артем Волокита Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Ukraine http://orcid.org/0000-0001-9069-5544
  • Богдан Герега Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Ukraine

DOI:

https://doi.org/10.25140/2411-5363-2022-4(30)-130-139

Ключові слова:

машинне навчання; серцево-судинні захворювання; модель прогнозування; алгоритм; класифіка- ція; регресія; набір даних; атрибут

Анотація

Серцево-судиннi захворювання щорiчно вбивають близько 20,5 мiльйонiв людей. Раннє виявлення захворювання може допомогти людям змiнити свiй спосiб життя та забезпечити належне медичне лiкування. У роботi представленi рiзнi атрибути, пов’язанi з хворобами серця, та модель на основi таких алгоритмiв навчання: Logistic Regression, K-nearest neighbors, Support Vector Machine, Decision Tree Classifier, Random Forest Classifier та XGBoost Classifier.
Модель використовує набiр даних iз Клiвлендської бази даних UCI для пацiєнтiв iз серцевими захворюваннями. Набiр даних мiстить 303 екземпляри та 76 атрибутiв. З цих 76 атрибутiв лише 14 атрибутiв розглядаються для тестування, що важливо для обґрунтування продуктивностi рiзних алгоритмiв. Результати показують, що найвищий бал точностi досягається з алгоритмом Support Vector Machine. Ця дослідницька робота має на метi продемонструвати ймовiрнiсть розвитку серцевих захворювань у пацiєнтiв використовуючи рiзнi алгоритми машинного навчання.

Біографії авторів

Артем Волокита, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

кандидат технічних наук, доцент, кафедра обчислювальної техніки

Богдан Герега, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

студент 6-го курсу факультету ІОТ

Посилання

World Health Organization // Cardiovascular diseases. – World Health Organization. 2022 [Electronic resource]. – Accessed mode: https://www.who.int/health-topics/cardiovascular-diseases/#tab=tab_1.

Ansari M. F. A prediction of heart disease using machine learning algorithms / Ansari M. F., Alankar B., Kaur H. // International conference on image processing and capsule networks. – 2020. – Рp. 497-504.

Ramya Perumal. Early Prediction of Coronary Heart Disease from Cleveland Dataset using Machine Learning Techniques [Electronic resource] / Ramya Perumal, Kaladevi AC. // International Journal of Advanced Science and Technology. – 2020. – Vol. 29(06). – Pp. 4225-4234. – Accessed mode: http://sersc.org/journals/index.php/IJAST/article/view/16428.

Latha C. B. C. Improving the accuracy of prediction of heart disease risk based on ensemble classification techniques / Latha C. B. C., Jeeva S. C. // Informatics in Medicine Unlocked. – 2019. – Vol. 16. – Atr. 100203.

Ananey-Obiri D. Predicting the presence of heart diseases using comparative data mining and machine learning algorithms / Ananey-Obiri D., Sarku E. // International Journal of Computer Applications. – 2020. – Vol. 176(11). – Рр. 17-21.

Kumar N. K. Analysis and prediction of cardio vascular disease using machine learning classifiers / Kumar N. K., Sindhu G. S., Prashanthi D. K., Sulthana A. S. // 2020 6th International Conference on Advanced Computing and Communication Systems (ICACCS). IEEE. – 2020, March. – Рp. 15-21.

UCI Machine Learning Repository [Electronic resource] / Janosi A., Steinbrunn W., Pfisterer M., Detrano R. – 1988.– Accessed mode: https://archive-beta.ics.uci.edu/ml/datasets/heart+disease.

Maini E. Machine learning–based heart disease prediction system for Indian population: An exploratory study done in South India / Maini E., Venkateswarlu B., Maini B., Marwaha D. // Medical Journal Armed Forces India. – 2021. – Vol. 77(3). – Рр. 302-311.

A comprehensive investigation and comparison of machine learning techniques in the domain of heart disease / Pouriyeh S., Vahid S., Sannino G., De Pietro G., Arabnia H., Gutierrez J. // 2017 IEEE symposium on computers and communications (ISCC). – 2017, July. – Рp. 204-207.

Support vector machine classification of microarray data / Mukherjee S., Tamayo P. A. S. D., Slonim D., Verri A., Golub T., Mesirov J., Poggio T. // AI Memo. – 1677, Massachusetts Institute of Technology, 1999.

Priyam A. Comparative analysis of decision tree classification algorithms / Priyam A., Abhijeeta G. R., Rathee A., Srivastava S. // International Journal of current engineering and technology. – 2013. – Vol. 3(2). – Рр. 334-337.

Cardiovascular risk prediction method based on CFS subset evaluation and random forest classification framework / Xu S., Zhang Z., Wang D., Hu J., Duan X., Zhu T. // 2017 IEEE 2nd International Conference on Big Data Analysis (ICBDA). – 2017, March. – Рp. 228-232.

Chen T. Xgboost: A scalable tree boosting system / Chen T., Guestrin C. // Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining. – 2016, August. – Рp. 785-794.

Wolpert D. H. No free lunch theorems for optimization / Wolpert D. H., Macready W. G. // IEEE transactions on evolutionary computation. – 1997. – Vol. 1(1). – Рр. 67-82.

##submission.downloads##

Опубліковано

2023-03-01

Як цитувати

Волокита, А. ., & Герега, Б. . (2023). Порівняльний аналіз алгоритмів машинного навчання для систем прогнозування серцево-судинних захворювань. Технічні науки та технології, (4 (30), 130–139. https://doi.org/10.25140/2411-5363-2022-4(30)-130-139

Номер

Розділ

ІНФОРМАЦІЙНО-КОМП’ЮТЕРНІ ТЕХНОЛОГІЇ