Метод побудови алгоритмічного дерева другого типу на основі апроксимації навчальної вибірки набором алгоритмів класифікації
Ключові слова:
задачі розпізнавання, дерева класифікації, алгоритмічне дерево, схема розпізнавання, дискретний об‘єкт, узагальнена ознакАнотація
Актуальність теми дослідження. Сучасні інформаційні технології, засновані на математичних моделях розпізнавання образів у вигляді ЛДК (логічних дерев класифікації), широко використовуються в соціально-економічних, екологічних та інших системах первинного аналізу та обробки великих масивів інформації, зрозуміло, що це пояснюється тим фактом, що такий підхід дозволяє усунути набір існуючих недоліки добре відомих класичних методів та досягти принципово новий результат. Робота присвячена тематиці моделей ЛДК, пропонує ефективний метод побудови моделей алгоритмічних дерев класифікації (АДК), які складаються з незалежних та автономних алгоритмів класифікації і будуть являти собою в певній мірі новий алгоритм розпізнавання (зрозуміло, що синтезований з відомих алгоритмів та методів).
Постановка проблеми. На сьогоднішній час відомі різні підходи та методи побудови моделей ЛДК (відомо більше ніж 3600 алгоритмів розпізнавання заснованих на різноманітних концепціях, які мають певні обмеження при їх використанні – точність, швидкодія, пам'ять, універсальність, надійність, тощо), проте всі вони, як правило, зводяться до побудови одного дерева класифікації за даними початкової навчальної вибірки. Зрозуміло, що доцільно не розробляти новий алгоритм, а запропонувати деяку концепцію раціонального використання вже накопиченого потенціалу алгоритмів та методів класифікації у вигляді моделей АДК, і саме тому дана робота має намір хоча би частково подолати ці обмеження та присвячена розробці методу побудови моделей алгоритмічних дерев класифікації.
Аналіз останніх літературних даних. Були розглянуті останні публікації у відкритому доступі, які присвячені проблематиці підходів, методів та алгоритмів логічних дерев класифікації (концепції дерев рішень) у задачах розпізнавання образів.
Виділення недосліджених частин загальної проблеми. Можливість ефективної та економної роботи запропонованого методу побудови алгоритмічного дерева класифікації на основі масивів навчальних вибірок великого об‘єму.
Постановка завдання. Розробка простого та якісного методу побудови моделей АДК для великих масивів початкових вибірок шляхом синтезу мінімальних форм дерев класифікації та розпізнавання, які забезпечують ефективну апроксимацію навчальної інформації набором автономних та незалежних алгоритмів класифікації.
Виклад основного матеріалу. Виявлення простого та ефективного механізму за допомогою якого можна було би будувати алгоритмічне дерево класифікації (модель АДК) за фіксованою початковою інформацією у вигляді початкової навчальної вибірки (НВ). Дане алгоритмічне дерево класифікації буде безпомилково розпізнавати всю навчальної вибірки за якою побудоване дерево класифікації мати мінімальну структуру (структурну складність) та складатися з автономних алгоритмів класифікації в якості вершин конструкції (атрибутів дерева).
Висновки відповідно до статті. Запропонований метод побудови моделей АДК другого типу дозволяє працювати з навчальними вибірками великого об‘єму та забезпечує високу швидкість та економність апаратних ресурсів в процесі генерації кінцевої схеми класифікації, будувати дерева класифікації з наперед заданою точністю.
Посилання
Srikant R., Agrawal R. Mining generalized association rules. Future Generation Computer Systems. 1997, Vol. 13, №2. P. 161–180.
Василенко Ю. А., Василенко Е. Ю., Повхан І. Ф., Ващук Ф. Г. Концептуальна основа систем розпізнавання образів на основі метода розгалуженого вибору ознак. European Journal of Enterprise Technologies. 2004. № 7[1]. С. 13–15.
Василенко Ю. А., Повхан І. Ф., Ващук Ф. Г. Проблема оцінки складності логічних дерев розпізнавання та загальний метод їх оптимізації. European Journal of Enterprise Technologies. 2011. № 6/4(54). С. 24–28.
Василенко Ю. А., Повхан І. Ф., Ващук Ф. Г. Загальна оцінка мінімізації деревоподібних логічних структур. European Journal of Enterprise Technologies. 2012. № 1/4(55). С. 29-33.
Povhan I. General scheme for constructing the most complex logical tree of classification in pattern recognition discrete objects. Електроніка та інформаційні технології. Львів, 2019. Вип. 11. С. 112–117.
Василенко Ю. А., Василенко Е. Ю., Повхан І. Ф., Ковач М. Й., Нікарович О. Д. Мінімізація логічних деревоподібних структур в задачах розпізнавання образів. European Journal of Enterprise Technologies. 2004. № 3[9]. С. 12–16.
Лавер В. О., Повхан І. Ф. Алгоритми побудови логічних дерев класифікації в задачах розпізнавання образів. Вчені записки Таврійського національного університету. Серія: технічні науки. 2019. Т. 30(69), № 4. С.100-106.
Vtogoff P. E. Incremental Induction of Decision Trees. Machine Learning. 2009. № 4. P. 161−186.
Повхан І. Ф. Проблема функціональної оцінки навчальної вибірки в задачах розпізнавання дискретних об‘єктів. Вчені записки Таврійського національного університету. Серія: технічні науки. 2018. Т. 29(68). № 6. С. 217-222.
Whitley D. An overview of evolutionary algorithms: practical issues and common pitfalls. Information and Software Technology. 2001. Vol. 43. №14. P. 817–831.
Povhan I. Designing of recognition system of discrete objects. 2016 IEEE First International Conference on Data Stream Mining & Processing (DSMP). Lviv, 2016, P. 226–231.
Kotsiantis S. B. Supervised Machine Learning: A Review of Classification Techniques. Informatica. 2007. № 31. P. 249–268.
Суботин С. А. Построение деревьев решений для случая малоинформативных признаков. Radio Electronics, Computer Science, Control. 2019. № 1. P. 121–130.
Deng H., Runger G., Tuv E. Bias of importance measures for multi-valued attributes and solutions. Proceedings of the 21st International Conference on Artificial Neural Networks (ICANN). 2011. P. 293–300.
Повхан І. Ф. Особливості синтезу узагальнених ознак при побудові систем розпізнавання за методом логічного дерева. Інформаційні технології та комп’ютерне моделювання ІТКМ-2019 : матеріали Міжнародної науково-практичної конференції. Івано-Франківськ, 2019. С. 169–174.
Повхан І. Ф. Особливості випадкових логічних дерев класифікації в задачах розпізнавання образів. Вчені записки Таврійського національного університету. Серія : технічні науки. 2019. Т. 30 (69), № 5. С. 152–161.
##submission.downloads##
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2020 Чернігівський національний технологічний університет, 2015
Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial 4.0 International License.