Питання складності процедури побудови схеми алгоритмічного дерева класифікації

Автор(и)

DOI:

https://doi.org/10.25140/2411-5363-2020-3(21)-142-153

Ключові слова:

задачі розпізнавання, алгоритмічне дерево, схема розпізнавання, складність дерева класифікації, дискретна ознака, узагальнена ознака, алгоритм класифікації

Анотація

Актуальність теми дослідження. На сучасному етапі розвитку інформаційних систем та технологій, які базуються на математичних моделях теорії штучного інтелекту (методах та схемах алгоритмічних дерев класифікації), виникає принципова проблема вузької спеціалізації наявних підходів та методів у соціально-економічних, екологічних та інших системах первинного аналізу та обробки великих масивів інформації. Задачі, які об’єднуються тематикою розпізнавання образів, дуже різноманітні та виникають у сучасному світі в усіх сферах економіки та соціального контенту діяльності людини, що приводить до необхідності побудови та дослідження математичних моделей відповідних систем. На сьогодні немає універсального підходу до їх розв’язання, запропоновано декілька до-
сить загальних теорій та підходів, що дозволяють вирішувати багато типів (класів) задач, але їх прикладні застосування відрізняються досить великою чутливістю до специфіки самої задачі або предметної області застосування. Представлена робота присвячена проблемі моделей логічних та алгоритмічних дерев класифікації (схем ЛДК/АДК), пропонує оцінку складності структур алгоритмічних дерев (моделей дерев класифікації), які складаються з незалежних та автономних алгоритмів класифікації і будуть являти собою певною мірою новий алгоритм розпізнавання (зрозуміло, що синтезований із відомих схем, алгоритмів та методів).
Постановка проблеми. Нині актуальні різні підходи до побудови систем розпізнавання у вигляді дерев класифікації (ЛДК/АДК), причому інтерес до методів розпізнавання, які використовують дерева класифікації, викликаний багатьма корисними властивостями, якими вони володіють. З одного боку, складність класу функцій розпізнавання у вигляді моделей дерев класифікації, при визначених умовах, не перевищують складності класу лінійних функцій роз-
пізнавання (простішого з відомих). З іншого – функції розпізнавання у вигляді дерев класифікації дозволяють виділити в процесі класифікації як причинно-наслідкові зв’язки (та однозначно врахувати їх у подальшому), так і фактори випадковості або невизначеності, тобто врахувати одночасно і функціональні, і стохастичні відношення між властивостями та поведінкою всієї системи. При цьому відомо, що процес класифікації нових, таких, що досі не зустрічалися, об’єктів світу багатьох тварин і людей (за винятком об’єктів, інформація про які передається генетичним
шляхом (наслідковим), а також в деяких інших випадках), відбувається за так званим логічним деревом рішень (у зв‘язку з нейромережевою концепцією). Зрозуміло, що доцільно не розробляти новий алгоритм, а запропонувати деяку концепцію раціонального використання вже накопиченого потенціалу алгоритмів та методів класифікації у вигляді моделей алгоритмічних дерев класифікації (структур АДК). Саме тому ця робота має намір хоча б частково подо-
лати ці обмеження та присвячена оцінці складності процедури побудови моделей алгоритмічних (логічних) дерев класифікації в галузі задач розпізнавання.
Аналіз останніх досліджень і публікацій. У дослідженні розглянуті останні наукові публікації у відкритому доступі, які присвячені загальній проблемі підходів, методів, алгоритмів та схем розпізнавання (моделей ЛДК/АДК) дискретних об’єктів (дискретних зображень) у задачах розпізнавання образів (теорії штучного інтелекту).

Виділення недосліджених частин загальної проблеми. Можливість простого та економного методу побудови моделі алгоритмічного дерева класифікації (або структур АДК/ЛДК) та оцінка складності такої процедури (моделі структури АДК/ЛДК) на основі початкових масивів дискретної інформації великого об’єму. 

Постановка завдання. Дослідження актуального питання складності загальної процедури побудови алгоритмічного дерева класифікації (моделі АДК) на основі концепції поетапної селекції наборів незалежних алгоритмів класифікації (можливих їх різнотипних множин та сполучень), яке для заданої початкової навчальної вибірки (масиву дискретної інформації) будує деревоподібну структуру (модель класифікації АДК), з набору алгоритмів оцінених на
кожному кроці схеми побудови моделі за даною початковою вибіркою.

Виклад основного матеріалу. Пропонується оцінка складності процедури побудови алгоритмічного дерева класифікації для довільного випадку (для умов слабкого та сильного розділення класів навчальної вибірки). Розв’язок цього питання має принциповий характер, щодо питань оцінки структурної складності моделей класифікації (у вигляді деревоподібних конструкцій), структур АДК дискретних об’єктів для широкого класу прикладних задач класифікації та розпізнавання в плані розробки перспективних схем та методів їх фінальної оптимізації (мінімізації) конструкції.
Це дослідження має актуальність не лише для конструкцій алгоритмічних дерев класифікації, але й дозволяє розширити саму схему оцінки складності і на загальний випадок структур логічних дерев класифікації.
Висновки відповідно до статті. Досліджені питання структурної складності конструкцій ЛДК/АДК, запропонована верхня оцінка складності для процедури побудови алгоритмічного дерева класифікації в умовах слабкого та сильного розділення класів початкової навчальної вибірки.

Біографія автора

Ігор Федорович Повхан, ДВНЗ «Ужгородський національний університет»

кандидат технічних наук, доцент, доцент

Посилання

Vtogoff P. E. Incremental Induction of Decision Trees. Machine Learning. 2009. № 4. P. 161–186.

Whitley D. An overview of evolutionary algorithms: practical issues and common pitfalls. Information and Software Technology. 2001. Vol. 43. № 14. P. 817–831.

Srikant R., Agrawal R. Mining generalized association rules. Future Generation Computer Systems. 1997. Vol. 13, № 2. P. 161–180.

Kotsiantis S. B. Supervised Machine Learning: A Review of Classification Techniques. Informatica. 2007. № 31, P. 249–268.

Deng H., Runger G., Tuv E. Bias of importance measures for multi-valued attributes and solutions. Proceedings of the 21st International Conference on Artificial Neural Networks (ICANN).

, P. 293–300.

Alpaydin E. Introduction to Machine Learning. London: The MIT Press, 2010. 400 p.

Суботин С. А. Построение деревьев решений для случая малоинформативных признаков. Radio Electronics, Computer Science, Control. 2019. № 1. P. 121–130.

Лавер В. О., Повхан І. Ф. Алгоритми побудови логічних дерев класифікації в задачах розпізнавання образів. Вчені записки Таврійського національного університету. Серія: технічні науки. 2019. Т. 30(69), № 4. С. 100–106.

Breiman L. L., Friedman J. H., Olshen R. A. Classification and regression trees. Boca Raton : Chapman and Hall/CRC, 1984. 368 p.

Dietterich T. G., Kong E. B. Machine learning bias, statistical bias and statistical variance of decision tree algorithms. Corvallis : Oregon State University, 1995. 14 p.

Subbotin S.A. Methods and characteristics of locality-preserving transformations in the problems of computational intelligence. Radio Electronics, Computer Science, Control. 2014. № 1. Pр. 120–128.

Povhan I. General scheme for constructing the most complex logical tree of classification in pattern recognition discrete objects. Збірник наукових праць «Електроніка та інформаційні

технології». 2019. Вип. 11. С. 112–117.

Василенко Ю. А., Василенко Е. Ю., Повхан І. Ф., Ващук Ф. Г. Концептуальна основа систем розпізнавання образів на основі метода розгалуженого вибору ознак European Journal of

Enterprise Technologies. 2004. № 7[1]. С. 13–15.

Василенко Ю. А., Повхан І. Ф., Ващук Ф. Г. Проблема оцінки складності логічних дерев розпізнавання та загальний метод їх оптимізації. European Journal of Enterprise Technologies.

№ 6/4(54). С. 24-28.

Hastie T. Tibshirani R., Friedman J. The Elements of Statistical Learning. Stanford, 2008. 768 p.

Mitchell T. Machine learning. New York : McGrawHill, 1997. 432 p.

Василенко Ю. А., Повхан І. Ф., Ващук Ф. Г. Загальна оцінка мінімізації деревоподібних логічних структур. European Journal of Enterprise Technologies. 2012. № 1/4(55). С. 29–33.

Василенко Ю. А., Василенко Е. Ю., Повхан І. Ф., Ковач М. Й., Нікарович О. Д. Мінімізація логічних деревоподібних структур в задачах розпізнавання образів. European Journal

of Enterprise Technologies. 2004. № 3[9]. С. 12–16.

Повхан І. Ф. Проблема функціональної оцінки навчальної вибірки в задачах розпізнавання дискретних об‘єктів. Вчені записки Таврійського національного університету.

Серія: технічні науки. 2018. Т. 29(68), № 6. С. 217–222.

Povhan I. Designing of recognition system of discrete objects. 2016 IEEE First International Conference on Data Stream Mining & Processing (DSMP) (Lviv, 2016, Ukraine). Lviv, 2016. Рр. 226–231.

Повхан І. Ф. Особливості синтезу узагальнених ознак при побудові систем розпізнавання за методом логічного дерева. Інформаційні технології та комп’ютерне моделювання ІТКМ-2019 : матеріали міжнародної науково-практичної конференції. Івано-Франківськ, 2019, С. 169–174.

Amit Y., Geman D., Wilder K. Joint induction of shape features and tree classifiers. IEEE Transactions on Pattern Analysis and Machine Intelligence. 1997. Vol. 19, № 11. P. 1300–1305.

Mingers J. An empirical comparison of pruning methods for decision tree induction. Machine learning. 1989. Vol. 4. № 2. P. 227–243.

##submission.downloads##

Опубліковано

2020-09-30

Як цитувати

Повхан, І. Ф. (2020). Питання складності процедури побудови схеми алгоритмічного дерева класифікації. Технічні науки та технології, (3(21), 142–153. https://doi.org/10.25140/2411-5363-2020-3(21)-142-153

Номер

Розділ

ІНФОРМАЦІЙНО-КОМП’ЮТЕРНІ ТЕХНОЛОГІЇ