ПОБУДОВА СЛОВНИКА ПРЕДМЕТНОЇ ОБЛАСТІ НА ОСНОВІ АВТОМАТИЗОВАНОГО АНАЛІЗУ ТЕКСТІВ УКРАЇНСЬКОЮ МОВОЮ

Автор:

Кунгурцев Олексій Борисович, Одеський національний політехнічний університет, м. Одеса, Україна

Ковальчук Сергій Вікторович, Одеський національний політехнічний університет, м. Одеса, Україна

Поточняк Яна Володимирівна, Одеський національний політехнічний університет, м. Одеса, Україна

Широкоступ Максим Віталійович , Одеський національний політехнічний університет, м. Одеса, Україна

Мова статті: українська

Анотація:

Актуальність теми дослідження. На сьогоднішній день інформаційні системи все ширше використовуються в різних сферах діяльності. Відповідно до цього збільшується кількість користувачів, які хочуть отримати доступ до інформації, яка зберігається в інформаційних системах.

Постановка проблеми. Використання шаблонних запитів до реляційної бази даних не є повноцінним, оскільки дані шаблони не можуть врахувати всі бажання користувачів. Найкращим варіантом для цього є природня мова в інтерфейсному представленні.

Аналіз останніх досліджень і публікацій. В останніх дослідженнях методів побудови словника предметної області пропонується знаходити ключові слова за допомогою стеммера Портера.На підставі аналізу загальних тверджень наукових робіт, текст характеризувався тільки кількістю входжень ключових слів в тексті.

Виділення недосліджених частин загальної проблеми. Незважаючи на той факт, що вже зроблено чимало досліджень по даній тематиці, вони не розв’язують повністю задачу побудови словника предметної області.

Постановка завдання. Метою статті є розробка методу побудови словника предметної області на основі автоматизованого аналізу текстів українською мовою.

Викладення основного матеріалу. Розроблено метод побудови словника предметної області шляхом аналізу текстів українською мовою. Розроблені алгоритми для автоматизованого аналізу текстів українською мовою. Представлено алгоритми виділення речень з урахуванням переліків в тексті. Запропоновано метод опису таблиць термінів та процес формування таблиці термінів. Описано процес виділення термінів та занесення їх до сформованої таблиці термінів.

Висновки відповідно до статті. Розроблений метод побудови словника предметної області на основі автоматизованого аналізу тексту дозволяє зменшити час на побудову словника. Дослідження показали, що час створення словника скоротився орієнтовно в 5 раз в порівнянні з створенням словника вручну.

Ключові слова:

інформаційна система, синонім, термін, синтаксичний аналізатор, предметна область

Список використаних джерел:

  1. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика / Е. И. Большакова, Э. С. Клышинский, Д. В. Ландэ, А. А. Носков, О. В. Пескова, Е. В. Ягунова. – М. : МИЭМ, 2011. – 272 с.

  2. Bates, M. Models of natural language understanding. Proceedings of the National Academy of Sciences of the United States of America, Vol. 92, No. 22 (1995), pp. 9977–9982.

  3. Кунгурцев О. Б. Формування шаблонів запитів до реляційної бази даних з використанням об’єктного словника / О. Б. Кунгурцев, І. В. Барикіна, О. А. Завалін // Наукові праці ОНХАТ. – 2004. – Вип. 27.– С. 233–236.

  4. Акимов О. М. Интеллектуализация интерфейса базы данных / О. М. Акимов, В. А. Шапцев // Известия Томского политехнического университета. – 2009. – Т. 314, № 5. – С. 137–139.

  5. Steven Bird, Ewan Klein, Edward Loper. Natural Language Processing with Python. (2009), Published by O’Reilly Media. – 481 р.

  6. Методологии моделирования предметной области [Электронный ресурс]. – Режим доступа : http://www.intuit.ru/studies/courses/2195/55/lecture/1628.

  7. Рувинская В. М. Словарь предметной области для разработки экспертной системы / В. М. Рувинская, А. С. Тройнина, Д. А. Силяев // Труды Международной научно технической конференции «Информационные технологи в металлургии и машиностроении» (Днепропетровск, 24–26.03.2015). – Днепропетровск, 2015. – С. 44.

  8. Chernega K. S. Decision support System for Automated Medical Diagnostics / Chernega K.S., Tymchenko B.I., Komleva N.O. // Electrotechnic and Computer Systems. – Kiev: Science and Technology, 2016. – No. 23 (99). – P. 65–72.

  9. Ruvinska V. Rules of Expert System for Safety Monitoring: Checking on Complete­ness and Consistency / V. Ruvinska, A. Troynina, E. Berkovich, A. Bilovzorov // Праці Одеського політехнічного університету. – 2015. – Вип. 2 (46). – С. 103–110.

  10. Любченко В. В. О некоторых свойствах моделей предметных областей информационных систем / В. В. Любченко // Труды 14-й Международной научно-практической конференции «Современные информационные и электронные технологии» (27–31 мая 2013 г., Одесса). – Одесса, 2013. – Т. 1. – С. 81–82.

  11. Кунгурцев А. Б. Интерфейс для общения пользователей с информационными системами на естественном языке / А. Б. Кунгурцев, Я. В. Поточняк // Электротехнические и компьютерные системы. – 2014. – № 14 (90). – C. 74–81.

  12. Необходимость выделения ключевых слов для свёртывания текста [Электронный ресурс]. – Режим доступа : http://www.scienceforum.ru/2014/476/70.

  13. LanguageTool [Електронний ресурс]. – Режим доступу : https://languagetool.org/uk/.

  14. Бісікало О. В. Виявлення ключових слів на основі методу контент-моніторингу україномовних текстів / О. В. Бісікало, В. А. Висоцька // Радіоелектроніка, інформатика, управління. – 2016. – № 1 (36). – С. 74–83.

  15. Ключевые слова в тексте – как правильно употреблять? [Электронный ресурс]. – Режим доступа : http://dimokfm.ru/klyuchevyie-slova/.

  16. Информационные технологии управления. Методы поиска текстовой информации [Электронный ресурс]. – Режим доступа : https://refdb.ru/look/2575304-p10.html.

  17. Индексы. Теоретические основы [Электронный ресурс]. – Режим доступа : http://www.sql.ru/articles/mssql/03013101indexes.shtml.

  18. Алгоритм Бойера – Мура [Електронний ресурс]. – Режим доступу : http://www.algolib.narod.ru/Search/BoyerMur.html.

  19. Кунгурцев А. Б. Метод автоматизированного построения толкового словаря предметной области / А. Б. Кунгурцев, Я. В. Поточняк, Д. А. Силяев // Технологический аудит и резервы производства. – 2015. – Вип. 2, № 2 (22). – С. 58–63.

  20. Учет межфразовых связей при автоматизированном построении толкового словаря предметной области / А. Б. Кунгурцев, А. И. Гаврилова, А. С. Леонгард, Я. В. Поточняк // Информатика и математические методы в моделировании. – 2016. – № 2. – С. 173–183.

Завантажити