СТРУКТУРА ІНФОРМАЦІЙНОЇ ТЕХНОЛОГІЇ ПОРІВНЯЛЬНОГО АНАЛІЗУ ТЕКСТОВИХ ДОКУМЕНТІВ

УДК:510.635:004.891(045)

Автор:

Вавіленкова Анастасія Ігорівна, Національний авіаційний університет (просп. Космонавта Комарова, 1, м. Київ, 03068, Україна)

Мова статті: українська

Анотація:

Здійснено аналіз наявних програмних продуктів пошуку плагіату серед електронних текстових документів, що дозволило виділити основні недоліки функціонування систем інтелектуального аналізу текстової інформації. На усунення цих недоліків спрямовані матеріали дослідження, де запропоновано структуру інформаційної технології порівняльного аналізу текстових документів. Її основними блоками є: інтерфейс користувача, компонента побудови логіко-лінгвістичної моделі природномовного текстового документа, лінгвістичний процесор для побудови лінгвістичних складових текстових документів, лінгвістичний процесор системи автоматизованого формування логіко-лінгвістичних моделей речень природної мови, компонента порівняння лінгвістичних складових, компонента порівняння семантико-синтаксичних складових. У статті аргументовано роль кожної із компонент у вилученні змістовної інформації з текстів, що порівнюються.

Ключові слова:

природна мова, логіко-лінгвістична модель, змістовний аналіз, лінгвістичний процесор, база знань

Список використаних джерел:

  1. Вавиленкова А. И. Основные принципы синтеза логико-лингвистических моделей / А. И. Вавиленкова // Кибернетика и системный анализ 2015.  Т. 51, № 5.  С. 176185.

  2. Методы и модели анализа данных: OLAP и Data Mining / А. А. Барсегян, М. С. Куприянов, В. В. Степаненко, И. И. Холод. – СПб. : БХВ-Петербрг, 2007. – 384 с.

  3. Онлайн-сервис проверки текста на уникальность, 2016 [Электронный ресурс]. – Режим доступа : www.text.ru.

  4. Advego Plagiatus – проверка уникальности текста, 2008–2016 [Электронный ресурс]. – Режим доступа : http://advego.ru/plagiatus/top/.

  5. Dan Jurafsky, Professor of Linguistics, Christopher Manning, Associate Professor of Computer Science Natural Language Processing, Stanford University, 2012, https://www.coursera.org/course/nlp.

  6. Словники України он-лайн, 2001–2014 [Електронний ресурс]. – Режим доступу : http://lcorp.ulif.org.ua/dictua/.

  7. Рассел С. Искусственный интеллект: современный подход (AIMA-2) / С. Рассел, П. Норвиг. – 2-е изд. – М. : Вильямс, 2015. – 1408 с.

  8. Кормен Т. Алгоритмы: построение и анализ / Т. Кормен, И. Чарльз, Лейзерсон, Рональд Л. Ривест, Клиффорд Штайн. – 3-е изд. – М. : Вильямс, 2013. – 1328 с.

  9. Белоусов К. И. Теория и методология полиструктурного синтеза текста: монография / К. И. Белоусов. – 2-е изд., стер. – М. : ФЛИНТА, 2012. – 214 с.

  10. Корпусна лінгвістика / [Широков В. А., Бугаков О. В., Грязнухіна Т. О. та ін.]. – К. : Довіра, 2005. – 471 с.

  11. Никитин М. В. Курс лингвистической семантики / М. В. Никитин. – СПб. : Из-во РГПУ им. Герцена, 2007. – 819 с.

  12. Марчук Ю. Н. Компьютерная лингвистика / Ю. Н. Марчук. – М. : АСТ: Восток –Запад, 2007. – 317 с.

  13. Вавіленкова А. І. Порівняльний аналіз речень природної мови за змістом / А. І. Вавіленкова /Математичні машини та системи. – 2015. – № 2. – С. 97–103.

  14. Vavilenkova A. I. The formal model of knowledge retrieval and processing / А. І. Vavilenkova /Black Sea Scientific journal of academic research. – 2014. – V. 16. – P. 115119.

Завантажити