СТРУКТУРА ИНФОРМАЦИОННОЙ ТЕХНОЛОГИИ СРАВНИТЕЛЬНОГО АНАЛИЗА ТЕКСТОВЫХ ДОКУМЕНТОВ

Автор:

Вавиленкова Анастасия Игоревна, Национальный авиацилонный университет (просп. Космонавта Комарова, 1, г. Киев, 03068, Украина)

Язык статьи: украинский

Аннотация:

Осуществлен анализ существующих программных продуктов поиска плагиата среди электронных текстовых документов, что позволило выделить основные недостатки функционирования систем интеллектуального анализа текстовой информации. На устранение этих недостатков направлены материалы исследований, где предложено структуру информационной технологии сравнительного анализа текстовых документов. Ее основные блоки: интерфейс пользователя, компонента построения логико-лингвистической модели документа, написанного на естественном языке, лингвистический процессор для построения лингвистических составляющих текстовых документов, лингвистический процессор системы автоматизированного формирования логико-лингвистических моделей предложений естественного языка, компонента сравнения лингвистических составляющих, компонента сравнения семантико-синтаксических составляющих. В статье аргументирована роль каждой из компонент в извлечении содержания из текстов, которые сравниваются.

Ключевые слова:

естественный язык, логико-лингвистическая модель, содержательный анализ, лингвистический процессор, база знаний

Список использованных источников:

    1. Вавиленкова А. И. Основные принципы синтеза логико-лингвистических моделей / А. И. Вавиленкова // Кибернетика и системный анализ 2015.  Т. 51, № 5.  С. 176185.

    2. Методы и модели анализа данных: OLAP и Data Mining / А. А. Барсегян, М. С. Куприянов, В. В. Степаненко, И. И. Холод. – СПб. : БХВ-Петербрг, 2007. – 384 с.

    3. Онлайн-сервис проверки текста на уникальность, 2016 [Электронный ресурс]. – Режим доступа : www.text.ru.

    4. Advego Plagiatus – проверка уникальности текста, 2008–2016 [Электронный ресурс]. – Режим доступа : http://advego.ru/plagiatus/top/.

    5. Dan Jurafsky, Professor of Linguistics, Christopher Manning, Associate Professor of Computer Science Natural Language Processing, Stanford University, 2012, https://www.coursera.org/course/nlp.

    6. Словники України он-лайн, 2001–2014 [Електронний ресурс]. – Режим доступу : http://lcorp.ulif.org.ua/dictua/.

    7. Рассел С. Искусственный интеллект: современный подход (AIMA-2) / С. Рассел, П. Норвиг. – 2-е изд. – М. : Вильямс, 2015. – 1408 с.

    8. Кормен Т. Алгоритмы: построение и анализ / Т. Кормен, И. Чарльз, Лейзерсон, Рональд Л. Ривест, Клиффорд Штайн. – 3-е изд. – М. : Вильямс, 2013. – 1328 с.

    9. Белоусов К. И. Теория и методология полиструктурного синтеза текста: монография / К. И. Белоусов. – 2-е изд., стер. – М. : ФЛИНТА, 2012. – 214 с.

    10. Корпусна лінгвістика / [Широков В. А., Бугаков О. В., Грязнухіна Т. О. та ін.]. – К. : Довіра, 2005. – 471 с.

    11. Никитин М. В. Курс лингвистической семантики / М. В. Никитин. – СПб. : Из-во РГПУ им. Герцена, 2007. – 819 с.

    12. Марчук Ю. Н. Компьютерная лингвистика / Ю. Н. Марчук. – М. : АСТ: Восток –Запад, 2007. – 317 с.

    13. Вавіленкова А. І. Порівняльний аналіз речень природної мови за змістом / А. І. Вавіленкова /Математичні машини та системи. – 2015. – № 2. – С. 97–103.

    14. Vavilenkova A. I. The formal model of knowledge retrieval and processing / А. І. Vavilenkova /Black Sea Scientific journal of academic research. – 2014. – V. 16. – P. 115119.

Скачать