Застосування мовних моделей великого масштабу для аналізу заголовків та формування розширених ознак у прогнозуванні фінансових ринків

Богдан  Пархоменко; Максим  Міщенко

doi:10.25140/2411-5363-2025-4(42)-245-252

Автор(и)

Богдан Пархоменко Національний університет «Чернігівська політехніка», Україна https://orcid.org/0009-0005-1279-4981
Максим Міщенко Національний університет «Чернігівська політехніка», Україна https://orcid.org/0000-0001-9769-9759

DOI:

https://doi.org/10.25140/2411-5363-2025-4(42)-245-252

Ключові слова:

мовні моделі; машинне навчання; фінансова аналітика; інформаційні моделі; прийняття рішень

Анотація

Стаття є оглядово-інформаційним викладом матеріалу щодо використання сучасних мовних моделей великого масштабу для аналізу заголовків фінансових новин та формування індексу інформаційного настрою з метою покращення якості фінансових даних і підвищення точності подальшого прогнозування показників. В умовах зростання обсягів неструктурованої інформації та підвищеної динамічності фінансових ринків традиційні методи аналізу дедалі частіше виявляються недостатньо ефективними, що зумовлює необхідність застосування інтелектуальних інформаційних моделей. Поєднання глибинного семантичного аналізу текстових даних із методами машинного навчання забезпечує можливість розширення наборів ознак, збагачення вхідних даних та підвищення інформативності фінансових часових рядів.

На основі отриманих числових оцінок тональності будується коефіцієнт інформаційного настрою, який агрегує вплив інформаційного фону за певний часовий період та інтегрується у фінансові ряди як додаткова характеристика. Такий підхід дозволяє враховувати не лише історичну цінову динаміку, а і якісні аспекти інформаційного середовища, що впливають на поведінку учасників ринку та формування ринкових очікувань. Запропонований індекс може використовуватися як допоміжний індикатор для аналізу трендових змін і підсилення прогнозних моделей.

Використання запропонованих методів сприяє виявленню прихованих залежностей між інформаційним фоном та ринковими показниками, що є особливо важливим в умовах високої волатильності та невизначеності фінансових систем. Окрему увагу приділено питанням інтерпретованості отриманих результатів та стабільності побудованого індексу при зміні параметрів агрегації. На основі проведеного аналізу визначаються основні напрями подальшого удосконалення підходів до формування інформаційних індексів, а також можливості практичного застосування отриманих результатів у діяльності фінансових аналітиків та при побудові моделей прогнозування фінансових часових рядів.

Посилання

Ouyang, M., Thomas, J. J., Tianzhou, Y., & Fiore, U. (2025). LLM-guided semantic feature selection for interpretable financial market forecasting in low-resource financial markets. Discover Computing.

Iacovides, G., Konstantinidis, T., Xu, M., & Mandic, D. (2024). FinLlama: LLM-based financial sentiment analysis for algorithmic trading. In Proceedings of the 5th ACM International Conference on AI in Finance (ICAIF’24).

FinSentLLM: Multi-LLM and structured semantic signals for enhanced financial sentiment forecasting. (2025). arXiv. https://arxiv.org/html/2509.12638v1

Kim, A., Muhn, M., & Nikolaev, V. (2024). Financial statement analysis with large language models. arXiv. https://arxiv.org/html/2407.17866v1.

Barbieri, F., Camacho-Collados, J., Neves, L., & Espinosa-Anke, L. (2020). TweetEval: Unified benchmark and comparative evaluation for tweet classification. arXiv. https://arxiv.org/abs/2010.12421

Aenlle, M. (2023). Daily Financial News for 6000+ Stocks [Dataset]. Kaggle. https://www.kaggle.com/datasets/miguelaenlle/massive-stock-news-analysis-db-for-nlpbacktests/data.

CardiffNLP. (2024). twitter-roberta-base-sentiment-latest [Model]. Hugging Face. https://huggingface.co/cardiffnlp/twitter-roberta-base-sentiment-latest.