На фондовом рынке ежедневно оборачиваются миллиарды рублей, перемещающиеся между различными игроками рынка: брокерами, биржами, инвестиционными фондами, трейдинговыми агентствами и частными инвесторами. Конечной целью участников рынка является извлечение прибыли от покупки или продажи активов. Для максимизации прибыли и совершения наиболее выгодных сделок участниками торгов проводится тщательный анализ текущей ситуации на рынке и прогноз будущих значений котировок. Такой анализ проводится не только компаниями или частными лицами, торгующими на бирже, но и многочисленными консалтинговыми агентствами, продающими отчеты о ситуации на мировом фондовом рынке и его отдельных секторах.
Для прогнозирования котировок используются различные методы. Основными способами анализа рынка исторически являются технический и фундаментальный анализ [5]. В связи с развитием информационных технологий и повышением доступности вычислительных мощностей как для представителей бизнеса, так и для научных сотрудников, растет уровень внедрения технологий машинного обучения в аналитические и прогностические процессы. Машинное обучение является отдельным направлением технологии искусственного интеллекта и включает в себя алгоритмы, имитирующие поведение людей при обучении и постепенно повышающие точность собственного обучения [1].
Прогнозирование фондового рынка не является простой задачей из-за его нелинейной, динамической, стохастической и ненадежной природы. Прогнозирование котировок акций является предметом изучения ученых многих дисциплин, таки как математика, экономика и информатика. С развитием информационных технологий исследователи смогли доказать, что значения котировок на фондовом рынке можно в определенной степени предсказать, при это используются разные технологии и наборы факторов, влияющих на будущее значение цены. Машинное обучение при прогнозировании цен на акции используется для выявления закономерностей в данных [9]. Как правило, на фондовых рынках генерируется огромное количество структурированных и неструктурированных разнородных данных, которые подаются на анализ и обучение нейронной сети. В рамках процесса обучения алгоритм идентифицирует шаблоны и генерирует выходные данные. Наиболее известными и подходящими нейронными сетями для прогнозирования временных рядов являются сети Long Short-Term Memory (LSTM) [2].
LSTM является разновидностью рекуррентной нейронной сети (RNN). Модель RNN может повторно использовать весовые параметры нейронов и учитывать информацию о прошлых данных для прогнозирования. LSTM сеть была предложена Хохрайтером и Шмидхубером в 1995 году [3] и доработана Грейвсом в 2004 году [10]. Двунаправленная LSTM является улучшенной архитектурой обычной сети долгой краткосрочной памяти и характеризуется тем, что для обучения сети используются как входные, так и выходные данные, что позволяет сети анализировать информацию с двух направлений. Применение архитектуры BiLSTM зависит от входных данных, к которым должна быть адаптирована обучающая модель [4]. В рамках исследования в качестве данных выступают значения котировок акций компании JD, предварительно собранные и обработанные в подходящий для обучения нейронной сети формат. Attention слой является слоем, внутри которого имитируется человеческий механизм внимания, позволяющий определить разное значение факторам, влияющим на конечный результат [7]. Использование слоя внимания позволяет ранжировать факторы, влияющие на прогноз, и таким образом делать более точный прогноз, учитывающий различные веса прошлых событий.
В качестве данных для обучения модели используются максимальные и минимальные дневные значения котировок акций JD.com. JD.com – это ведущая китайская платформа электронной коммерции, предоставляющая более 580 миллионам активных пользователей прямой доступ к широкому ассортименту товаров. Компания предоставляет широкий выбор товаров всех категорий и оказывает услуги по их доставке [8]. У компании также есть международная платформа JD Worldwide, предоставляющая возможность брендам со всего мира продавать товары. Значения котировок собираются с помощью использования языка программирования Python и библиотеки requests. Собранные данные обрабатываются и приводятся к единому формату с использованием python-библиотеки pandas. Пример таблицы с данными отражен в таблице 1.
Таблица 1 – Пример данных об изменении котировок акций JD.com
Итоговый датасет содержит информацию о динамике дневных котировок акций компании JD.com за период с 22.05.2014 по 09.10.2023, что составляет 2362 торговых дня. Так как необходимо прогнозировать дневной коридор колебания котировок, нужно определить будущие значения максимума и минимума, для этого будут обучены две модели: первая на основе значений дневных максимумов и вторая на основе значений дневных минимумов. Для обучения моделей будет использовано 92% исходного датасета, а на оставшихся 8% будут проведены. В рамках исследования нейронные сети построены и обучены с использованием языка программирования python и библиотеки tensorflow, специально разработанной для быстрого и удобного проектирования и обучения нейронных сетей. Архитектура сети включает в себя 4 слоя BILSTM и слой внимания, количество эпох составляет 100, а размер батча – 64. Для прогноза одного будущего значения используются значения десяти предыдущих значений или данные за две предыдущие торговые недели. Общая структура спроектированной нейронной сети отражена на рисунке 1.
Рисунок 1 – Общая схема построенной BiLSTM-Attention сети
После обучения моделей были проведены их тесты на заранее подготовленном тестовом датасете, который включает в себя 8% исходного набора данных или сведения о 189 торговых днях. Для начала необходимо отдельно оценить качество прогноза каждой модели. Данные прогноза модели, обученной на значениях дневных максимумов отражены на рисунке 2.
Рисунок 2 – Сравнение фактических и прогнозных значений дневных максимумов
При визуальном анализе рисунка 2 видно, что прогнозные значения находятся достаточно близко к фактическим и повторяют направление движения котировок. Значение корня среднеквадратической ошибки (RMSE) составляет 1,42, что говорит о высокой точности модели, так как значение близко к нулю. Таким образом, обученная модель может быть использована для определения ориентиров по максимальному значению котировки на прогнозируемый день. Для определения пределов колебаний цены внутри дня, необходимо также спрогнозировать и минимальные значения. Данные прогноза модели, обученной на значениях дневных минимумов отражены на рисунке 3.
Рисунок 3 – Сравнение фактических и прогнозных значений дневных минимумов
Анализируя данные, отраженные на рисунке 3, можно отметить приближенность прогнозных значений к фактическим, как и в случае с моделью, прогнозирующей максимальные дневные значения. Значение RMSE модели составляет 1.34 и говорит о высокой точности модели и возможности ее использования в качестве аналитического инструмента, прогнозирующего минимальное дневное значение котировок акций. Соединение двух описанных выше моделей позволяет осуществлять прогноз дневного коридора колебания цен компании JD.com. В результате первая модель будет прогнозировать максимальные дневные значения, тем самым обозначая верхнюю границу котировок, а вторая модель будет прогнозировать минимальные дневные значения, тем самым обозначая нижнюю границу котировок, а пространство между двумя построенными линиями будет обозначать возможный коридор колебания котировок. Спрогнозированный ценовой коридор отражен на рисунке 4.
Рисунок 4 – Спрогнозированный моделями ценовой коридор
Необходимо также отметить, что спрогнозированный ценовой коридор может быть не только индикатором возможных значений котировок, но и может показывать на изменения в тренде движения акций:
1) если значения границ ценового коридора вместе идут вверх или вниз, то на рынке стоит ожидать бычьего или медвежьего тренда соответственно;
2) если значения границ ценового коридора сужаются, то на рынке формируется потенциальный сигнал к формированию зоны накопления;
3) если значения границ ценового коридора остается равным предыдущим границам, то на рынке потенциально может формироваться боковик, во время которого котировки движутся внутри одних и тех же границ;
4) если значения границ ценового коридора значительно расширяются в обе стороны, то такая ситуация может сигнализировать о ситуации на рынке, когда трейдеры сомневаются, в каком направлении пойдет цена и акции становятся сильно волатильными.
Использование различных нейронных сетей в качестве инструмента предиктивной аналитики становится неотъемлемой частью деятельности аналитических отделов компаний, связанных с биржевой торговлей и анализом фондовых рынков [6]. Нейронные сети могут быть обучены для прогнозирования котировок на разных таймфреймах, а также для прогнозирования котировок на разные временные диапазоны. В настоящее время нет четко выделенной нейронной сети, которая была бы однозначно лучше других при прогнозировании временных рядов, поэтому целесообразно использовать несколько нейронных сетей в качестве индикаторов движения рынка. В таком случае в качестве итогового прогноза можно использовать вердикт, вынесенный большинством моделей, либо назначить вердиктам каждой модели собственные веса, определенные экспериментальным путем.
Разработанная в рамках исследования нейронная сеть показывает хорошие результаты как при визуальном сравнении прогнозных значений и фактических, так и при расчете показателя RMSE. Для использования модели и ее аналогов для реальной торговли на бирже, необходимо провести ряд дополнительных экспериментов по подбору как минимум основных параметров сети: оптимального количества слоев в модели, количества эпох и размера батчей. Нейронные сети все глубже проникают в различные сферы жизни человечества и привлекают все большие объемы инвестиций, что в свою очередь может привести к появлению усовершенствованных и более точных нейронных сетей.
Список литературы
- Zhang J., Ye L., Lai Y. Stock price prediction using CNN-BiLSTM-Attention model // Mathematics. – 2023. – №11. – Pp. 1–20.
- Yu S., Yang S., Yoon S. The development and validation of a lightweight automated stock trading system using deep learning models: employing technical analysis methods // Systems. – 2023. – №11. – Pp. 1–17.
- Zhang X., Ma Y., Wang M. An attention-based Logistic-CNN-BiLSTM hybrid neural network for credit risk prediction of listed real estate enterprises // Willey Online Library. – 2023. – №1. – Pp. 470–481.
- Pardeshi K., Gill S. Stock market price prediction: a hybrid LSTM and sequential self-attention based approach // Arxiv. – 2023. – №1. – Pp. 1–13.
- Li Z. Research on stock prediction based on bidirectional long short term memory neural network model based on attention mechanism optimization // Highlights in business, economics and management. – 2023. – №10. – Pp. 283–290.
- Peng P., Chen Y., Lin W. Attention-based CNN-LSTM for high-frequency multiple cryptocurrency trend prediction // Expert systems with applications. – 2023. – №237. – Pp. 250–264.
- Li H., Peng Q., Mou X. Abstractive financial news summarization via transformer-BiLSTM encoder and graph attention-based decoder // IEEE. – 2023. – №31. – Pp. 3190–3205.
- JD.com // Официальный сайт JD.com Inc. [Электронный ресурс]. – URL: https://corporate.jd.com/ourBusiness.
- Kaim A., Singh S. Ensemble CNN attention-based BiLSTM deep learning architecture for multivariate cloud workload prediction // IDCN `23: Proceedings of the 24th International Conference on Distributed Computing and Networking. – 2023. – №1. – Pp. 342–348.
- Guan B., Yuan X., Li J. Stock prediction via time series clustering and image feature extraction // IEEE. – 2023. – Pp. 32–37.