1. 研究背景及意义

选取全球12个股指数据、技术指标数据以及美国新闻文本数据,提取时间序列特征、情感特征和语义特征,使用机器学习模型和神经网络模型进行中间融合和预测,发现融入跨市场技术指标数据以及新闻情感特征可以提升预测效果,相比传统机器学习模型,LSTM模型表现更优,为投资决策和市场监管提供了重要参考。

2. 研究方法

选取了9个主要股指和3个大宗商品数据,提取了技术指标;获取了赫芬顿邮报新闻文本数据,提取了情感特征和语义特征。考虑股市交易时差,提取滞后特征;使用中间融合方式将跨市场数据和新闻文本特征进行融合。最后,采用机器学习模型和LSTM等神经网络对美国SP500指数进行预测,分析了不同数据源和模型对预测结果的影响。

3. 研究结论

融入跨市场股指以及商品数据后,6 种模型对 SP500 指数预测的准确率均有了一定的提升。
所有模型在融入了各指数对应的技术指标后,预测效果均有了大幅提升。
在跨市场股指预测中,融入新闻文本可以提升预测效果,同时,新闻的情感和自身的语义都会影响股市的预测。
实验结果显示,跨市场数据提升预测效果有限,加入技术指标后效果显著提升。新闻情感特征对预测效果提升更大。在各模型中LSTM的预测效果最好,准确率达77.36%。

4. 改进方向

第一,可以选用不同国家的指数作为预测对象,验证跨市场数据的有效性。
第二,可以加入更多种类的技术指标,探究哪种指标提升效果最大。
第三,可以尝试机器学习或深度学习的方法提取文本情感特征,继续探究文本特征的影响。