论文链接:Deep Learning Stock Volatility with Google Domestic Trends
课件链接:mhy-Deep Learning Stock Volatility with Google Domestic Trends_pptx
概述
这篇文章核心目标是,通过长短期记忆循环神经网络(LSTM)预测股市波动率,其中输入数据依赖于Google Domestic Trend这样一个搜索量指数。
Google Domestic Trend里面提取了Google中每一个关键词相对于时间的搜索量变化,当然,如果说联想到国内数据,百度指数提供了相似的操作
首先,选取若干具有代表性的词语,如bankruptcy,auto trading, travel等,将其热度指数同股价一起输入LSTM,来预测波动率。
波动率的计算公式比较有意思,
其中 ,
,
.
即该公式仅仅依赖于四个价格,他和MACD用不同的算法导出了几乎相似的指数,这也是一个非常美妙的地方。
本文在预测之外,也同时尝试了预测价格变化量,即
只是一个label不同的问题,就不详述了。
技巧1:平滑
细粒度的数据存在较大的杂音,故希望通过增大粒度来去除杂音。这里增大粒度就存在值得合并问题
令为平滑的时间区间.
收益率由于已经取过log了,所以可以直接求和
搜索量合并是一个算数平均的过程
波动率是一个几何平均过程
技巧2:归一
对于任意序列A,都有归一化公式
而对于时序A,可以加一个滑动窗口时长K进行仿照
这样的归一方法,既保证了短期趋势的完整复制,还可以避免长期趋势导致的值不平均。
结论
如其他论文一样,这里还是借助其他模型进行比较,结论是:比其他模型效果更好。不过恐怕也是五十步笑百步了吧~
就这个问题而言,如果预测,可能会比较有实用价值,但是预测效果会很差,毕竟确实想不出来涨跌会和这东西有什么关系。但是如果是预测
,虽然效果不错,但是实用价值又不太高。总之感觉很鸡肋啊。