因子研究之机器学习基础.第30讲
正文阅读
大家好,欢迎来到量化小学。
前面我们讲了因子研究的一些基本方法,包括线性回归、分组法等等。今天我们来谈一个有意思的话题,也是现在大家关注度非常高的一个领域——机器学习。
首先我们讲一讲,怎么样构建问题、以及在量化研究当中使用机器学习的一些要点,然后给大家介绍一些常用的基础方法。
机器学习的关键
首先我必须强调一点,机器学习并不是从石头缝里冒出来的,它是传统的统计研究方法的延伸。另外机器学习是非常强大的,但是也不必把它神化,它确实能够帮助我们更有效的提炼和利用数据中包含的信息,但是没有办法通过机器学习来凭空造出阿尔法。
我举一个例子,比如说我们可以把量化研究比喻成开采石油的过程,传统方法能够开采出一些油来,如果你掌握了页岩油的开采方法,你就可以采出更多的油。但如果这个地方根本就没有石油的话,你用什么样的方法也采不出来。
所以量化研究也是一样的,首先你要想明白你要研究什么样的问题,这个问题必须是可以被研究的,然后才谈得到用机器学习这样比较好的方法来使得研究效率提高,获取更多的阿尔法。
所以我们前面讲过几次了,选股策略通常就是通过一个时间截面的因子信息,对选股池的股票进行打分分类,或者来做收益预测。因此从数学的角度来说,我们可以把这种研究抽象成X到Y的一个映射关系。
X是什么?一般来说就是我们用来做预测的信息,通常也把它叫做因子。股票研究,我们可以有基本面因子、技术面因子、情绪因子、事件因子等等,前面都讲过不少了。
那么被预测的对象呢?你要研究什么呢?根据实际情况我们可以去直接预测收益率,也可以对选股池的股票当中进行排序,也可以来做分类。
例如说我们希望知道我们把涨得多的股票分成一类,把跌得多的股票分成一类,让计算机去研究一种算法,能够正确的对股票的未来收益进行分类。
那么当你成功的把这个问题构建好了,然后又准备好了……
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。