快速理解AI量化策略


(iQuant) #1

导语: 人工智能(Artificial Intelligence,简称AI)的应用领域主要包括机器学习、概率推理、机器人技术、计算机视觉和自然语言处理。开发AI量化策略就是采用人工智能的相关技术和算法构建模型来处理市场海量数据之间的复杂关系。


如上图所示,计算机通过训练历史数据构建模型对新数据进行预测类似于人脑学习归纳规律总结经验并对新问题进行判断的流程。

举个栗子,我们遇到一个任务:去瓜田判断一堆西瓜的好坏,并且需要在保证正确率的情况下独自完成。如果我们对此毫无经验,那我们应该如何完成这个任务呢?下面是具体流程:

  1. 首先我们应明确目标,就是判断出这堆西瓜的好坏,为了达到这个目标,我们应该先去找来一堆瓜去学习总结判断好坏的经验

  2. 接下来我们把找来的这些瓜分成两堆,其中第一堆瓜用来练手总结规律,为了确保我们总结的规律是正确的,我们用第二堆瓜来验证我们总结的规律。

  3. 针对第一堆瓜,我们首先根据观察和思考,挑选出一些可能影响瓜好坏瓜的属性也可以称为特征,例如颜色、大小、产地、纹理等。之后,我们不断观察每个瓜的这些特征属性并切瓜来验证好坏,通过不断总结归纳找到瓜的好坏与瓜的属性之间的关联,最后制定一套标准的判断模型,就是我们的经验。

  4. 之后,我们需要验证这个模型是满足我们预期要求的,需要在这套标准的指引下,根据第二堆瓜的颜色、大小、产地等属性来预测第二堆瓜的好坏。

  5. 最后,我们需要切瓜来验证我们的预测值是否与真实情况相符。

这一过程我们可以表示为流程图:

AI量化策略构建流程

人类可以进行独立判断所依赖的“经验”对于机器来说就是一条条数据,类比挑瓜过程,我们可以对AI量化策略流程进行分解:

  1. 明确我们模型的训练目标,类比于预测瓜的好坏这个任务。

AI量化策略的目标(Label):人为定义的模型预测目标,例如未来N日收益率、未来N日波动率、未来N日的收益率排序等统计量,平台AI量化策略默认使用股票收益率作为目标。

  1. 接着我们把历史数据按时间顺序切分为两部分,类比于分瓜任务中的两堆瓜。

第一部分的数据用来训练模型,称其为训练集;第二部分的数据用来验证模型效果,称其为验证集。

  1. 选择构建可能影响目标的特征,类比于瓜的产地、大小等属性,我们也称之为特征。

AI量化策略的特征(features):模型所需的输入数据,例如每日的换手率、市盈率、KDJ技术指标等可能影响我们目标值的统计量。

我们计算训练集数据所在时间阶段的每日目标值,比如按每日的未来N日收益率高低来定义股票的走势好坏等级,这个过程类比于分瓜问题中记录第一堆瓜的好坏,我们称这一过程为标注。

我们通过“好坏等级”对股票进行标注贴上标签,连同其所对应的特征值一起来构建训练模型,类比于大脑通过第一堆瓜的大小、颜色等特征数据对应切瓜验证其’“好坏”标签,总结出瓜的分类经验;

  1. 用验证集数据来检验训练前面构建好的模型,即检验模型根据验证集的特征数据预测出的目标值(股票走势好坏等级)是否准确。这步类比于鉴瓜任务中根据第一堆瓜总结的鉴瓜经验用第二堆西瓜的大小、颜色等特征数据来判断预测瓜的好坏。

  2. 将验证集的预测结果放入历史数据中检测,类比于鉴瓜过程中根据第二堆瓜预测出瓜的好坏最后进行切瓜验证。

因此,AI量化策略的构建过程也可以用流程图的方式表达如下:

image

认识了机器学习流程和AI量化策略流程,就能够理解BigQuant平台的BigStudio实验工作流。BigStudio实验工作流是AI量化策略在BigStudio上的可视化展示。一个典型的AI可视化量化策略流程图如下:

简单划分:

具体而言:

  • 策略流程图的左支是训练集特征数据(features)的抽取和训练集目标(label)的标注,标注结果和训练集特征数据通过合并和数据缺失值清洗处理,然后传给机器学习模型进行模型训练。

  • 策略流程图的右支是测试集特征数据的抽取,通过缺失值清洗处理,然后传给机器学习模型进行预测,这里机器学习模型采用StockRanker模型,是一个排序模型,预测的结果是每日的股票排名。

  • 这个排名列表即预测结果最后传给回测模块按一定的规则进行买卖模拟交易,进行检测。

这样我们就实现了一个AI量化策略,这个例子中我们使用了2010年到2014年的全市场各股票历史5日收益率、10日收益率排名等特征数据训练了一个排序模型(StockRanker),然后通过训练好的模型对2015年至2016年的全市场各股票5日收益率、10日收益率排名等特征数据对股票未来的5日收益率进行了排序预测,每日根据此排序预测买入排名靠前的股票并从每日持仓中卖出排名靠后的股票,得到的策略资金曲线如下图所示。

经过数十年的发展,应用于量化策略开发的AI算法/模型相当丰富。如下图所示,各种AI技术都有金融行业先行者实践应用的案例。

image

最后,快来创建属于您的第一个人工智能量化策略进行研究吧!

点击→创建属于您的第一个人工智能量化投资策略

小结: 本文介绍了AI量化策略的构建流程,并展示了在BigStudio环境下的一个可视化量化策略工作流,最后介绍了一些AI技术在量化领域的应用现状。这些AI技术的实现流程与上述模型训练流程大同小异,只是具体的模型算法和针对的特征数据结构各有特点,因此只要理解掌握AI量化策略流程后就可以针对所需的训练目标快速构建不同的特征数据和算法模型在BigQuant Studio环境下开展量化策略研究。