【宽客学院】机器学习模型(持续更新中)

机器学习
宽客学院
标签: #<Tag:0x00007f5bffc104f0> #<Tag:0x00007f5bffc10388>

(iQuant) #1
作者:bigquant
阅读时间:6分钟
本文由BigQuant宽客学院推出,难度标签:☆☆☆

导语: BigQuant平台会不断封装机器学习算法策略,方便用户直接使用策略生成器开发策略,降低策略开发难度。本文对BigQuant平台上策略生成器已经支持的机器学习模型进行简单介绍。


目前,在BigQuant策略研究平台,支持的机器学习模型有:


我们依次进行介绍:

StockRanker 模型

StockRanker 是 BigQuant为量化选股而设计,核心算法主要是排序学习和梯度提升树。

StockRanker = 选股 + 排序学习 + 梯度提升树

StockRanker有如下特点:

  • 选股:股票市场和图像识别、机器翻译等机器学习场景有很大不同。StockRanker充分考虑股票市场的特殊性,可以同时对~3000只股票的数据进行学习,并预测出股票排序

  • 排序学习 (Learning to Rank):排序学习是一种广泛使用的监督学习方法 (Supervised Learning),比如推荐系统的候选产品、用户排序,搜索引擎的文档排序,机器翻译中的候选结果排序等等。StockRanker 开创性的将排序学习和选股结合,并取得显著的效果。

  • 梯度提升树 (GBDT):有多种算法可以用来完成排序学习任务,比如VSM、逻辑回归、概率模型等等。StockRanker使用了GBDT,GBDT是一种集成学习算法,在行业里使用广泛。

StockRanker的领先效果还得益于优秀的工程实现,我们在学习速度、学习能力和泛化性等方面,都做了大量的优化,并且提供了参数配置,让用户可以进一步根据需要调优。

随机森林模型

随机森林模型使用多棵树进行单独预测,最后的结论由这些树预测结果的组合共同来决定,这也是“森林”名字的来源。每个基分类器可以很弱,但最后组合的结果通常能很强,这也类似于:“三个臭皮匠顶个诸葛亮”的思想。

随机森林模型有如下特点:

  • 很少的数据预处理。随机森林继承决策树的全部优点,只需做很少的数据准备,其他算法往往需要数据归一化。

  • 功能强大。随机森林模型能处理连续变量,还能处理离散变量,当然也能处理多分类问题 。

  • 鲁棒性更强。随机森林解决了决策树的过拟合问题,使模型的稳定性增加,对噪声更加鲁棒,从而使得整体预测精度得以提升。

线性回归模型(SGD)

用回归方程定量地刻画一个因变量与多个自变量间的线性依存关系,称为多元线性回归分析。多元线性回归分析是多变量分析的基础,也是理解监督类分析方法的入口!实际上大部分学习统计分析和市场研究的人的都会用回归分析,操作比较简单。

在BigQuant上的线性回归模型的独特之处在于,在最小化损失函数——均分误差的时候,采取的是随机梯度下降法(stochastic gradient descent),因此更高效。

小结: 本文对三种机器学习算法模型特点进行简单介绍,帮助大家进一步了解常用模型特点,在进行构建策略时做出最优选择。


   本文由BigQuant宽客学院推出,版权归BigQuant所有,转载请注明出处。



stock_ranker_train是xgboost吗?
(jiangxiaoyu610) #2

您好,请问有没有系统地介绍这几种算法的书籍或者paper?我想了解一下它们背后的逻辑,如何用python实现,以及如何应用到交易策略上的实例讲解。请管理员大神指点迷津!^ - ^


(iQuant) #3

未来我们会逐步增加相关内容,请耐心等候。前期的一个建议是,先把机器学习知识准备扎实,推荐

  • 吴军 《数学之美》
  • Toby Segaran 《Programming Collective Intelligence》(《集体智慧编程》)
  • 李航《统计学习方法》
  • 周志华《机器学习》
  • Tom Mitchell《Machine Learning》
  • Christopher M. Bishop 《Pattern Recognition And Machine Learning》
    更多机器学习资源请参考:《史上最全机器学习资源整理》

(jiangxiaoyu610) #4

非常感谢您的解答~ ^ -^


(iQuant) #5

不客气!


(1899) #6

你好 我想问一下 可不可以调用其他类型的学习模型,例如深度学习的


(iQuant) #7

您好,机器学习和深度学习模型在平台上是可以调用的。
比如XGBoost、Tensorflow、Theano、Keras等。 参考界面:链接


(PAYNE) #8

社区文档写的真详细啊,怎么不update到文档里面,方便大家看啊


(小Q) #9

是这样的。文档界面是整个产品的介绍,因此更多是概览介绍。在宽客学院界面则是更多的细节介绍,因此会详细一些。


(1899) #11

刚刚想错了。平台上的这几个机器学习模型,是不是都是做的回归啊。。我一开始还以为是分类。。。。


(小Q) #12

很多机器学习算法是既可以做回归又能做分类。目前平台上的这几个算法是回归的。


(PAYNE) #13

这帖子写的很详细,不过不仔细在社区学院里找的话很容易就沉了,最好找人总结汇总置顶,形成索引,以后也方便维护,相同的问题也不会反复提问了


(小Q) #14

嗯,谢谢建议。我们很多好的帖子会收集整理在学院界面,你可以在那里浏览。