繁簡切換您正在訪問的是FX168財經網,本網站所提供的內容及信息均遵守中華人民共和國香港特別行政區當地法律法規。

FX168财经网>人物频道>帖子

支持向量机(SVM)多因子选股策略

作者/1dfsadf 2019-09-20 18:00 0 来源: FX168财经网人物频道

一、前言

  本文主要介绍支持向量机(Support Vector Machine, SVM)在多因子选股方面的应用。
  支持向量机可用于分类问题和回归问题,用于回归问题时被称为支持向量回归(Support Vector Regression, SVR)。回归是构建若干个因子值与收益率或超额收益率之间的映射关系,股票的收益率有时会受到政策、新闻、事件等方面的影响,包含了太多的噪声,分类相对来说更像是一种“模糊的正确”,因此本文根据每期截面个股收益率进行降序排列,头尾部分别作为“ 1类”和“-1类”,SVM建模对其分类。
  支持向量机可分为线性支持向量机和核支持向量机,前者针对线性分类问题,后者属于非线性分类器。为了更好的挖掘因子值与股票相对强弱之间的非线性关系,本文使用了高斯核(RBF核)的核SVM。
  SVM的算法原理可以参考李航的《统计学习方法》和周志华的西瓜书《机器学习》等书籍关于SVM的篇章,还有更快的入门方法,那就是《【量化课堂】SVM原理入门》。

二、策略构建

  本文策略所使用的因子和构建流程主要参考了华泰金工林晓明先生的人工智能系列之三《人工智能选股之支持向量机模型》,建模流程如下:
  1.回测时间范围:2010-01-01 ~ 2019-08-31
  2.股票池:沪深300成分股。剔除ST股票,剔除停牌股票,剔除上市未满3个月的股票,每期截面的每只股票视作一个样本,即同一只股票在不同期视为不同样本。
  3.因子库:本策略使用了60余个因子,因子列表如下。
Img
  4.因子值处理:首先采用中位数去极值,若因子值缺失,则采用申万一级行业个股均值填充,若当前行业个股皆缺失,则填充为全部行业的均值;然后,对因子值做行业中性化和市值中性化;最后,对每个因子做标准化处理。
  5.模型构建:根据每期截面个股收益率进行降序排列,头尾各30%部分别作为“ 1类”和“-1类”,SVM建模分类,采用带格点搜索的交叉验证法确定模型参数。SVM模型使用sklearn.svm中的SVC,带格点搜索的交叉验证使用sklearn.model_selection中的GridSearchCV。

三、回测结果

  回测曲线见下图,样本内可见SVM的强大归纳能力,曲线向上不回头,但也存在两三年的曲线走平失效时间。这就要说到一般机器学习算法的使用前提i.i.d条件(independent and identically distributed, 独立同分布),由于机器学习算法强大的归纳能力,能非常好的拟合样本内(训练集)数据,但如果样本外(测试集)数据与样本内(训练集)数据不属于同一个分布,或者两者的分布差距非常大,则该算法只能“归纳”,无法“演绎”,出现非常严重的过拟合现象。
  策略回测净值曲线:
Img
  SVM预测与因子相关性热力图:
Img

分享到:
举报财经168客户端下载

全部回复

0/140

投稿 您想发表你的观点和看法?

更多人气分析师

  • 张亦巧

    人气2144文章4145粉丝45

    暂无个人简介信息

  • 梁孟梵

    人气2152文章3177粉丝39

    qq:2294906466 了解群指导添加微信mfmacd

  • 指导老师

    人气1856文章4423粉丝52

    暂无个人简介信息

  • 李冉晴

    人气2296文章3821粉丝34

    李冉晴,专业现贷实盘分析师。

  • 刘钥钥1

    人气2016文章3119粉丝34

    专业从事现货黄金、现货白银模似实盘操作分析指导

  • 张迎妤

    人气1896文章3305粉丝34

    个人专注于行情技术分析,消息面解读剖析,给予您第一时间方向...

  • 金泰铬J

    人气2320文章3925粉丝51

    投资问答解咨询金泰铬V/信tgtg67即可获取每日的实时资讯、行情...

  • 金算盘

    人气2696文章7761粉丝125

    高级分析师,混过名校,厮杀于股市和期货、证券市场多年,专注...

  • 金帝财神

    人气4728文章8329粉丝118

    本文由资深分析师金帝财神微信:934295330,指导黄金,白银,...