本文内容不仅仅适用于基本面量化投资,而是适用于所有的因子量化投资策略,故将题目命名为【(基本面)量化投资41】。
本文是简化版、普及版的多因子量化投资教程,专业的多因子量化投资方法更为复杂,但本文内容已经能满足大部分人的投资需要了。
回到题目内容:如何构建多因子选股模型?
第一步,选取有效的选股因子。
常用的一种方法是对因子做分组回测对比。
假设因子的数值越大越好,则首先对因子从大到小排序,然后依因子大小将股票分为10组(或5组),比较各个分组组合的收益率分布状况。
如果各个分组的收益率具有严格的(递增或递减)单调性,且第一分位收益率相比样本股票池平均收益率具有明显的超额收益,则说明回测的因子是有效的选股因子。
金融资产的收益一般分成两部分:和市场一起波动的部分叫贝塔收益,不和市场一起波动的部分叫做阿尔法收益。即:资产收益=阿尔法收益+贝塔收益。相应的,可以将因子分为Alpha因子(α)和beta因子(β)。
如果某个因子第一分位的收益率很高,那么该因子就一定是优秀的选股因子吗?不一定。因为,这种高收益率有可能是回测时段市场/大盘暴涨带来的。因此,比较因子组合收益率相对市场(或基准指数)的超额收益部分,才更加科学。
第二步,计算因子之间的相关性系数
因子之间可能存在相关性关系。相关性系数较高的多因子合成,并不一定能增加超额收益,甚至可能会产生多线共振,增加风险、降低收益。不相关、低相关的多因子合成,往往会增加多因子模型的超额收益,并提高多因子模型盈利的稳定性。
有时,凭常识可以推测某些因子之间相关性的高低。
第三步,将因子合成为多因子模型
将因子合成为多因子模型,有两种方法。
第一种方法是赋权加总。
具体做法是:将各个选股因子分别排序、打分,并赋权相加,得到综合得分。
例如:
毛利率越高越好。将毛利率自高到低排序,第1名的得分为1分,第2名的得分为2分,以此类推。市净率越低越好。将市净率自低到高排序,第1名的得分为1分,第2名的得分为2分,以此类推。
将以上毛利率、市净率的得分赋权相加(假设等权重相加),对综合得分再进行自低到高的排序,便构建了一个毛利率与市净率多因子模型。
第二种方法是双重排序筛选。
具体做法是:使用第一个因子(如毛利率)对股票进行初次筛选;然后使用第二个因子(如市净率)进行再次筛选。有点类似企业招聘,初试筛选掉一批人,复试再筛选掉一批人。
第一种方法赋权加总,一般需要在excel中进行处理,计算量大,对有些人存在难度。第二种方法双重排序,更为简单易操作,而且收益率甚至还更高,更适合大部分投资者。不过,当使用3个以上因子合成时,一般采用第一种方法。
从下周起,我将结合《基本面量化投资策略》一书内容,发布多个多因子选股策略/选股模型,含通达信版、同花顺版。
往期精彩内容推荐: