量化投资之因子选取

2023年10月12日09:47:44151

量化选股模型主要分为三大类:多因子选股、事件驱动选股以及基本面量化选股。

三种模型,都各有市场。本公众号主要关注于多因子选股(选债)和基本面量化选股(选债)。

因子是影响因素的简称。量化因子,是指对未来投资收益率具有正向作用的要素。

因子选取,是量化投资的重要内容。

因子选取,应该具有内在的经济逻辑或者符合市场检验。

对价值投资者来说,盈利能力强、负债率低、价值低估的公司,股价未来收益率更高。这是基于经济逻辑。

对技术分析者而言,他们可能认为,股价在年线以上,未来赚钱概率大;股价在年线以下,未来赚钱概率小。这是基于市场经验的逻辑(但可能回测结果并不如意)。

一些券商研究了可转债成交量/换手率与未来收益率之间的关系,发现成交活跃的可转债,未来收益率更高,且相关系数在0.1左右。这是符合市场检验的逻辑。

有些程序员,回测了每周不同交易日进行可转债轮动的收益率(分组测试),发现周一调仓的收益率最高。调仓交易日和未来收益的相关性,具有内在的逻辑吗?这是个值得思考的问题。

不同的调仓日,和未来的收益率,可能具有相关性。只不过他们的内在逻辑关系,并不为我们所知而已。

不同的调仓日,和未来的收益率,也可能不具有相关性,而只是一种偶然。比如,分别以2015年1月的某个周一、2018年1月的某个周一作为起始日回测,一个是周一收益最好,一个是周一收益最差,那就说明回测收益存在由于选定的起始日不同而导致的偶然性。

今天,我们以身边的例子说明如何进行因子选取。

你认为,在初中阶段,语文、数学、英语、物理、化学,哪个科目与总成绩的相关性最大?

为研究这个问题,我利用某省会城市一个重点初中2020年第一次诊断考试的成绩,做了一个学科的相关性分析。

量化投资之因子选取

初中各学科(及与总分的)相关性分析

表中数据,表示每两个变量之间的相关性。

我们主要看最后一行的数据。

语文与总分的相关性系数为0.821,数学与总分的相关性系数为0.916,英语与总分的相关性系数为0.912,物理与总分的相关性系数为0.918,化学与总分的相关性系数为0.868。

排名:物理≈数学≈英语>化学>语文。

一个数学学得好的学生,其总成绩一般也会较好。

一个语文学得好的学生,其总成绩一般也会较好。

但是,数学相比语文,数学预测的准确性更高。这和我们生活中观察到的事实基本相符。

以上各学科与总成绩的相关性,即为量化投资中的“因子IC”。

与收益率相关性更高的因子,就是量化投资中要挖掘的量化因子。

  • 特别声明:本文由互联网用户自行发布,仅供参考,不作为投资建议。股市有风险,炒股需谨慎!
  • 本文链接:https://www.gpboke.com/33399.html