量化投资,需要对部分因子进行行业中性化。
因子行业中性化的关键,在于获取合理的股票行业分类。
我主要从股票软件获得原始行情数据。
因此,我对东方财富、同花顺和通达信的股票行业分类进行对比研究。
一、东方财富的行业分类
东方财富的行业分类最简单,只有一种分类方法。
图1 东方财富界面
从股票的行情报价表,将数据导出,然后进行统计分析。
东方财富一共有86个行业。其中,专用设备行业的股票数量最多,有263家;保险行业的股票数量最少,只有6家。
图2 东方财富行业统计
二、同花顺的行业分类
同花顺有两种行业分类:宏观行业和细分行业。
宏观行业有90个,有以下类别:
图3 同花顺宏观行业分类
90个宏观行业中,汽车零部件行业的股票数量最多,有230家;保险行业的股票数量最少,只有6家。
图4 同花顺宏业行业分类
同花顺细分行业有257个。其中,有84个细分行业内的股票数量少于10家,有26个细分行业内的股票数量少于5家。
图5 同花顺细分行业(部分)
在因子行业中性化过程中,行业内股票数量过少会对中性化效果、因子有效性及后续分析产生一系列负面影响。
三、通达信的行业分类
通达信的行业分类最多,也最复杂。
从页面的下方标签【板块】,可查看行业分类(至少两种):
图6 通达信行业板块分类
图7 通达信证监会行业板块分类
从【系统设置】中,可以更改行业分类方法,看起来有三种分类方法。
图8 通达信行业分类设置
在图7中,选择不同的【行业分类】,差异将体现在图8行情报价中的【一二级行业】和【细分行业】栏目中。
图9 通达信行情报价(示例)
选择【通达信研究行业】,将有127个【一二级行业】和348个【细分行业】。行业数量过多!
选择【通达信普通行业】或者【通达信普通细分】,都将有56个【一二级行业】和110个【细分行业】。行业数量适当!推荐选择此种行业分类方式!
下图为通达信普通行业分类下的56个【一二级行业】。其中,材料-化工行业的股票数量最多,有439家;有4个行业的股票数量在5~10之间。
图10 通达信基础行业分类
相比东方财富和同花顺,通达信“材料-钢铁”的这种目录结构更加清晰明了。
综上,推荐使用通达信的行业分类数据进行因子的行业中性化。