因子为什么要进行行业中性化?

2025年8月13日09:14:1416

在因子投资中,行业中性化是指消除因子表现中受行业属性影响的部分,让因子更纯粹地反映公司个体层面的特征,而非行业系统性差异。

以市净率(PB,市值/净资产)为例,这种处理的必要性可以从以下几个角度理解:

一、市净率的行业差异具有天然性

不同行业的商业模式、资产结构、盈利模式差异极大,导致市净率存在系统性的行业分化,与公司自身质量无关:

例如,金融行业(尤其是银行)的资产主要是贷款等金融资产,账面净资产较扎实,且行业估值普遍偏低,市净率常处于1倍左右甚至更低(如0.5-0.8倍);

科技行业(如软件、互联网)的核心资产是研发投入、用户数据等无形资产,账面净资产较低,但市场对其增长预期高,市净率往往较高(如3-10倍);

周期性行业(如钢铁、煤炭)受宏观经济波动影响大,资产以固定资产为主,行业景气低谷时市净率可能低于1倍,景气高峰时可能升至2-3倍。

这种差异是行业属性决定的,并非“银行股比科技股更便宜”或“科技股比银行股泡沫更大”,而是行业本身的估值逻辑不同。

二、不做行业中性化的问题:因子被行业特性“污染”

若直接用原始市净率构建因子(例如筛选低PB股票),可能会出现以下问题:

1. 因子有效性被误判

假设回测发现“低PB因子”能带来超额收益,但实际上可能只是因为低PB股票集中在金融行业,而恰好某段时间金融行业整体表现好。此时因子的收益并非来自“低PB”本身,而是行业beta,因子的真实有效性被掩盖。

2. 组合过度集中于特定行业

若直接选全市场低PB股票,结果可能是组合中80%以上是银行、地产等低PB行业,而科技、消费等行业几乎没有标的。这种“行业集中”会导致组合暴露于巨大的行业风险(如政策对金融行业的调控),而非因子本身的风险,违背了因子投资“捕捉公司个体特征”的初衷。

3. 跨行业比较失去意义

若直接比较“银行A(PB=0.6)”和“科技公司B(PB=10.0)”,会误以为A比B便宜,但实际上在各自行业中,A可能是行业内偏高的PB(即相对较贵),而B可能是行业内偏低的PB(即相对便宜)。原始PB的跨行业比较是“不同维度的比较”,结论无意义。

三、市净率行业中性化的作用:让因子回归公司个体特征

行业中性化的核心是在行业内部对市净率进行标准化处理,消除行业系统性差异,让因子反映“公司在行业内的相对估值水平”。

常见做法包括:

行业内排名:在每个行业内部计算公司的PB排名(如在银行行业内,将所有银行的PB从低到高排序,赋予1-100的相对分值);

行业内标准化:将每个公司的PB减去所在行业的平均PB,再除以行业PB的标准差(即“去均值+标准化”),得到“行业中性化PB”。

经过中性化后,市净率因子的意义从“绝对估值高低”变为“在行业内的相对估值高低”:

银行A的中性化PB可能为负(表示在银行行业内相对便宜);

科技公司B的中性化PB也可能为负(表示在科技行业内相对便宜)。

此时,两者的中性化PB可以直接比较,筛选出的低中性化PB股票会均匀分布在各个行业,既捕捉了“相对便宜”的特征,又避免了行业集中风险。

四、行业分类的选择

在行业中性化中,股票所属行业的划分是核心前提,直接影响中性化效果。

选择行业分类标准时,需兼顾市场共识性、颗粒度适配性、数据可得性三大原则。

以下是具体的选择逻辑和常见分类标准:

1、选择行业分类的核心原则

市场共识性。优先选择市场广泛认可的分类标准,避免因分类方式过于小众导致因子逻辑与市场实际脱节。例如,机构投资者普遍采用的分类体系(如申万行业、GICS)更易被接受。

颗粒度适配性。行业分类的“粗细”(颗粒度)需与因子逻辑匹配。若因子对行业差异敏感(如估值因子、杠杆因子),适合中观颗粒度(如申万一级/二级行业),避免过粗(如仅分金融、周期等大类)导致同一行业内差异过大,或过细(如申万三级行业)导致单个行业样本量太少(难以计算行业均值)。若因子更关注细分领域特性(如科技行业内的半导体vs软件),可适当使用更细的分类(如二级行业)。

数据可得性与稳定性。需确保分类数据容易获取(如通过行情软件、数据服务商),且行业划分相对稳定(避免频繁调整导致回溯测试失真)。

2、常见行业分类标准

a. 申万行业分类(国内最常用)

由申万宏源证券编制,是A股市场机构投资者最广泛使用的标准之一。

分级:一级行业(31个,如银行、电子、医药生物)→ 二级行业(134个,如银行→国有大型银行、股份制银行)→ 三级行业(346个)。

优点:贴合A股市场结构,分类逻辑与国内产业特征匹配,数据易获取(Wind、同花顺等平台均支持)。

缺点:部分新兴行业(如新能源、人工智能)的划分,更新较慢。

b. GICS行业分类(全球通用)

由摩根士丹利资本国际(MSCI)和标准普尔(S&P)联合编制,全球主流指数(如沪深300、标普500)多采用。

分级:11个一级行业(如金融、信息技术、医疗保健)→ 24个二级行业 → 68个三级行业 → 157个四级行业。

优点:全球化视角,适合跨市场(A股+港股+美股)的因子研究,新兴行业分类更及时(如将云计算归入“软件与服务”)。

缺点:对A股特有的产业结构(如中药、白酒)覆盖不够精细。

c. 证监会行业分类(官方标准)

由中国证监会编制,用于上市公司信息披露,偏行政化分类。

分级:19个门类(如金融业、制造业)→ 90个大类 → 288个中类。

优点:官方权威性,数据绝对稳定(极少调整)。

缺点:颗粒度较粗(如“制造业”包含从汽车到电子的大量细分领域),不适合因子中性化(同一门类内行业差异过大)。

d. 自定义行业分类(灵活适配)

若通用分类无法满足需求(如研究特定主题因子,如“新能源产业链”),可基于业务收入构成自定义分类(如按公司主营收入占比50%以上的业务划分行业)。

优点:完全贴合因子逻辑(如将“光伏”“风电”从传统“电力设备”中拆分)。

缺点:需自行维护分类规则,且市场认可度低,不利于策略推广。

  • 特别声明:本文由互联网用户自行发布,仅供参考,不作为投资建议。股市有风险,炒股需谨慎!
  • 本文链接:https://www.gpboke.com/41705.html