因子为什么要进行行业中性化？

2025年8月13日09:14:14569

在因子投资中，行业中性化是指消除因子表现中受行业属性影响的部分，让因子更纯粹地反映公司个体层面的特征，而非行业系统性差异。

以市净率（PB，市值/净资产）为例，这种处理的必要性可以从以下几个角度理解：

一、市净率的行业差异具有天然性

不同行业的商业模式、资产结构、盈利模式差异极大，导致市净率存在系统性的行业分化，与公司自身质量无关：

例如，金融行业（尤其是银行）的资产主要是贷款等金融资产，账面净资产较扎实，且行业估值普遍偏低，市净率常处于1倍左右甚至更低（如0.5-0.8倍）；

科技行业（如软件、互联网）的核心资产是研发投入、用户数据等无形资产，账面净资产较低，但市场对其增长预期高，市净率往往较高（如3-10倍）；

周期性行业（如钢铁、煤炭）受宏观经济波动影响大，资产以固定资产为主，行业景气低谷时市净率可能低于1倍，景气高峰时可能升至2-3倍。

这种差异是行业属性决定的，并非“银行股比科技股更便宜”或“科技股比银行股泡沫更大”，而是行业本身的估值逻辑不同。

二、不做行业中性化的问题：因子被行业特性“污染”

若直接用原始市净率构建因子（例如筛选低PB股票），可能会出现以下问题：

1. 因子有效性被误判

假设回测发现“低PB因子”能带来超额收益，但实际上可能只是因为低PB股票集中在金融行业，而恰好某段时间金融行业整体表现好。此时因子的收益并非来自“低PB”本身，而是行业beta，因子的真实有效性被掩盖。

2. 组合过度集中于特定行业

若直接选全市场低PB股票，结果可能是组合中80%以上是银行、地产等低PB行业，而科技、消费等行业几乎没有标的。这种“行业集中”会导致组合暴露于巨大的行业风险（如政策对金融行业的调控），而非因子本身的风险，违背了因子投资“捕捉公司个体特征”的初衷。

3. 跨行业比较失去意义

若直接比较“银行A（PB=0.6）”和“科技公司B（PB=10.0）”，会误以为A比B便宜，但实际上在各自行业中，A可能是行业内偏高的PB（即相对较贵），而B可能是行业内偏低的PB（即相对便宜）。原始PB的跨行业比较是“不同维度的比较”，结论无意义。

三、市净率行业中性化的作用：让因子回归公司个体特征

行业中性化的核心是在行业内部对市净率进行标准化处理，消除行业系统性差异，让因子反映“公司在行业内的相对估值水平”。

常见做法包括：

行业内排名：在每个行业内部计算公司的PB排名（如在银行行业内，将所有银行的PB从低到高排序，赋予1-100的相对分值）；

行业内标准化：将每个公司的PB减去所在行业的平均PB，再除以行业PB的标准差（即“去均值+标准化”），得到“行业中性化PB”。

经过中性化后，市净率因子的意义从“绝对估值高低”变为“在行业内的相对估值高低”：

银行A的中性化PB可能为负（表示在银行行业内相对便宜）；

科技公司B的中性化PB也可能为负（表示在科技行业内相对便宜）。

此时，两者的中性化PB可以直接比较，筛选出的低中性化PB股票会均匀分布在各个行业，既捕捉了“相对便宜”的特征，又避免了行业集中风险。

四、行业分类的选择

在行业中性化中，股票所属行业的划分是核心前提，直接影响中性化效果。

选择行业分类标准时，需兼顾市场共识性、颗粒度适配性、数据可得性三大原则。

以下是具体的选择逻辑和常见分类标准：

1、选择行业分类的核心原则

市场共识性。优先选择市场广泛认可的分类标准，避免因分类方式过于小众导致因子逻辑与市场实际脱节。例如，机构投资者普遍采用的分类体系（如申万行业、GICS）更易被接受。

颗粒度适配性。行业分类的“粗细”（颗粒度）需与因子逻辑匹配。若因子对行业差异敏感（如估值因子、杠杆因子），适合中观颗粒度（如申万一级/二级行业），避免过粗（如仅分金融、周期等大类）导致同一行业内差异过大，或过细（如申万三级行业）导致单个行业样本量太少（难以计算行业均值）。若因子更关注细分领域特性（如科技行业内的半导体vs软件），可适当使用更细的分类（如二级行业）。

数据可得性与稳定性。需确保分类数据容易获取（如通过行情软件、数据服务商），且行业划分相对稳定（避免频繁调整导致回溯测试失真）。

2、常见行业分类标准

a. 申万行业分类（国内最常用）

由申万宏源证券编制，是A股市场机构投资者最广泛使用的标准之一。

分级：一级行业（31个，如银行、电子、医药生物）→ 二级行业（134个，如银行→国有大型银行、股份制银行）→ 三级行业（346个）。

优点：贴合A股市场结构，分类逻辑与国内产业特征匹配，数据易获取（Wind、同花顺等平台均支持）。

缺点：部分新兴行业（如新能源、人工智能）的划分，更新较慢。

b. GICS行业分类（全球通用）

由摩根士丹利资本国际（MSCI）和标准普尔（S&P）联合编制，全球主流指数（如沪深300、标普500）多采用。

分级：11个一级行业（如金融、信息技术、医疗保健）→ 24个二级行业 → 68个三级行业 → 157个四级行业。

优点：全球化视角，适合跨市场（A股+港股+美股）的因子研究，新兴行业分类更及时（如将云计算归入“软件与服务”）。

缺点：对A股特有的产业结构（如中药、白酒）覆盖不够精细。