2025年ESG专题:中国股票市场ESG溢价现象探析

1 引言与文献综述

ESG 是关于环境(Environmental)、社会(Social)和治理(Governance)如何协调发展的理念,也是一种基于这三个因素对企业非财务绩效的评估和对公司长期发展的评价标准(Gillan 和 Koch,2021)。ESG 投资起源于社会责任投资,在欧美有近 100 年的历史,ESG 与联合国可持续发展目标(SDGs)理念高度相符,SDGs 也为考虑 ESG 因素的可持续投资的社会目标提供了明确方向与全球框架。目前,ESG 投资在世界范围内不断走向成熟,并逐渐成为可持续金融的核心。在中国,ESG 投资在碳达峰、碳中和的中长期目标背景下,受到越来越多投资者的关注。投资者在构建投资组合时,开始考虑环境相关因素。ESG 投资通常被认为是一种具备避险、抗波动属性的长期投资方式。那么投资ESG 表现优秀的公司能否为投资者带来超额市场收益呢? Riedl 和 Smeets(2021)通过结合投资者实际持仓数据、问卷调查与激励实验发现,投资者持有 ESG 基金的首要动机是内在的社会偏好,在信任游戏中表现出更强利他倾向的投资者,持有 ESG 基金的概率显著更高;社会信号也同样显著影响投资决策,投资者希望通过持有 ESG 基金向他人传递正面形象,这种信号动机与持有概率正相关;而财务动机的作用相对有限,ESG 投资者对ESG 基金收益的预期低于传统基金,并且实际支付更高的管理费,这表明他们愿意为了符合自身社会偏好而放弃部分财务业绩。

Pástor 等(2021)通过构建理论模型刻画了市场均衡下的ESG 定价,其研究假定投资者偏好于 ESG 表现优异的公司,因此,投资者持有ESG 表现相对较差的企业,需要额外的补偿,ESG 表现优异的公司的预期投资收益反而更低。Albuquerque等(2019)的行业均衡模型也支持这一结论,ESG 实践能够降低系统性风险并提升企业价值,从而降低市场对企业股票要求的风险溢价。尽管如此,但基于国外股票市场的实证检验却未支持这一理论。Kotsantonis等(2016)基于 MSCI 和 SASB 的 ESG 评价体系的投资策略,在2006-2016 年都能显著提高基金业绩。Verheyden 等(2016)测试了在可投资标的范围内使用不同ESG筛选条件的效果,研究结果发现,在采用 10%最佳ESG 筛选方法(该方法有效地剔除了 ESG 排名最低的 10%的公司)时,无论是在全球市场还是发达市场,经风险调整后的收益都得到了“明确的正向”提升。Kumar 等(2016)评估了157家道琼斯可持续发展指数成分股公司和 809 家非成分股公司,利用提出的新方法,发现将 ESG 因素纳入考量的公司的股票表现的波动性低于同行业其他公司,而且ESG表现好的公司往往能带来更高的回报。Pástor 等(2022)通过做多ESG 表现好的企业并做空 ESG 表现差的企业构建的投资组合,可以获得超额收益,且无法被主流因子模型解释。其他研究包括 Pedersen 等(2021)、Avramov 等(2022)的结论也不支持上述理论。

支持上述理论的研究成果主要在碳排放领域。Bolton 和Kacperczyk(2021)在美国股票市场发现“碳溢价”效应,即碳排放总量(以及变化量)越高的公司,股票收益率也越高,这一关系在控制了公司规模、账面市值比、动量以及其他预测收益的因素后仍然显著,同时也无法用意外盈利能力或其他已知风险因素的差异来解释,表明投资者已经开始要求对其承担的碳排放风险进行补偿。Bolton和Kacperczyk(2023)通过对来自 77 个国家 14400 家企业的横截面数据进行了分析,估算了与碳转型风险相关的市场溢价;结果发现,在所有行业和大多数国家,碳排放水平和增长率越高,股票回报率也越高。Hsu 等(2023)根据同一行业内污染排放强度高低构建多空投资组合,其平均年收益率为4.42%,在控制风险因素后仍然显著,这种污染溢价无法用现有的系统性风险、投资者偏好、市场情绪、政治关系或公司治理来解释。 那么,我国股市中企业 ESG 表现与股票横截面收益的关系如何呢?已有研究也并未得到统一结论。周方召等(2022)基于和讯网的上市公司企业ESG 社会责任评分数据中的履行员工责任维度的评价得分,发现在2010-2020 年的时间区间里,履行员工责任得分较低的公司,股票未来收益反而更高。这一异象在投资者情绪高的时期、机构投资者持股比例高和分析师覆盖高的股票中更为明显。

史永东和王淏淼(2023)基于中证 800 成分股的中证ESG 评分数据,发现在2017年 6 月至 2021 年 12 月的时间区间里,存在 ESG 风险溢价现象,即企业ESG表现与股票截面未来收益负相关,且这一现象在套利成本、流动性约束、信息不确定性以及错误定价相对较低的股票中更为明显。 何枫等(2025)基于和讯网的中国上市公司社会责任报告的ESG 评分数据,发现在 2011-2021 年的时间区间里,ESG 表现好的公司比ESG 表现差的公司收益更低,这一超额收益不能被现有资产定价模型所解释,同时这一溢价现象的存在主要源自小市值股票。 与上述研究发现我国股市企业 ESG 表现与股票收益负相关的ESG 风险溢价现象,以下研究则发现我国股市存在与 ESG 风险溢价截然相反的ESG 正向溢价现象。李瑾(2021)基于华证指数、商道融绿以及社投盟截至2020 年6 月发布的针对A股上市公司的评级数据 1,发现在控制了主要影响因素后,未获评公司股票的平均收益率大于获评公司,评级较高公司股票的平均收益率大于评级较低公司,同时市场收益率下降上述两种效应更为明显。

周方召等(2021)基于和讯网公布的企业社会责任评分数据和润灵环球的环境评分数据,发现在 2009 年 1 月至 2019 年 12 月的时间区间里,在相同质量的企业中,ESG 表现越好的企业的股票市场表现越好,履行环境责任表现越好的企业越能获得资本市场认可。这一现象在同时控制诸如市值、账面市值比、盈利能力等多个相关因素后仍然成立,且在低品质的公司中更为明显。张跃军和黄玉琴(2024)基于 Wind(万得)ESG 评级评分数据,发现在2018年2月至 2024 年 1 月的时间区间里,我国股票市场对 ESG 绩效良好的企业给予其股票收益上的正面反馈,且绩效表现越好反馈越高,而对绩效较差的给予负面反馈;同时企业 ESG 绩效和股票收益率的因果关系主要是由社会维度和治理维度引起,环境维度则没有显著关联。 韩晓晨和何雨骞(2025)基于华证 ESG 的评级数据,发现在2011-2021 年的时间区间里,ESG 表现越好的企业的股票年度超额收益越高,同时这一现象在非国有企业和非重污染企业中更加显著。

鉴于已有研究对我国股票市场 ESG 溢价现象并没有得到一致结论,因此有必要再对这一现象进行系统深入探析。之所以未有一致结论,首先是各机构ESG数据本身相关性的问题。张伟伟等(2024)基于万得、富时罗素、盟浪、商道融绿、润灵环球、华证 CNRDS(中国研究数据服务平台)、同花顺、秩鼎、中诚信的ESG评级数据,发现在 2009-2022 年的时间区间里,对于被两家及以上评级机构ESG评级的样本中,各评级机构 ESG 评分的相关系数在0.015-0.685 之间,相关性较低。由于各机构 ESG 数据本身各异,因此采用不同ESG 数据的研究结果可能存在明显差异。上述研究我国股市 ESG 溢价现象所使用的数据有:和讯网、中证、万得、润灵环球的 ESG 评分数据和华证指数、商道融绿、社投盟的ESG 评级数据。何枫等(2025)、周方召等(2021)虽然都采用的是和讯网的ESG 评分数据,但得到的结论却相反。 其次是时间区间不同所致。比如史永东和王淏淼(2023)研究的时间区间是2017年 6 月至 2021 年 12 月,张跃军和黄玉琴(2024)是2018 年2 月至2024年1月,李瑾(2021)是 2015 年至 2020 年 6 月,时间区间相对较短。其他研究的时间区间则相对较长,比如周方召等(2021)研究的是 2009-2019 年,何枫等(2025)研究的是 2011-2021 年,虽然他们研究的时间区间大部分重叠,在所用ESG数据相同的情况下,也仍得到截然相反的结论。

再次是研究设计的问题。在数据频率上,史永东和王淏淼(2023)采用的是日频,李瑾(2021)是周频,韩晓晨和何雨骞(2025)采用的是年度,其他研究则是月度。不同频率的数据可能会导致结果存在差异,比如美国股市截面收益率的短期反转(Jegadeesh,1990)和中期动量效应(Jegadeesh 和Titman,1993),则是不同频率下收益率数据展现的不同溢价现象。在实证方法上,李瑾(2021)、韩晓晨和何雨骞(2025)采用的面板固定效应回归模型,其他研究则采用的排序分组方法和 Fama-MacBeth 回归(Fama 和 MacBeth,1973)。最后是股票截面样本存在明显差异。比如李瑾(2021)使用的社投盟数据在2019年底的评级只涵盖沪深 300 成分股,他使用的商道融绿的数据在2019 年6月底的评级仅涵盖 767 个 A 股上市公司。史永东和王淏淼(2023)研究的样本是中证800成分股。何枫等(2025)在 Fama-Macbeth 回归中的观测值为188014 个,按照ESG投资组合超额收益分析中的 132 个月来算,平均每月的样本数量仅1424个,而按照他们的筛选方法,同期平均每月的样本数量为 2721 个,因此他们的股票截面覆盖率仅为 52%。张跃军和黄玉琴(2024)的样本区间内均有ESG 评级评分数据的企业有 3088 家,按照类似的筛除方法,同期平均每月的样本数量为3798,覆盖率超过 80%。韩晓晨和何雨骞(2025)共 11 年 29392 个样本数据,平均每年2672个,覆盖率超过 85%。 考虑到以上种种原因,本报告将通过更为严谨的研究设计,探析中国股票市场ESG溢价现象,以期望得到更为可信的结论。

2 研究设计

2.1 数据来源

探析中国股票市场 ESG 溢价现象的关键在于 ESG 指标的可靠性。目前ESG评价机构繁多且机构背景、出发点迥然不同,国际机构对中国市场和中国国情往往不够了解,对于中国公司的评分会呈现系统性偏低的现象,所以ESG 评价结果通常差异较大且有一定的偏误,制约了研究结果的准确性(史永东和王淏淼,2023)。从已有的研究来看,ESG 数据多为评级数据。而在评级数据中,通常大部分样本集中在少数几个中等评级上,无法充分体现不同企业ESG 表现的差异水平,这将降低采用分组或回归等方法检验 ESG 表现与股票未来收益率之间关系的可信度。因此采用连续的 ESG 评分数据可以解决 ESG 评级数据的缺陷,从而更为可信的揭示出企业 ESG 表现与股票未来收益率的真实关系。目前我们可采用的 ESG 评分数据主要是万得、同花顺和秩鼎的ESG 评分数据。考虑到万得、同花顺的 ESG 评分数据自 2018 年开始才覆盖大部分股票,因此本报告考虑采用秩鼎的 ESG 评分数据,该数据的时间样本区间从2014 年4 月至2025年9 月,共 11 年半,有 138 个月的数据。

秩鼎 ESG 评级是一个全面、深入且高度本地化的评价体系,其优势在于覆盖范围广,评估对象涵盖全部 A 股、港股、中概股及发债企业,可追溯至2014 年,每月初更新评价结果,为回测提供了坚实基础。秩鼎评价结果在提供ESG 综合分的同时,还细化到 3 个一级和 10 多个二级维度,实现对企业ESG 优势与短板的全面衡量。在模型设计上,秩鼎根据行业差异和指标特性,设置了差异化的评估方法和权重,将指标划分为通用、行业和风险指标,并特别考量了中国国情政策(如乡村振兴、反腐等特定指标)和行业的基本面特点,采用行业专用数据和模型,确保评价结果科学、客观且符合行业特征。同时,秩鼎通过每日动态监测和每月定期调整,持续优化其指标体系和权重,确保其 ESG 评级体系始终紧贴最新的监管要求和市场趋势。 注意到,秩鼎的 ESG 数据是月度更新。而目前已有研究所采用的ESG 数据更新频率都在季度及以上,比如李瑾(2021)采用的华证ESG 评级数据是每年6月末发布,频率为年;史永东和王淏淼(2023)采用的中证ESG 评分数据的更新频率为半年;张跃军和黄玉琴(2024)采用的万得 ESG 评分数据的更新时间为每年的1月、4 月、7 月和 10 月底,更新频率是季度。另外,张跃军和黄玉琴(2024)指出,润灵环球、和讯网等机构的 ESG 评级频率为年度;华证ESG 评级的频率为季度和年度,但季度无评分数据。 除评级数据外,其他数据均来自万得。

2.2 实证方法

为了保证研究结果的可靠性,本报告参考 Fama 和French(2008)关于探讨股市异象的排序分组方法和横截面回归方法,对中国股票市场ESG 溢价现象进行分析。排序分组方法的主要优势在于能够清晰地展现股票收益如何随指标大小变化的。然而它也存在一些潜在的缺陷。例如,一种常见的做法是根据指标对股票进行排序,构建等权重的投资组合。虽然通常会展示各个投资组合的详细结果,但人们往往更关注指标值最大和最小的极端组合的多空对冲组合的收益。一个潜在的问题是,使用所有股票的等权重对冲投资组合的收益有可能收到小盘股、微盘股的影响。首先,小盘股和微型股的市值占比较低,但它们的数量占比较高。其次,指标的横截面离散度在小盘股和微型股中可能是最大,因此它们通常占极端组合中股票总数的较大比例。为了规避这个问题,通常会将市值加权组合与等权重组合的收益一起展示。但市值加权组合又可能被少数几只大盘股主导,使得指标与股票收益率之间的真实关系还是反映不准确。

为了解决这些问题,我们分别考察微型股、小盘股、中盘股和大盘股的ESG排序组合的平均收益率。其中,这里我们参考华证 A 股规模指数系列编制方案,将样本内的股票按照总市值从大到小排序,然后计算累计自由流通市值占比,并以累计自由流通市值占比 70%、85%、95%作为区分不同规模大小股票的分界点。其中大盘股为累计自由流通市值占比前 70%的股票,中盘股为累计自由流通市值占比70%至 85%之间的股票,小盘股为累计自由流通市值占比85%至95%之间的股票,微盘股为累计自由流通市值占比后 5%的股票。 排序分组方法存在两个横截面回归方法所没有的缺陷。首先,排序分组方法难以推断哪些指标包含有关于股票收益率的独特信息,而横截面回归方法可以直接估计边际效应,在大样本下,这一边际效应都能被精确测量。其次,排序分组方法难以检验股票收益率与指标之间关系的函数形式。相比之下,横截面回归方法中对回归残差进行简单的诊断,就能判断回归斜率所隐含的指标与股票收益率之间的关系是否在变量的全部取值范围内都存在。 横截面回归方法也面临一些潜在问题。首先,基于所有股票的回归估计可能受到小盘股、微型股的影响,因为他们数量众多,且指标值和股票收益率往往更为极端。为了避免这个问题,我们分别对微型股、小盘股、中盘股和大盘股进行回归估计。然后,对不同规模大小股票的回归平均斜率进行均值差异检验,可以推断关于股票收益率与指标之间的关系是否存在差异。其次,由于个股收益率可能非常极端,横截面回归中存在潜在的极端观测值问题,排序分组方法提供了一种交叉检验手段。如果横截面回归和排序分组得出相互矛盾的推论,则回归中极端值问题很可能是“罪魁祸首”。不过在我们的分析中,排序分组和横截面回归结果有时存在细微差别,但它们总体都支持相同的结论。

3 实证结果与分析

3.1 描述性统计

将当月有交易的 A 股样本作为初始样本,我们参考Liu 等(2019)、何枫等(2025)的方法先对股票样本进行筛选,即在每月末,我们先剔除上市不足12 个月的股票;然后剔除最近 12 个月交易天数不足 120 天或者最近20 个交易日交易天数不足15天的股票,这样可以避免因长期停牌导致的股票异常收益率;最后,剔除ST、PT类的样本和下月没有交易的样本。 初始样本的数量自 2014 年 4 月至 2025 年 9 月,从期初的2400 只左右增长至期末的 5400 多只,自由流通市值则从期初的 8.7 万亿增长至期末的50 万亿。经过上述筛除后,平均仅剔除 13%的股票样本和 5%的自由流通市值,不过在一些极端的月份,比如 2015 年 7 月,因交易天数的筛选规则,股票样本被剔除比例高达33%,同时自由流通市值剔除了 19%。 在筛选后的样本中,秩鼎的 ESG 数据几乎没有多少缺失,股票数量最大缺失比例仅为 3.4%,自由流通市值比例也仅为 1.7%。在大多数月份中,秩鼎的ESG数据实现了全覆盖,这有利于我们探索全部 A 股样本中 ESG 指标与股票收益率的关系。

从 2014 年 4 月至 2025 年 9 月,每月末我们将样本内的股票按照总市值从大到小排序分为 4 组:大盘股、中盘股、小盘股和微盘股。划分的分界点是累计自由流通市值占比 70%、85%和 95%。期初样本股票数量为2161,其中大盘股、中盘股、小盘股和微盘股分别为 633、527、553 和 448;到期末,样本总数量增长至5149只,各规模分组的数量分别为 965、1090、1531、1563,大盘股数量增长了50%多,中盘股数量增长了 1 倍多,而小盘股数量增长近3 倍,微盘股数量增长则超过 3 倍。以期末为例,大盘股与中盘股、中盘股与小盘股、小盘股与微盘股的分界点分别是 194 亿、87 亿和 43 亿。 我们统计了市值加权和等权重的全部样本、大盘股、中盘股、小盘股和微盘股投资组合的平均收益率和标准差,以及各投资组合中股票数量和自由流通市值占比的时序平均值。

平均而言,大盘股、中盘股、小盘股和微盘股分别占到全部样本数量的21%、22%、29%和 28%。由于小盘股和微型股数量众多,它们对等权组合的市场收益率有重要影响。微型股的平均等权收益率较高,为每月 2.30%,而大盘股和中盘股的等权收益率为 0.80%,这使得整个市场等权组合的收益率提升至每月1.32%。微盘股等权组合的收益波动性也最高,并且对整个市场收益率的波动有显著影响。相比之下,大盘股平均市值占比在 70%,主导着市场加权组合的收益。市场加权组合的平均月收益率和月收益率标准差分别为 0.96%和6.58%,与大盘股加权组合的0.89%和 6.34%相近。 我们统计了全部样本、大盘股、中盘股、小盘股和微盘股投资组合的规模、价值、情绪变量以及 ESG 变量的平均值情况。股票规模越小的投资组合的亏损比例越高,盈市比越低,超额换手率越低,ESG 及各个分项的指标值也越低。

我们还统计了月收益率和上述各项指标的横截面标准差的时序平均值。对于收益率和盈利<0 的指标,股票规模越小的投资组合的横截面离散度越大。而对于其他指标,大盘股的横截面离散度是最大的,其中盈市比、对数超额换手率、ESG评分、E 评分指标的横截面离散度随股票规模下降而降低。而在美股多数具有溢价效应的指标中,微型股的横截面标准差远高于其他规模大小的投资组合,因此在A 股市场,微型股在溢价效应的检验(对冲组合的等权收益率和横截面回归)中的影响力要远小于美股市场。

3.2 排序分组

我们统计了 2014 年 5 月至 2025 年 10 月期间,全部样本、大盘股、中盘股、小盘股和微盘股的基于 ESG 及各分项指标的加权收益率和等权收益率。这里收益率扣除了相同规模与价值分组的投资组合的加权或等权收益率。这些投资组合参考了Fama 和 French(1993)的 25 个规模价值分组,也是每月末基于对总市值和盈市比五等分的独立分组构建,五等分划分采用上交所主板的分位点。我们在设置排序分位点时,为了对不同规模分组的收益率进行有意义的比较,我们对 ESG 指标的排序采用相同的分位点,这些分位点适用于除微型股以外的所有规模组,这类似于 Liu 等(2019)在讨论中国股市异象时剔除总市值最小的30%的股票来构建规模、价值等因子。 从 ESG 指标分组的加权收益率来看,除微盘股外,全样本及其他规模分组中,ESG指标与收益率呈现出明显的正相关关系,ESG 指标较低的组合收益率要明显低于ESG 指标较高的组合。对冲组合的收益率随规模大小递增,股票规模越大的分组的对冲组合收益率越高。从 t 统计量来看,大盘股和中盘股的对冲组合的收益率都是显著为正的,表明 ESG 指标在这些样本中具有明显的预测能力。从它们ESG指标最高和最低组合的收益表现来看,对冲组合显著的正收益主要来源于ESG指标最低的做空组合,表明 ESG 指标在这些规模分组中有显著的负向筛除效果。ESG 指标分组的等权收益率的结果是类似的。一是除微盘股外,其他情形下ESG指标较低的组合收益率要明显低于 ESG 指标较高的组合。二是对冲组合的收益率随规模大小递增,但仅在大盘股和中盘股的样本中显著。三是大盘股和中盘股对冲组合显著的正收益主要来源于做空组合。

E 指标分组的加权收益率的表现为:一是 E 指标较低的组合收益率要低于E指标较高的组合。二是大盘股的对冲组合的收益率明显高于其他分组,且显著为正。三是做多和做空组合对大盘股对冲组合收益率都有显著贡献。与ESG 指标在大盘股和中盘股中有明显的预测能力不同,E 指标仅在大盘股中的预测能力明显。E 指标分组的等权收益率表现与其加权收益率类似,仅大盘股的对冲组合的收益率显著为正,且大盘股对冲组合的做多组合和做空组合都显著,表明在大盘股中,E 指标除了有负向筛除能力外,还具有一定的正向筛选能力。

S 指标分组的加权收益率表现为:一是 S 指标较低的组合收益率要低于S指标较高的组合。二是大盘股的对冲组合收益率明显高于其他分组,不过所有规模分组的对冲组合都显著为正。三是大盘股对冲组合的做多和做空组合的收益率都显著,中盘股和小盘对冲组合的显著正收益主要来源于做空组合,而微盘股对冲组合的收益则主要来源于做多组合。 S 指标分组的等权收益率表现与加权组合类似,不同的是大盘股的对冲组合收益率的显著性有明显提升,而中盘股和小盘股的对冲组合的显著性则有所下降。

对于 G 指标,无论是加权收益率还是等权收益率,全样本和各规模分组的对冲组合的收益率都是不显著的,其他分组的收益率也几乎没有显著的。综上,ESG 及各分项指标的预测能力主要表现为:(1)ESG 指标、E 指标的预测效果主要表现在大盘股和中盘股中;S 指标则在所有情形下都表现出预测能力,而 G 指标则几乎没有明显的预测能力。(2)从负向筛选效果来看,ESG 指标在大盘股和中盘股中明显,E 指标在大盘股中明显,S 指标在大盘股、中盘股和小盘股中明显。(3)从正向筛选效果来看,ESG 指标仅在大盘等权组合中明显,E指标仅在大盘和中盘的等权组合中明显,S 指标则在大盘股和微盘股中明显。

3.3 横截面回归

哪些指标具有显著的预测能力,而哪些指标对预测收益的边际能力很弱?这里采用 Fama 和 MacBeth(1973)提出的横截面回归方法来分析。不过FM 回归也面临一些潜在问题。与排序不同,回归对指标与收益率之间的关系施加了线性函数关系,但正是这种线性关系赋予了回归方法区分多个指标对收益率的预测能力。我们按月估计回归模型。对于盈市比,我们仅使用它的正值来估计斜率,用虚拟变量表示负值。考虑到 ESG 指标由其各分项合成而来,这里分别对ESG 指标及ESG各分项指标进行回归分析。 对数总市值的估计值均为负,且在除大盘股样本的其他情形中都显著,表明中国A 股市场存在显著的规模效应。估计值及其 t 统计量的绝对大小随着规模分组递减,则表明规模越小的分组中,规模效应更为明显。盈利小于 0 的虚拟变量的估计值在中盘股和小盘股样本中为负,表明这些样本中盈利小于 0 的股票的收益率要更低,但该估计值仅在中盘股样本中显著。

盈市比正值的估计值均为正,表明存在价值效应。不过该估计值仅在小盘股和微盘股样本中显著,可见中国 A 股市场的价值应效并没有规模效应那么明显。对数超额换手率的估计值均为负,且都是显著的,表明存在明显的情绪效应,超额换手率越高的股票的收益率越低。从该估计值及其t 统计值的大小来看,情绪效应在小盘股中最为明显,其次是微盘股和中盘股,大盘股中的情绪效应则相对较低。 ESG 评分的估计值均为正,且都是显著的,表明该指标具有明显的预测能力。从该估计值及其 t 统计值的大小来看,该指标在中盘股和大盘股的显著程度要高于微盘股和小盘股,这与排序分组的结果相似。 从 ESG 各分项评分的回归结果来看,G 指标在所有情形下的显著性都不足,而S指标则在所有情形下都显著,E 指标则在全样本和大盘股中是显著,这一结论与排序分组的结果也是相似的,这也表明 S 指标和 E 指标都具有独特的预测效果,共同形成了 ESG 整体指标的预测能力。

进一步的,我们比较横截面回归中各预测变量的估计值大小。从对数总市值的估计值比较来看,除了大盘股与中盘股的估计值之差不显著外,其他规模分组的估计值之差都非常显著,表明规模效应随样本股票规模递减的规律是显著的。盈利小于 0 的估计值仅在中盘股与小盘股、中盘股与微盘股之间的差异是显著的,在基础回归中,这一估计值仅在中盘股样本中显著为负,表明中盘股中负盈利带来负收益这一效应在更多体现在与小盘股和微盘股的对比上。盈市比正值的估计值仅在小微盘股与大中盘股之间的差异是显著的,在基础回归中,这一价值效应仅在微盘股和小盘股中显著,表明微盘股与小盘股中的价值效应的差距并不明显,同时他们的价值效应要明显强于中盘股和大盘股。超额换手率的估计值在小盘股与其他分组之间都是显著的,在基础回归中,情绪效应在所有规模分组的样本中都是显著的,其中小盘股的情绪效应最为显著,这表明小盘股的情绪效应比其他样本更强,而其他样本之间的情绪效应差异不大。

ESG 及其分项指标的估计值之差在所有情形下都不显著,结合基础回归的结果来看,这表明 S 指标的预测能力在不同规模分组样本中没有明显区别,ESG指标和E指标的预测能力在大盘股和中盘股中也没有明显区别。

4 稳健性检验

考虑到中国 A 股市场存在显著的情绪效应,而在排序分组中,我们仅剔除了规模效应和价值效应,因此这里我们考虑用 Liu 等(2019)的中国四因子模型对排序分组的收益率进行调整。因子构建过程中,样本筛选方法与之前相同,并进一步剔除总市值最小 30%的股票,Liu 等(2019)指出,中国股市存在独特的制度环境,即严格的 IPO 审核和盛行的反向并购。在中国反向并购案例中,83%的壳公司来自市值最小的 30%股票,因此构建因子时剔除了这部分股票,以避免壳价值干扰。市场因子收益率则为余下的 70%股票按照自由流通市值加权的收益率。规模因子和价值因子的构建如下:将余下的 70%的股票按照总市值大小分成数量相等的 2 组,分别为小盘股(S)和大盘股(B);同时又按照盈市比大小分成3组,其中盈市比最高的 30%的股票为低估值股票(V),盈市比居中的40%的股票为中估值股票(M),盈市比最低的 30%的股票为高估值股票(G)。这样就能将这 70%的股票交叉分组成 6 个组合,分别为小盘低估值组、小盘中估值组、小盘高估值组、大盘低估值组、大盘中估值组、大盘高估值组。这6 个组合也按照自由流通市值加权计算收益率。那么规模因子收益率为小盘低估值组、小盘中估值组、小盘高估值组这 3 个小盘股组合的平均收益率减去大盘低估值组、大盘中估值组、大盘高估值组这 3 个大盘股组合的平均收益率。价值因子收益率为小盘低估值组和大盘低估值组这 2 个低估值组合的平均收益率减去小盘高估值组和大盘高估值组这 2 个高估值组合的平均收益率。

情绪因子的构建如下:将盈市比指标换成超额换手率指标(最近1 个月的日均换手率除以最近 12 个月日均换手率),采用上述相同的分组方法构造出6个组合,分别为小盘低换手组、小盘中换手组、小盘高换手组、大盘低换手组、大盘中换手组、大盘高换手组。那么情绪因子收益率为小盘低换手组和大盘低换手组这2个低换手组合的平均收益率减去小盘高换手组和大盘高换手组这2 个高换手组合的平均收益率。

从 ESG 指标的结果来看,对冲组合加权收益率在全样本及各规模分组样本中平均提升了 0.16%,其中大盘股样本对冲组合的收益率提升最多,为0.28%,微盘股样本对冲组合则仅提升 0.02%。因此 t 统计量在除微盘股的其他规模分组样本和全样本中也得到明显提升,小盘股对冲组合的收益率也变得显著了。等权收益率的结果也是类似,但收益率提升的幅度相对较小,平均提升了0.09%。从分项指标的结果来看,E 指标的对冲组合加权收益率和等权收益率平均提升了0.06%和 0.08%,小盘股对冲组合的加权收益率、中盘股和小盘股对冲组合的等权收益率也变得显著了。S 指标的对冲组合的收益率则平均下降了0.05%和0.04%,使得小盘股对冲组合的收益率变得不再显著。G 指标的对冲组合收益率提升得最多,为 0.16%和 0.15%,不过也仅中盘股对冲组合的收益率、小盘股对冲组合的加权收益率变得显著。

5 主要结论与启示

投资ESG 表现优秀的公司能否为投资者带来超额市场收益呢?国外的调查研究(Riedl 和 Smeets,2021)显示,ESG 投资者对 ESG 基金收益的预期低于传统基金,他们愿意为符合自身社会偏好而放弃部分财务业绩。理论模型(Pástor等,2021;Albuquerque 等,2019)也指出,投资者持有ESG 表现相对较差的企业,需要额外的补偿;而 ESG 表现优异的公司能够降低系统性风险并提升企业价值,从而降低市场对企业股票要求的风险溢价,预期投资收益反而更低。尽管如此,国内外股票市场的实证检验并未得到一致的结论。国外的实证研究更多支持ESG表现优秀的公司能获得更高的收益,但在碳排放领域,投资那些碳排放水平越高的公司能也获得更高的收益。国内的实证研究对 A 股市场是存在ESG 表现与股票收益正相关的 ESG 正溢价还是还是它们之间件负相关的ESG 风险溢价,也未能得到一致结论,一个原因可能在于这些研究采用了不同的ESG 评级评分数据,而这些数据之间存在较大差异,因此得到的结果也不同。不过部分研究采用相同的ESG数据,也得到了相反的结论。其他原因则包括截面样本不同、时间区间不同、数据频率不同、实证方法不同等。为此,本报告基于股票覆盖较全的秩鼎的ESG评分数据,研究 2014 年 5 月至 2025 年 10 月这一长达11 年半的时间区间里股票收益与 ESG 表现的关系,通过严谨的研究设计对 A 股市场到底是ESG 正溢价还是ESG风险溢价的进行探讨,以避免因截面样本较少、时间跨度较短、实证方法不够稳健等问题。同时采用连续的 ESG 评分数据,相较于评级数据,更能揭示出ESG表现与股票收益的真实关系。

本报告参考 Fama 和 French(2008)关于探讨股市异象的排序分组方法和横截面回归方法,对中国股票市场 ESG 溢价现象进行分析,主要结论如下:2、A 股市场存在显著的 ESG 正溢价现象,这一现象在大盘股和中盘股中更为明显。具体而言,除微盘股外,全样本及其他规模分组中,ESG 指标与收益率呈现出明显的正相关关系。对冲组合(做多 ESG 指标最高的组合而做空ESG 指标最低的组合)的收益率随规模递增,其中大盘股和中盘股的对冲组合收益要更高,而且显著。横截面回归和行业中性的排序分组结果也显示出ESG 指标的预测能力在大盘股和中盘股中要更为明显。 2、ESG 各分项指标中,治理的正溢价现象不明显,而环境的正向溢价现象与ESG指标类似,在大盘股样本中较为明显,社会溢价现象则最为显著。具体而言:(1)G 指标在排序分组和横截面回归中都没有表现出明显的正向溢价特征,不过在行业中性的排序分组中,G 指标在中盘股和小盘股中表现出一定的正向溢价特征。(2)大盘股样本中,基于 E 指标的对冲组合的收益率明显高于其他分组,且显著为正。同时横截面回归也显示 E 指标在大盘股样本中有显著的预测能力。行业中性的排序分组下,E 指标的预测能力能扩展到中盘股和小盘股,但仍低于在大盘股样本中的表现。(3)S 指标在在全样本及各规模分组中都表现出与收益率的明显正相关,基于 S 指标的对冲组合的收益率的大小也相对较高且显著,横截面回归分析中也是如此。 3、稳健性检验中,将排序分组得到的对冲组合的收益率用中国四因子模型(市场、规模、价值、情绪)进行调整,各指标的显著性有所下降,但ESG 指标在大盘股样本中的对冲组合、S 指标在所有规模分组的对冲组合仍能取得显著的超额收益。行业中性的排序分组能提高 ESG、E 和 G 指标的预测能力,略微降低S 指标的预测能力,但并没有改变不同规模分组样本中指标的预测能力的排序大小。

基于以上结论,我们得出如下启示: 打破“花钱做公益”的偏见:在 A 股市场,企业搞好ESG 不再仅仅是成本负担,而是能实实在在转化为股价上涨动力的优势。投资者关注ESG,实际上是在捕捉一种能带来额外回报的长期因子。 投资策略建议——“抓大放小,重 S 与 E”:主战场方面,建议投资者主要在大盘股和中盘股中应用 ESG 策略,因为这些大公司受基本面和ESG 因素影响更深,而小微盘股更多受情绪和资金博弈影响(如换手率等)。核心抓手在于社会责任(S)和环境(E),二者是驱动ESG 溢价的“双引擎”。S 指标在所有规模股票中都好用,E 指标则是大盘股的加分项。二者共同构成了ESG 指标预测股价的核心能力。当前阶段,公司治理(G)得分的高低对股价涨跌的解释力度稍弱,这可能与 A 股当前的评价体系或市场关注点有关。因此,在构建策略时,应通过侧重 S 和 E 指标来增强收益。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告