学术活动

大家族的力量:亲人对代际流动的影响
发布时间:2021-10-24 发布者:盛倩
推荐人:中南财经政法大学财政税务学院 阮慧
原文信息:Adermon A, Lindahl M, Palme M. Dynastic human capital, inequality, and intergenerational mobility[J].American Economic Review, 2021, 111(5): 1523-48.
原文链接:https://www.aeaweb.org/articles?id=10.1257/aer.20190553

  一、引言

  代际传递关乎社会平等,对社会经济长期健康发展至关重要。对代际传递程度的估计,现有大量文献主要基于传统子女-父母回归模型(Child-parent regression model)和多代模型(Multigeneration model)研究父母及更高代祖先对子女产生的影响,进而估算出长期代际持续性(Long-run intergenerational persistence)系数,评估当前社会的代际流动水平。但既有估计方法仍有两个问题未能得到解决:(1)传统模型仅考虑父母对子女的影响,而多代模型也仅考虑父母、祖父母、曾祖父母,忽略了其他家族成员对孩子的影响,这可能导致长期代际持续性被低估;(2)多代模型所估计系数比传统模型更高,因此使用多代模型的学者认为传统模型低估了长期代际持续性系数,但如何解释两类模型估计系数的差异,学界尚未达成一致。

  为克服以上两个不足,本文基于瑞典丰富的行政数据构建了能够联接家族四代成员的大家族样本,通过建立大家族模型(Extended family model)研究更多家族成员人力资本对孩子人力资本的影响,用以估计长期代际持续系数。

  通过研究作者发现,大家族模型为长期代际持续性提供了一个更加严格的下限估计,长期代际持续性系数值在0.52-0.61之间,远高于传统模型所估计的系数,并认为传统模型至少低估了1/3的长期代际持续性。进一步,作者使用多代大家族模型研究发现,传统模型与多代模型均低估了长期代际持续性,而在大家族模型中多代与基准模型的结果相似,因此即便只有父母一代大家族成员的相关数据,大家族模型也能够得到长期代际持续性较为准确的估计。

  相较于以往的研究,本文的贡献主要体现在以下三个方面:一是本文为评估代际流动水平提供了一个全新估计量,通过考虑更多家族成员对代际流动的影响缓解了遗漏变量问题,弥补了此前文献的不足;二是为解释传统模型与多代模型的系数差异提供了实证证据。本文研究发现更高代家族成员对孩子的影响至少有95%可以由父母一代大家族成员所代表,传统模型系数相较于多代模型更小正是因为忽略了这些大家族成员;三是该种估计方法将会对评估不同代际流动模式以及旨在促进代际流动的具体政策等相关研究产生重大影响。

       二、计量模型

       1.1潜在变量模型与长期代际持续性

  传统子女-父母回归模型忽略了其他家族成员对孩子人力资本产生的影响,可能存在遗漏变量问题。为克服这一缺陷,作者囊括了更多的家族成员,构建了大家族模型(Extended family model)识别代际流动系数,具体模型如下:

  

  其中,yc*和yk*,k∈{p,sp,cp,...,K}分别表示孩子(c)和家族成员(k)人力资本的潜在变量,p(parents)表示父母,sp(sibling of parents)表示父母的兄弟姐妹,cp(cousin of parents)表示父母的堂(表)兄弟姐妹,K表示第K代家族成员,εc为误差项与各自变量相互独立。在该模型中,作者使用所有家族成员的人力资本均增加一个单位时孩子人力资本的变化来表示长期代际持续性,即长期代际持续性系数为

  在基准回归分析中,仅考虑父母这一代家族成员对孩子人力资本所产生的影响。在本文中,父母这一代所包含的家族成员共有6类,即父母、父母的兄弟姐妹(记作sp)、sp的配偶及其兄弟姐妹、父母的堂(表)兄弟姐妹及其配偶,如下图所示:

  

  因此,在基准回归模型中包含6个自变量,不考虑K≥2时祖先对孩子人力资本的影响。

  当仅考虑父母对孩子的影响时,模型(1)可被简化为传统子女-父母回归模型,即模型(2)

  

  这一模型被广泛应用于长期代际持续性估计的文献中。

       1.2 实证模型

  在实证过程中潜在变量yc*和yk*是无法直接观测的,作者首先建立了可观测变量与潜在变量之间的关系如下:

  

  uq为随机项在本文中可被视作测量误差,且各随机项之间满足相互独立。在本文中,作者对所有的yq都进行了标准化。

  使用可观测变量,作者建立如下回归方程(3):

  

  yc和yk,k∈{p,sp,cp,...,M}表示与潜在变量对应的各家族成员的可观测变量,且

       三、数据与关键变量

  本文要求样本中的家庭至少包含四代人,且在基准回归中父母一代的六类家族成员均至少有一位成员。

本文主要使用了以下4套数据:(1)国家登记数据:获取出生队列为1972-1993年孩子义务教育阶段的GPA,以及样本中父母的受教育年限(通过1970年人口普查数据进行补充);(2)教育等级数据:获取出生队列1972-1983年孩子的受教育年限;(3)税收登记数据:获取父母的收入信息;(4)人口普查数据:使用1970-1990年每间隔5年一次的人口普查数据获得父母的职业信息,基于职业获得与之对应的CAMSIS(The Cambridge Social Interaction and Stratification)指数值,其取值范围为0-100,该指数越高代表社会阶层与社会地位越高。

  其中孩子的GPA和父母的受教育年限分别作为基准回归中的因变量与自变量,自变量的值取自六类家族成员内部各成员变量的平均值,在拓展性分析中将父母的收入和社会阶层指数作为其人力资本变量纳入回归方程中。

       四、主要结果

  本文的基准回归结果如图1所示,作者研究发现传统子女-父母回归模型所估计的长期代际持续性系数为0.361,随着加入更多家族成员的人力资本变量,这一系数不断扩大。当包含了六类家族成员时,大家族模型所估计的对应系数为0.518比传统模型高43个百分点。这一系数可解释为当父母这一代六类家族成员的人力资本均增加一个标准差时,子女的人力资本增加0.518个标准差。

  

  作者进一步对比各类家族成员在大家族模型中所对应的系数大小发现,除父母以外,孩子的人力资本主要受到父母的兄弟姐妹、父母的堂(表)兄弟姐妹的影响,因此当数据中包含了这三类家族成员的人力资本信息时即可得到较为准确的长期代际持续性系数。下图1对上述表格结果进行了可视化,进一步印证了这一观点。与此同时,作者还通过理论分析、参考其他文献观点以及回归分析分别剔除了邻里效应、种族(Race)与民族(Ethnicity)效应、地区固定效应和学校固定效应,印证了基准回归结果的稳健性。

  

        3.1外部有效性

  本文的研究得益于通过瑞典丰富的行政数据集建立了更为庞大的家族联系,那么对于缺乏类似数据的国家或地区,本文的结论是否具有借鉴意义呢?在本文中,作者通过传统模型与大家族模型系数之间的正相关关系来说明结论的外部有效性。

  如下图2所示,作者基于样本计算了瑞典24个地区的传统模型和大家族模型的代际持续性系数,并分别以二者作为坐标轴的横轴和纵轴进行绘图。图中的拟合直线系数为0.869(0.180)且在统计上非常显著,说明了两个系数之间存在着正相关关系。基于此,作者认为本文结论的外部有效性可概括为两个方面:(1)可预测性:当一个国家或地区拥有更高的传统模型系数时,也意味着该地的大家族模型系数更高,对应长期代际持续性也更高,因此可以通过一个地区的传统模型系数来预测或推断该地的长期代际持续性;(2)可比性:基于两个模型系数的正相关关系,可以通过比较不同国家/地区以及不同时间点所求出的传统模型系数,得到对应的长期代际持续性的大小关系。

  

       五、拓展性分析

  在基准回归的基础上,作者基于大家族模型进行了以下四个方面的拓展研究:

    (1)替换自变量。作者使用Lubotsky and Wittenberg(2006)提出的变量构建方法,将受教育年限、收入、社会阶层指数三个变量视作一个包含更多维度信息的人力资本代理变量作为回归方程的自变量。由于纳入了更多维度信息,通过LW估计量得到了更高的代际持续性系数,其取值在0.465-0.597之间;

    2)使用IV模型估计长期代际持续性的上限估计。作者使用大家族中的其他家族成员人力资本作为父母人力资本的工具变量,通过2SLS(两阶段最小二乘法)估计得到长期代际持续性系数,其取值范围在0.60-0.66之间,比基准分析中的OLS回归得到的系数更高;

    (3)多代大家族模型。在基准模型的基础上,将祖父母及其兄弟姐妹、曾祖父母的人力资本作为自变量加入基准回归方程中,作者通过研究报告了传统模型、多代模型、大家族模型和多代大家族模型四类模型所估计出的代际持续性系数,并发现传统和多代模型均低估了长期代际持续性,大家族和多代大家族模型所估计的系数相似,因此在大家族模型中,仅使用父母一代家族成员的数据即可得到长期代际持续性较为准确的估计;

    (4)基因vs环境因素。最后,作者对影响长期代际持续性的因素进行分解,使用收养家庭的数据研究养父母及其家族成员的人力资本对孩子人力资本所产生的影响,剔除了基因因素得到后天成长的环境对长期代际持续性所产生的影响。通过研究作者发现有30%的长期代际持续性是由后天成长环境所造成的。

  六、结论

  本文基于大家族提出了一个全新的长期代际流动度量方法,为长期代际持续性提供了一个更加严格的下限估计,并发现传统模型至少低估了1/3的真实长期代际持续性。进一步作者使用多代大家族模型估计了长期代际持续性,发现对于大家族模型而言,仅需要父母一代家族成员的数据即可得到较为准确的长期代际持续性系数,这些家族成员可以代表更高代祖先对孩子人力资本产生的影响,其中在父母这一代,主要是父母、父母的兄弟姐妹以及父母的堂(表)兄弟姐妹的人力资本影响了孩子的人力资本。

  推荐理由:

  本篇文章提出了估计长期代际持续性的全新估计模型与方法,在该模型中囊括了更多家族成员,为长期代际持续性系数提供了一个更加严格的下限估计,弥补了此前文献中未能考虑除父母、祖父母、曾祖父母以外其他家族成员对子女产生影响的不足。这一估计方法的提出对于重新估计各国各地区的长期代际持续性以及评估促进代际流动的相关政策具有重大意义。且大家族模型估计长期代际持续性仅需父母一代大家族成员的信息,这为我们深挖各国丰富的行政与调查数据以研究相关问题提供了新的思路。与此同时,本文还为传统与多代两类模型所估计的系数差异提供了合理的解释,丰富了代际传递渠道的实证证据。然而,本文并未就代际传递的影响机制进行探讨,结合大家族模型与丰富的数据集进一步刻画代际传递的复杂过程并探讨其中的机制将成为这一话题未来重要的研究方向。