学术活动

在美国谁能成为发明家?接触创新的重要性
发布时间:2019-04-19 发布者:孙晨

1.jpg

推荐人: 中南财经政法大学财政税务学院 马婷钰
原文信息: Alex Bell, Raj Chetty, Xavier Jaravel, Neviana Petkova, John Van Reenen: The Quarterly Journal of Economics, Volume 134, Issue 2, May 2019, Pages 647–713,
图片来源: 百度图片搜索

一、引言

人们广泛认为创新是经济增长的源动力,因此许多国家的政府都制定了相应的政策,如税收激励或对教育的投资,去鼓励人们从事与创新相关的工作。已有的文献大多集中于从公司、产业或宏观的水平上去讨论政策对于创新行为的影响,而本文则着眼于发明家自身,通过研究在美国成为发明家的决定因素是什么,作者发现了提高创新率的新途径,特别是对于那些在创新行业处于弱势的群体。

由于缺少当代美国发明家的人口统计信息,如年龄、性别等,鲜有研究去讨论当代美国发明家的情况。本文将1996至2014年美国的专利数据与税收记录进行匹配,得到了覆盖超过120万名发明家的面板数据。利用该数据集,作者追踪了发明家从童年到成年的生活轨迹,从而给出了当代美国发明家的详细信息。进一步,文章想要研究,究竟是先天的能力(nature)还是后天的环境(nurture)决定了个人是否成为发明家。

在第一部分,文章展示了对于初始特征不同的个体,其在创新方面存在巨大差异。具体来看,父母收入在前1%的孩子,未来成为发明家的可能性是中低收入家庭孩子的十倍之多;白人成为发明家的概率是黑人的三倍左右;在40岁左右的发明家群体中,超过80%的人是男性。目前对于这种差异的解释,主要有以下两种观点:一种认为是基因导致的个人天赋不同或不同个体对于特定行业的偏好;另一种则认为是家庭背景各异的儿童在不同的环境中成长发展从而促使其去选择特定的职业路径。

针对第一种观点,作者使用早期的数学成绩作为个体能力的代理变量,来研究能力对于创新差异的影响。文章发现:(1)三年级的数学成绩只能解释不同收入家庭孩子创新差异的三分之一。而随着年级的提高,成绩的解释力度在逐渐增强。(2)成绩对不同种族和不同性别个体间创新差异的解释力度微乎其微。(3)对在同一所大学就读的学生,个体间创新率的差异明显小于整个样本中的差异。因此作者认为,对于来自不同家庭收入背景的孩子,即使在早期站在相似的起跑线下,但随着后天的学习和发展,低收入家庭的孩子总是会落后于他人,而这种现象有可能是因为童年环境的不同而导致的。

在第二部分,作者直接研究环境对于创新的影响。文章证明,儿童通过父母或父母的同行增加了接触创新(exposure to innovation)的机会,这使得他(她)未来成为发明家的可能性大大增强。具体来看,在高专利率通勤区成长的孩子未来更有可能成为发明家,并且成年在这类地区工作也能观察到这种影响。这种模式不仅适用于分析个人是否去选择创新,也可以分析其从事创新活动的领域,而且在细分下的技术类型中依然成立。并且,这种模式是具有特定性别的:女孩倾向于在女性专利率高的行业从事创新活动,男孩则更多受到男性发明家的影响。

接下来,为验证童年时期接触创新是否影响个人从事创新相关的工作,作者使用童年时期家庭发生过搬迁行为的样本,研究家庭搬迁的时间对孩子未来专利率的影响。文章发现,儿童搬到高专利率社区的时间越早,其未来成为发明家的可能性就越高。

最后,作者通过追踪发明家的职业轨迹来观察创新行为给不同群体带来的回报率的变化,从而了解什么样的个体能够在创新部门被筛选出来。研究发现,无论是在整个发明家群体还是在明星发明家中,女性和贫困儿童都处于弱势地位,而因为缺乏接触创新的机会,在现代社会中存在许多“丢失的爱因斯坦”(lost Einsteins)——那些本可以在创新领域创造有价值的成果的人。作者通过一个反事实估计发现,如果在创新行业的弱势群体和其他人一样有相同的发明率,当代美国发明家的数量将是现在的四倍之多。

二、数据

本文包括以下三套数据集:

1. 专利记录

作者从Google数据库和Strumsky数据库分别中选取了1996—2014年美国居民的170万项专利授权记录及2001—2012年的160万项专利申请记录。并从美国专利商标局中获得了发明家的地理位置、其专利所属行业的代码和特定时段内的专利引用次数。

2. 税收记录

根据联邦所得税记录中得到1996—2012年美国发明家的相关信息,包括年龄、性别、地理位置、个人及其父母的收入。从社会保险记录和工资税务等相关报表中可得发明家的姓名和城市。

3. 纽约城学区记录

从纽约城学区数据中可以获得1988—2009年中覆盖250万名学生的个人3-8年级的历年数学及英语成绩(2002年7年级的英语成绩除外)。 本文使用的样本有以下三类:

1. 发明家全样本

此为通过专利记录和税收记录匹配构建的面板数据,其中包括大约120万名美国发明家的相关信息,时间跨度为1996—2012年。

2. 代际样本

主要包括1980-1984年的出生队列,这些个体可以和父母联系起来并且截至2013年底仍然是美国公民,该样本中包括1640万个体,其中约34000名为发明家。

3. 纽约城学区样本

主要包括1979—1985年的出生队列,其中有43000名儿童,452名为发明家。

本文的核心解释变量包括个体收入、父母收入、地理位置、大学入学情况和考试成绩,具体定义文中有详细介绍,在此不赘述。

本节最后,从描述性统计(表1)可以发现,在发明家全样本中,专利引用数和专利申请数的分布十分不对称,个人工资收入和总收入亦是如此。此外,该样本中女性发明家的比例仅为13.1%。

2.png 3.png

三、发明家的初始特征

本节主要基于个体初始特征的三个维度,包括父母收入、种族及性别,去讨论不同个体间创新率的差异程度,并研究个人能力对该差异的解释力度。

1. 基于个体初始特征的创新率差异

1.1父母收入

从发明家全样本中作者发现,父母收入越高的家庭,后代中发明家的总数量(每千人)及引用率在前5%的发明家数量(每千人)就越多(见图1和图2),从而排除了以家庭面临的流动性约束和资源差异或高收入家庭获得的专利是低价值或防御性的来解释不同家庭中创新率存在的差异。作者后续以年龄更大的样本进行了检验,仍然得到相似的结果。

4.png 5.png 5.1.png

1.2 种族

使用纽约城学区样本,作者发现,在白人非西班牙裔和亚洲人中,发明家的数量(每千人)明显高于黑人非西班牙裔和西班牙裔群体(见图2第一列)。在控制了不同种族群体中家庭收入的差异后,虽然发明家的数量略有变化,不同种族间创新率的差异仍然没有消除(见图2第二列)。

6.png

1.3 性别

使用代际样本进行分析后发现,不同性别间创新率的差异随时间变化而改变:在1940年的出生队列中,7%的发明家为女性,而到1980年的出生队列,该比例为18%,女性发明家的占比以每年0.27%的收敛率在缓慢增长。按照这个趋势,至少需要118年才能达到发明家群体中的性别平等(见图3)。

7.png

2. 个人能力能解释创新率的差异吗?

在这一部分,作者使用数学成绩作为个人能力的代理变量来检验能力对于初始特征不同的群体创新率差异的解释程度。

首先,在控制了不同家庭收入的儿童考试成绩后,通过计算创新率差异的变化程度,作者发现成绩对于不同家庭收入群体的创新率差异的解释程度仅占整体的31.2%(见表2)。

8.png

进一步,作者分析了在不同成绩区间,高、低收入家庭中儿童未来成为发明家的数量(每千人),结果表明,成绩在前5%的群体中,来自高收入家庭的儿童成为发明家的可能性是低收入家庭的2倍(见图4)。因此作者认为,个体是否成为发明家不仅依赖于先天的能力,同时也依赖于他是否来自于高收入的家庭。

9.png 1.png

接下来,作者使用相同的方法用更高年级的成绩进行检验。结果表明,随着年级的提高,成绩的解释能力在不断增加(见图5)。若将此趋势外推,在刚出生的时点上,成绩仅能解释全部差距的5.7%;而在高中结业的时点,成绩的解释能力达到60.1%。因而作者认为,来自不同收入家庭的孩子,即使早期站在相似的起跑线上,但随着后天的学习,低收入家庭的孩子总是会逐渐落后其他人,这背后的原因或许是童年环境的差异。

10.png

后续,作者又发现对于不同家庭收入的儿童,在进入同一所大学就读后,未来创新率的差异明显小于发明家全样本中的差异(见图6),从而佐证了影响个体创新率的大部分因素是产生在进入劳动力市场之前的。

11.png 12.png 2.png

接下来,作者又检验了对不同种族的群体以及不同性别的群体,能力对于创新率差异的解释程度,均发现其解释强度并不大(见图2第三列、附录表2)。

13.png 14.png

四、童年环境与接触创新

在第三节的分析中,如果以成绩能够有效的解释个人能力,即使没有环境的作用,上述群体间创新率的差异仍然可以被观察到。因此本节从父母,与父母同行业的工作者和邻居三个维度,直接检验童年环境对创新的因果影响。

1. 父母

文章以不同行业中共有发明家的份额作为度量行业间相似度的标准,份额越大则行业相似性越高。在假设相似行业中先天能力不会影响个人选择成为发明家的倾向后,通过研究儿童是否更有可能在其父亲所处的行业获得专利,从而识别接触创新的因果影响。

从图7(A)可以看出,儿童最有可能在其父亲所处的行业中成为发明家,而在下一个相邻的行业中,这种可能性明显下降,而产生这种结果的可能原因即童年环境的差异使得儿童接触创新的机会不同。

15.png 3.png

在此结论下,作者认为个人是否成为发明家取决于下述公式:

16.png

其中,α_ic为个人能力,e_ic∈{0,1}为父亲在某一行业是否获得专利,则β为接触创新的因果效应。将之前的假设以公式表示为:

17.png

则在此假设下,图7(A)的结果可以解释为是由于接触创新的机会不同产生的。

2. 同事

与上述方法相同,作者通过验证儿童是否更倾向于在其父亲同事所处的行业获得专利来识别环境的因果效应,表3第一列的结果说明父亲所在行业的专利率对儿童创新率有显著为正的影响。

18.png 19.png

后续,作者引入细分的行业固定效应来进一步验证这种因果效应的存在,实证方程如下:

20.png

其中,y_cj为后代所在的父亲所属产业j下属行业c的专利率,P_(c+d)为产业j下属行业c+d的平均专利率。该方程的前提假设为:

21.png

即在相似行业之间,扰动项与行业间的平均专利率无关。图7(B)的结果进一步证实了儿童倾向于在父亲所处的行业获得专利。

22.png 4.png

接下来,作者又进行了一系列敏感性分析,包括改变行业间距离的定义,在不同层级的行业划分下进行检验(表3第2-4列),并控制了同一层级其他行业的专利率(表3第5列),结果依然相似。

3. 邻居

这一部分,作者检验社区内邻居的专利率对儿童未来从事创新活动的影响。

作者发现,在美国的中西部,沿海以及东北部这些创新活动多的地区,儿童的专利率也越高(见图8(A))。并且不同社区的平均专利率与未来成为发明家的儿童数量有显著的正相关关系(见图9)。

23.png 24.png 25.png

接下来,作者使用相同的方法验证了儿童倾向于在其邻居所在的行业获得专利(见图7(C))。

26.png 27.png

后续的稳健性检验,包括:(1)对社区内的全样本和发生搬迁的样本分别进行检验(表4第1-2列);(2)在细分的目录下重复上述分析,并且引入了父亲所在行业的固定效应(表4第3-5列);(3)改变行业距离的定义,并控制了同一层级不同行业的平均专利率(表4第6-8列),依然可以得到相似的结果,从而证实了社区对儿童创新具有因果影响。

28.png 29.png

进一步,作者又检验了接受创新的因果效应在性别上的异质性。结果表明,女孩更倾向于在女性发明家专利率较高的行业从事创新活动,而男孩则主要受男性发明家的影响(表5第2-3列),在对行业进一步划分后依然得到相似的结果(表5第4-5列),从而排除了女性对特定行业的偏好于结果的影响。

30.png 31.png

4. 创新水平方面的邻里效应

在这一部分,作者验证在童年接触创新对儿童未来选择从事创新行业的因果影响。沿用之前论文中的方法(Chetty et al.,2018),本文基于在不同时间搬迁的儿童相互可比的假设下,讨论儿童未来成为发明家的可能性随搬迁到高专利率社区的初始时间如何变化,方程设定如下:

32.png

其中,y_i表示儿童在2012年是否成为发明家,m_i表示其搬迁的时间,Δ_od表示搬迁前后的两个社区专利率之差,X_i是一系列的控制变量。在假设后儿童搬迁的时间与其未来的潜在产出无关后,结果表明,儿童搬迁到高专利率社区的时间越早,未来成为发明家的可能性就越高(表6第1列),此结果在控制了初始社区的专利率后依然成立(表6第2列),并且在不同的出生队列也能得到相似的结论(表6第2-3列)。最后,作者测算了童年接触创新的影响程度,发现社区的平均专利率每提高1%,儿童未来成为发明家的概率会提高2.04%(表6第4列)。

33.png

因此,在童年接触创新不仅会影响儿童从事创新的领域,还会影响其是否选择从事创新行业。

五、发明家的事业:“丢失的爱因斯坦”

在本节,作者通过分析从事创新活动给初始特征不同的群体带来的回报率的变化,来研究何种类型的群体能够在创新活动中脱颖而出。本文使用个人收入(私人回报的测量指标)和专利引用率(社会影响力的代理变量)来度量创新的回报率。文章发现:(1)收入在不同类型的群体中分布十分不对称(附录图5(A)),并且个人的社会影响力与其收入间存在明显的正相关关系(附录图5(B));(2)对于初始特征不同的群体,弱势群体的个人收入和专利引用率总是略低于其他的群体(图8)。

34.png 35.png 36.png 37.png 38.png 39.png

已有文献中,有研究通过行业的进入壁垒来解释个体不同的职业选择,认为在创新行业筛选出的边际发明家往往是能力较低者,所以弱势群体中的发明家应当较其他人来说有更高的产出。本文的研究结果与此不同。文章发现,对于女性和贫困儿童,不论是在明星发明家还是在整个发明家群体中,其都处于弱势地位。更重要的是,该结果说明在当今社会存在许多“丢失的爱因斯坦”(lost Einsteins),这些个体由于在童年时缺乏接触创新的机会而不能从事创新活动。作者通过一个反事实估计得到,如果来自弱势群体的人和其他人一样有相同的创新率,美国的发明家数量是现在的4倍之多。

六、结论

本文将美国的专利记录与税收记录相匹配,通过追踪发明家从童年到成年的生活轨迹,从而识别出在美国成为发明家的关键因素—在童年时期接触创新。因为在童年时期缺乏接触创新的机会,使当今社会上存在许多“丢失的爱因斯坦”。因此,探究如何提高弱势群体接触创新的机会应当是未来研究的方向之一。