失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 关于顶级外刊工具变量的使用最全策略 不收藏反复读就不要谈IV估计!

关于顶级外刊工具变量的使用最全策略 不收藏反复读就不要谈IV估计!

时间:2024-04-24 18:40:24

相关推荐

关于顶级外刊工具变量的使用最全策略  不收藏反复读就不要谈IV估计!

关于下方文字内容,作者:仇旸,英国华威大学经济学,通信邮箱:Yang.Qiu.1@warwick.ac.uk

注: 文章中有些地方不一定准确,建议读完之后再看看原文。

David F.Larcker & Tjomme O.Rusticusb. On the use of instrumental variables in accounting research, Journal of Accounting and Economics, Volume 49, Issue 3, April , Pages 186-205.Instrumental variable (IV) methods are commonly used in accounting research (e.g., earnings management, corporate governance, executive compensation, and disclosure research) when the regressor variables are endogenous. While IV estimation is the standard textbook solution to mitigating endogeneity problems, the appropriateness of IV methods in typical accounting research settings is not obvious. Drawing on recent advances in statistics and econometrics, we identify conditions under which IV methods are preferred to OLS estimates and propose a series of tests for research studies employing IV methods. We illustrate these ideas by examining the relation between corporate disclosure and the cost of capital.一.概述

当回归变量为内生时,工具变量(IV)法在会计研究中得到了广泛应用,比如盈余管理、公司治理、高管薪酬和披露研究。根据课本,IV估计是解决内生性问题的标准方法,但它在典型会计研究场景中并不那么适用。依据统计学与计量经济学的最新进展,作者确定了IV法优于OLS估量的条件,并对使用IV法的研究做出了检验。文章通过检测公司披露与资本成本的关系,进而阐述这些观点。二.前言

工具变量(IV)法通常被运用于会计研究中,以通过观测数据解决一些计量问题,比如结果变量和解释变量被同时确立(联立方程偏差问题)。然而,当一个变量同时影响结果变量和解释变量但并没有出现在回归方程中时,相关变量遗漏偏差问题就会出现。上述的两个问题在会计研究中都是普遍存在的,为了解决这样的问题,工具变量法被应用在多方程模型(以解决联立问题)和单一方程模型(以解决遗漏变量问题)中。在传统IV应用过程中,研究人员首先要选择一系列外生变量,然后使用二阶段最小二乘法(2SLS)或其他相似的方法来估测回归模型中的系数。如果研究人员可以找到合适的工具变量,即与内生回归变量有关但与结构方程的误差无关,上述关于内生性问题的解决方法就可以使用。然而,这样的工具变量很难找到:Maddala质疑了工具变量的来源,Reiss和Wolak也讨论了如何寻找工具变量,并指出只要在内生变量中加入随机误差,就可以得到最佳的工具变量。所以,研究人员有必要知道使用不适合的工具变量的后果。本文旨在评价IV在会计研究中的应用,综合统计和计量经济学中关于IV估计量的大量文献,并为会计研究者提供一个IV法的使用指导。文章的分析结论以及数据模拟结论指出,当工具变量与回归变量弱相关时,即使该工具变量内生性很小,IV法估测仍会导致高度偏倚。在这种情况下,相对于完全不纠正内生性问题的OLS法而言,IV法估测结果更加偏倚,更可能导致错误的统计判断。但是,作者并没有表示会计研究的内生性问题无法解决。相反,文章指出研究人员有必要通过经济原理证明工具变量,并对弱工具变量以及过度识别的限制条件进行针对性测试。作者也认为OLS结论对不可观测相关变量的敏感性评估也是十分有用的,相关方法可以参照Frank(2000), Rosenbaum(2002), DiPrete and Gangl()相关文献。三.工具变量在会计研究中的应用

为了了解IV估测在会计研究中的应用,作者在《会计研究期刊》、《会计与经济学杂志》以及《会计评论》中检索了1995至“2SLS”,“3SLS”,“instrument variable”和“endogeneity”术语。作者发现有42篇文章将IV法应用在了盈余管理、外部披露、其他财务会计主题、管理会计、审计和公司治理研究中。会计研究人员通常使用工具变量以减轻由内生预测变量或联立方程系统导致的偏倚。在42篇文章范例中,有15篇将IV法应用在单一式子2SLS中,7篇将IV法应用在赫克曼型模型中,20篇应用在了联立方程模型中。IV法应用在主要实证结果或稳健性分析的比例大致相等。然而不同于寻常鲁棒性检测的是,研究人员经常认为,如果IV和OLS的估测结果相似,其研究结果对内生性就是稳健的。但如果有理论性原因质疑严重的内生性问题,两种方法结果的相似性也可能表明所选工具变量是不恰当的,而报告的结果不受内生性影响。通常来说,在传统会计研究中,几乎没有人建立一个模型来明确指出且证明变量的内生性以及工具变量的外生性。相反这些变量要么是预先确定的,要么是在所研究的模型之外。这些研究的作者们应该清楚的解释他们为什么选择这些变量,而不是选择这些变量以后再证明。因此,理想步骤应该是这样的:

建立一个关于利益关系决策过程的经济理论,

将理论转化为一组描述决策设定的结构方程模型,

准确识别内生变量和外生变量,

建立简化方程,其中内生变量只是外生变量的函数,

估计简化模型的参数,

那么包含利益关系的结构方程模型的系数就可以从简化模型的估计系数中得到。

作者在调查中发现,大部分会计研究人员估测的是“方便形式”模型,这种模型被假定为基本结构方程模型恰当的简化形式。此外,几乎没有人讨论工具变量的选择问题。他们没有讨论为什么这个工具变量被假定为外生的(即与结构模型误差不相关),也没有讨论为什么工具变量与结构模型误差的相关性比内生回归变量小。这可能是因为更完整的分析并没有展示出来,而是保留在了研究人员的原始文档中或者与审阅人员的通信记录中。例如,如果一篇文章几乎没有对工具变量的进行证明,这可能因为研究人员和审阅人员都认为该变量的选择是无可厚非的。同样,研究人员也可能针对审阅人员意见而做一些工具变量的估测,但并不想过度增加论文的篇幅。但本文作者认为,为了让读者可以评价工具变量估测的质量,研究人员需要对该工具变量进行详细的阐述及证明。并且,对系数估测以及第一阶段模型解释效能的阐述也是很重要的。但通常来说,第一阶段模型的估测结果并没有得到足够详细的解释,因此无法判断IV法应用的充分性。其中一个问题是第一阶段模型的R2是整个模型的解释效能,而不是针对该模型特有的工具变量的部分解释效能。因此,第一阶段模型解释效能的使用会导致该模型中工具变量强度的夸大。最后,会计研究者经常使用经典的Hausman内生性检验法 (或对Heckman选择模型中的逆米尔斯比率的检验)。然而在Hausman检验之前,这些研究应并没有进行过度识别限制试验,使得评估IV应用的有效性变得极其困难。

六.工具变量估测推荐步骤(表4)

描述研究问题所基于的经济原理,以明确内生性问题。比如,某个理论所包含的一个关键控制变量可能很难得到或者很难测量,主要回归变量为选择变量,或者因果关系方向不确定。在解释内生问题时,作者建议尽可能讨论出偏倚方向。如果研究者可以标出偏倚方向,当这个方向与检测的假设不一致时,就可以忽略内生性问题(统计检测保守性)。大多数情况下,上述情况几乎不会发生。比如,当私有成本导致风险公司披露的公共信息质量较低且该公司的资本成本较高时,如果在分析中忽略企业风险,则会使OLS对资本成本披露影响的估计偏低,有利于“披露质量提高导致资本成本降低“的假设。

寻找解决经济问题的多种方法。除了使用工具变量,研究人员也可以通过添加控制变量或固定效果来缓解内生问题,但很难找到需要的变量。比如固定效果不会在上述披露问题中起作用,因为变量的时间变化通常很小(比如披露质量),且与公司表现的变化相关。另外,文献也指出披露的承诺(而不是一次性改进)才是资本成本效应的驱动因素。

通过经济原理论证该工具变量将影响x变量且与第二阶段误差项无关。一个好的工具变量不仅要来自系统之外,还只能通过x来影响y变量。那么如何证明变量不相关呢?尽管这个问题很难回答,但可以通过一些步骤来加强读者对该工具变量选择的信心:首先,要清楚的解释为什么选择这个工具变量(而不是选择一个IV然后证明);其次,可以尝试预测该变量内生性的潜在原因,并证明这些影响要么很小,要么受模型中其他变量的控制。

第一阶段估测。在第一阶段估测中,所有自变量(不仅是选择的IV)都应该被包括,并且讨论IV的符号是否与预期一致,大小是否合理,系数是否统计显着。另外,还需要做弱工具变量的检测——部分F统计变量和部分R2——如果IV为弱工具变量,需要使用Moreira(2002)的结论进行显着测试。第一阶段R2为IV内生性程度设置了上限(即2SLS偏倚小于OLS)。如果回归变量与IV相关,则需要进一步解释为什么IV的内生性小于回归变量。如过IV的解释效能很低,则需要证明该工具变量是否具有足够的外生性。第二阶段估测。在这一步,需要讨论IV系数的大小(而不只是关注系数的方向以及统计显着性)。如果该系数解释效能很低,通常来说在第二阶段模型中,IV系数估测值将不可思议得大或小,进而证明IV估测不可信。

工具变量选择的灵敏测验。如果有多个工具变量,就需要进行过度识别限制检测以及不同IV估测结果的相似性证明。如果不同IV结果不同,那么IV的适用性就值得怀疑,且至少一部分工具变量不是外生的。研究人员也要对OLS和IV估测结果进行比较,以观察内生变量的符号与预期是否一致。比如,如果遗漏变量导致OLS向上偏移,那么IV估测值应该比OLS小。两种估测值差的显着性测试可以通过Hausman检测进行。

OLS法与IV法的比较。这一步里,不仅要讨论2SLS结果是否优于OLS,还要了解什么时候二者有一样的符号、相近的大小以及显着水平。担忧两点需要注意:A). 优先样本和弱工具变量文献指出,即使IV绝对外生,IV估测量的偏移方向仍与OLS一致;B). 当回归变量与误差项有关,其决定因素也与误差项在同一方向相关。这表明,如果使用任一决定因素为工具变量,2SLS估测值将于OLS偏倚方向一致。因此,如果研究中的工具变量为弱工具变量或具有半内生性,IV估测值不可以代替OLS估测值,且不能用于OLS结果的支撑。

七.企业披露以及资本成本

作者检测了自愿披露对公司资本成本的影响。尽管之前的研究都认为披露是外生的,近年的研究则意识到了披露决定的内生性。IV在资本成本决定因素上的应用和结果在不同的研究中有所不同。Leuz and Verrecchia (2000),Hall (2002)以及Brown and Hillegeist ()发现披露代理与资本成本的选择负相关。但Cohen ()在考虑了披露质量内生性后发现二者的关系并不显着。本文旨在说明使用IV估测法的研究者所面临的选择和问题。但除了内生性问题,其他问题也需要注意,比如资本成本与公司披露的测量误差问题。变量的测算

作者通过测量隐含资本成本以计算资本成本:使用四种隐含资本成本的平均值以获得最小的测量误差。

作者通过AIMR披露率测算披露:如式8所示,该分数的范围为[0,1],表示每年最公开的公司分数为1,最不公开的为0。因此,披露质量的系数就代表最公开和最不公开公司资本成本的差。

(8)

内生性对研究问题的影响

对于披露质量是否具有可分散的特性,以及披露质量是否会影响资本成本等问题,理论界鲜有共识。

不清楚信息披露的影响是通过参数不确定性还是信息不对称产生的。

金融文献中缺乏对风险因素定价的共识,从而使得识别控制变量或选择适合的工具变量十分困难

自愿披露是一个选择变量且受许多因素的影响,包括任何资本收益成本。

因此上述影响的方向因内生性问题而难以确定。比如有风险的创新公司可能有很低的披露质量,因为它们的财务状况难以预测,且公司也希望保护其专有资料,进而导致披露质量与资本成本负相关。而对于一些高风险和不确定性的公司为了减少资本成本,会尽可能加强它们的披露质量,但如果这样的公司没有完全实现这一目标,资本成本与披露质量将会表现出正相关。因此,披露变量内生性导致的偏倚是很难确定方向的。这里作者选择了之前用作披露工具变量的一组变量,而不是如之前所说的通过经济原理选择工具变量。这是因为披露选择利弊相关的经济模型并没有被设计出来,也因此无法证明该工具变量的选择。变量的选择通过以前的文献,作者将工具变量定为所有者(普通股股东)数量的自然对数、年销售增长、资本强度(财产、厂房和设备在总资产中的比率)、营业利润率(销售额-销售成本)、营业周期长度(平均应收账款除以销售额+平均存货除以销售成本)以及六大审计机构的存在。因为工具变量反应公司的特点,所以证明IV满足需要很重要。比如,六大审计机构的存在会提升公司收益报表以及其他披露的质量,但审计机构的选择是内生的且可能被公司整体信息披露政策影响。或者长的营业周期是公司表现的预测变难,进而降低披露质量,但它也与公司运营风险有关,可能导致披露质量第二阶段系数向下偏倚。另外,控制变量为股权市场价值的对数,账面权益对市值比率、分析次数、杠杆(债务总额/权益市值)和资产回报率(折旧后营业收入占总资产比例)。作者用1982-1996每年7月1日的数据来计算资本成本。为了减少异常值影响,只考虑1%-99%的数值。在从每个变量减去行业年的具体平均值之后(以消除时间和行业的影响),回归方程为一个混合的时间序列截面。表5为数据统计。

估测结果(表6)

OLS结果显示,最公开公司的资本成本比最不公开公司的高0.06%但统计不显着。用2SLS估测法时,第一阶段模型R2为9,但由于控制变量也包含在了该模型中,工具变量的解释效能有所夸大。当排除控制变量后,部分R2大约为0.5%,第一阶段模型部分F统计量为2.59。较低的F统计量反映出弱工具变量问题,且需要运用鲁棒推理过程。因此,作者使用条件统计量。较低的部分R2反映出抽样的微小变化会对第二阶段的结果产生很大的影响,进而导致样品和年分之间的系数出现大跳跃。因此需要评判IV估测是否优于OLS。从之前的分析可知,只有IV与结构误差项相关性的平方必须小于披露质量和结构误差相关性平方的0.5%时,IV估测法才会优于OLS。因此,所选择的工具变量必须比披露质量更外生,才能保证2SLS估测更准确。尽管两个相关性不可检测,且它们之间的比较也不能直接测量,但可以肯定的是在本文的实验中,这一条件很难达到。因此,IV估测法的偏倚更大,OLS估测法更适用。尽管已经确定2SLS法不准确,为了说明作者仍进行了第二阶段模型检测。披露变量系数显示最公开公司的资本成本比最不公开公司高5.31%且统计显着,但问题是这个检测的显着水平是基于标准渐进理论的,且在弱工具变量存在时结果很具有误导性。但当通过条件统计量法检测时,作者发现条件系数的Wald统计量超过了95%和99%模拟临界值。为了检测2SLS法的质量,作者使用系数大小检测法。披露质量系数(-5.31)大约为资本成本均值的45.7%,但这显然时不可能的。2SLS法和OLS法的比较是通过标准Hausman法进行的。在本文的实验中,Hausman检测拒绝了披露质量的外生性(F=10.47,p<0.001)。研究人员因此认为2SLS法更加适用。但该结论的有效性只局限于恰当工具变量的选择,因此只进行Hausman检测是无法证明披露质量系数是否统计显着。表6的最后两列是灵敏性检测(unconstrained second-stage)。模型是资本成本对所有自变量的OLS回归模型。为了简化比较,每个自变量都有其原始值与第一阶段系数的乘积代替。因此每个工具变量系数都等于披露质量的第二阶段系数,其中该IV是唯一工具变量且其余IV均被视为控制变量。如果该工具变量可用,每个工具变量的系数都应该相似,因此接近2SLS估测值。但表中的结果显示系数变化很大。比如,如果将所有者数量定为单一IV,系数为183%(最公开的公司将会产生极高的资本成本);但如果资本强度或营业林润率被设定为IV,最公开的公司资本成本比最不公开的低20%。由于这一方法所得出估测值的范围很大,过度识别限制检测拒绝了工具变量内生假设(χ2=38.0,p=0.001)。因此,灵敏性检测和过度识别限制检测结果表示,所选的工具变量并不适用,因此OLS法更加适用。但是在使用过度识别限制检测时,有三点需要注意:

Hahn and Hausman ()指出,由于渐进大小变化,有限样本检测的大小也会由明显改变,进而导致错误拒绝虚无假设。

当样本很大时,这个检测的效能可能会很大,导致即使2SLS法优于OLS,很小的偏差也会导致该检测拒绝虚无假设。但当样本较小,检测效能则会不足。因此该测试应该与灵敏检测相结合使用。

当所有工具变量都存在同样的问题时,过度识别限制检测与灵敏检测均不会反映出问题。即,如果所有IV都导致同一方向、相似大小的偏倚,过度识别限制检测不会拒绝虚无假设,但内生变量的系数估测值将产生严重偏倚。因此这一检测法应用于被经济原理证实的工具变量的检验,而不是工具变量的选择。

通过上述所有步骤,作者得出结论:在这个实验中,OLS法优于2SLS,即使披露质量具有内生性。八.其他方法

尽管在这个实验中OLS法更加适用,优于x变量的内生性,OLS结果也是偏倚的。那么如何评估OLS结果呢?即,内生问题应该多大才会影响OLS结果(系数统计不显着)。因此,作者用有效买卖价差代替隐含资本成本,以进行扩展实验(实验结果为表7)。

作者从ISSM和TAQ数据库获取交易和报价以计算相对买卖价差,则有效相对价差为交易价格与买入及卖出价中点的差额占交易价格的比例。作者首先根据Ng等人()的方法清理并聚合交易数据,然后将数据与样本匹配并得到了1398个公司-年份观测值。结果发现披露质量与有效价差负相关且统计显着。接着作者用Frank (2000)中的方法测试了未观测到的混杂变量的潜在影响。该方法是基于与x、y变量相关的不可观测变量对结果的影响。Frank推导出将统计上显着的结果转化为不显着结果所必需的最小相关性,并将y与混合变量的偏相关和x与混合变量的偏相关使系数在统计学上不显着的最小乘积定义为混合变量的影响阈值(ITCV)。当ITCV较高,OLS结果对遗漏变量有鲁棒性。第三列显示了披露质量的ITCV为-0.028,表示x和y与未观察到的混淆变量之间的相关性只需约为

就可以推翻OLS结果。因为披露与价差负相关,其中一个相关性需为负,否则混淆变量将会加强披露的影响。为了证明ITCV足够小(以说明披露与价差的OLS关系脆弱),作者为涉及不可观测的混杂变量相关性的大小制定了一个基准。但这个实验没有不可观测的混杂变量,所以用其他控制变量代替。第四列显示了不同自变量的加入对披露质量系数的影响。影响的方向代表了该控制变量的加入对披露质量系数的影响——正影响表示变量的加入使披露质量系数更小。其中股权市场价值(MVE)对披露质量系数的影响最大,说明需要一个比MVE影响更大的混淆变量来推翻OLS结果。假设控制变量合理,这一结果说明披露质量对价差的影响估测准确。优于每个控制变量的影响是在纳入其他控制变量后测量的。因此尽管MVE与披露质量、MVE与买卖价差的相关性较高,但它们的偏相关性较低。为了比较ICTV与控制变量的影响分布,作者假设混淆变量也与其他控制变量相关。由于在某种程度上混淆变量使相对不同的,该比较应该已于原始相关的乘积(而不是偏相关),结果如列5所示。所以披露质量并不像之前所示的那样稳健,且数据指出一个与MVE影响相似的变量也可以推翻OLS结果。九.结论

毋庸置疑,内生性在几乎所有非实验性的实证会计研究中都引起了大量的计量经济学问题,会计研究者们通常使用工具变量法来解决参数估测的不一致性。然而,很多会计IV的应用都产生了高度误导性的参数估测值和推理测试。作者对于IV估测值的看法与Hamermesh (2000, p.371)一致:该方法的支持者往往过于迅速地假定所选择工具变量是外生的,并对总体参数产生一致的估计。研究者们必须承认,这种工具变量超出了决策者的控制范围,也就是说,它描述的是研究者所希望描述的人群中随机分布的行为。如果使用工具变量法,需要满足几个基本要求:

必须可以解释该研究课题内在的内生性问题,并评估不同实验方法。

必须证明工具变量的选择。特别是,工具变量与结构误差的相关性对IV估测值的适用性有显着影响,且研究人员必须通过经济原理、先前的实验结果以及解释来证明该相关性足够小以支持IV估测值优于OLS。

必须展示第一阶段回归式的完整结果,包括部分F统计量以及部分R2。

必须将OLS和2SLS法进行对比,以证明方法之间的差异是否与基本理论一致。

对潜在混淆变量影响的评估也很重要。方法可以参考Frank (2000), Rosenbaum (2002)和DiPrete and Gangl ()。

除了工具变量法,其他方法也可以用来评估并削弱内生性问题。更直接的方法是建立一个与研究问题相关的计量经济结构模型并进行估测。一些研究者认为工具比那辆的选择只是一个统计联系,且不需要经济基础。但是,结构模型包括了一个产生该观测数据的经济模型的指定。这就要求研究人员准确了解变量的内生性或外生性、经济主体选择变量的目标函数和优化,以及均衡的性质。一旦建立出经济模型,就可以进一步进行统计假设以估测模型的结构参数。这个结构模型的优点在于,它使研究人员对内生变量作出了明确的因果陈述,而不仅仅使识别出内生变量。最后一个问题就是对于典型会计研究实验来说,IV估测是否有用。尽管无法完全回答这个问题,作者的观点是会计研究者需要严格选取并证明工具变量,且需要展示第一及第二阶段结果,以及潜在不可观测混淆变量影响的评估。

如果觉得《关于顶级外刊工具变量的使用最全策略 不收藏反复读就不要谈IV估计!》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。