目录

简单介绍

1、内生性:

2、为什么要解决内生性问题?

3、内生性问题产生的原因

4、例子

代码(简洁版):

代码(详细分析版):

结果


简单介绍

1、内生性:

x与误差项有相关关系

2、为什么要解决内生性问题?

内生性会破坏参数估计的“一致性”。
参数估计的“一致性”就是指:
        当样本量很大时,用样本估计出的参数会无限趋近于总体的真实参数。

简单理解就是:因为Y同时受到x和扰乱项的影响,若 x对误差项有影响,则x对y的影响说不清了。

3、内生性问题产生的原因

随机扰动项和解释变量存在相关主要源自

•遗漏变量偏误(omitted variable bias)
•测量偏误(measurement error)
•互为因果(simultaneity)        
•自选择偏误(self-selection bias)
•样本选择偏误(sample selection bias )

(本文重点讲样本选择)

简单区分一下自选择偏误和样本选择偏误:

样本选择中,个体差异在于是否有机会进入到观测样本,那些没有进入样本的个体,其y是观测不到的;

而在自选择偏误中,个体的差异在于是否得到处理,并且这种差异是个体自选择形成的,而不论是否得到处理,其y都是可观测的。

4、例子

研究妇女工资和其受教育程度和工作经验的关系:

因变量y:妇女工资水平

自变量x:受教育程度和工作经验

已知200个妇女,其中只有100个妇女有工作,即样本只能是这100个妇女

(因为没工作的妇女我们没有办法调查到或者没工作也就没资格谈收入水平)

结果我们只能用着100个有工作的妇女的数据去做回归分析,得到了受教育程度和工作经验是显著正向影响工资水平的,但显然这个结论是不可靠的,因为样本的非随机性不能反映出总体的真实情况。

解决办法:Heckman两阶段法

代码(简洁版):

findit esttab

use "D:\大二\回归分析\内生性\womenwk",clear

reg lw  education age children if work==1

est sto k1

heckman lw education age children,select(work=education age children married) mle nolog

est sto k2

heckman lw education age children,select(work=education age children married) twostep

est sto k3

local d  "using D:\大二\回归分析\内生性\结果1.rtf"

local a  "k1 k2 k3"

esttab `a' `d', b(%6.4f) se(%6.4f) nogap compress

star(* 0.1 ** 0.05 *** 0.01)

ar2 scalar(N) replace

代码(详细分析版):

//y:lw

//x:education, age, children

//下载安装包esttab

findit esttab

//已知:数据储存在womanwk里,womanwk储存在“D:\大二\回归分析\内生性”里

//当你想用stata处理这些数据时,用下面这行代码实现
use "D:\大二\回归分析\内生性\womenwk",clear

*传统的简单回归
reg lw  education age children,r

//如果只想对有工作的妇女的信息进行回归,则用下面这一行代码取代上面那行
//reg lw  education age childrenif work==1

est sto k1                //保存为k1表

*用两步法
heckman lw education age children,select(work=education age children married) mle nolog
est sto k2

*用一步法twostep
heckman lw education age children,select(work=education age children married) twostep 
est sto k3

//保存结果
local d  "using D:\大二\回归分析\内生性\结果.rtf"        
local a  "k1 k2 k3"                   
esttab `a' `d', b(%6.4f) se(%6.4f) nogap compress  
    star(* 0.1 ** 0.05 *** 0.01)  
    ar2 scalar(N) replace

结果

(1)回归

(2)两步法

(3)一步法

lw

lw

lw

main

education

0.0372***

0.0397***

0.0427***

(0.0023)

(0.0025)

(0.0031)

age

0.0062***

0.0076***

0.0093***

(0.0009)

(0.0010)

(0.0014)

children

-0.0312***

-0.0180**

-0.0020

(0.0047)

(0.0065)

(0.0115)

_cons

2.4531***

2.3055***

2.1248***

(0.0427)

(0.0653)

(0.1250)

work

education

0.0565***

0.0584***

(0.0110)

(0.0110)

age

0.0350***

0.0347***

(0.0042)

(0.0042)

children

0.4538***

0.4473***

(0.0288)

(0.0287)

married

0.4548***

0.4309***

(0.0736)

(0.0742)

_cons

-2.4781***

-2.4674***

(0.1928)

(0.1926)

/

athrho

0.3378**

(0.1152)

lnsigma

-1.3755***

(0.0247)

/mills

lambda

0.1823**

(0.0638)

N

1343

2000

2000

Standard errors in parentheses

* p < 0.05, ** p < 0.01, *** p < 0.001

stata解决内生性问题--样本选择相关推荐

  1. 内生性、自选择偏误、样本选择偏误

    导读 概念辨析 内生性 随机误差项和自变量相关 管理学研究中的内生性问题及修正方法 找工具变量,构造DID,固定效应模型是解决内生性的常用方法. 双向因果(simultaneity/simultane ...

  2. 内生性问题的产生和解决办法

    一.什么是内生性 对于一个回归问题,回归方程如下: 简单来说内生性就是自变量x1与扰动项存在相关性,即,存在内生性那么用OLS就无法得到无偏估计,结论就不可靠. 无偏估计 是指用样本统计量来估计总体的 ...

  3. 浙江大学【面板数据分析与STATA应用】——第三讲内生性与工具变量法

    解释变量和误差项存在内生性问题 内生性问题来源 内生性问题主要来自于三个方面,分别为:遗漏变量.联立性以及度量误差 遗漏变量 遗漏变量是指可能与解释变量相关的变量,本来应该加以控制,但却没有控制的变量 ...

  4. Heckman两步法 | 样本选择模型 处理效应模型

    这期推送简单介绍一下样本选择模型和处理效应模型,其中样本选择模型是一般意义上的Heckman两步法,后者则借鉴了Heckman两步法的构建思想,但又不完全等同于前者.模型介绍之后,将利用help文件中 ...

  5. rdd 内生分组_内生性问题和倾向得分匹配, 献给准自然试验的厚礼

    欢迎投稿(荐稿)计量经济圈,计量相关都行 邮箱:econometrics666@sina.cn 编辑: @计量经济圈(ID: econometrics666); 来源: 统计学和量化研究 公众号; 感 ...

  6. 样本选择模型 处理效应模型

    一.样本选择偏差与自选择偏差 样本选择偏差 样本选择偏差的非随机选择机制在于对样本的选择不随机.在样本数据的采集过程中,只对某部分群体进行调查,但这部分群体与其他群体在某些方面的特征差异较大,因此根据 ...

  7. 学习笔记 | 内生性全面介绍

    一直以来,对内生性的理解都是似懂非懂,就像是蒙着一层黑纱,哈哈~ 所以,今天上午把关于内生性的知识认真地看了一遍,梳理了一遍,总结一下,方便后面学习. 内容包括三大块:内生性来源.解决.典型例子 主要 ...

  8. 内生性问题—工具变量法

    文章目录 @[toc] 1 什么是内生性 2 内生性的来源 2.1遗漏变量偏差 2.2 联立方程偏差 2.3 解释变量测量误差 2.4 选择偏差 2.5 双向因果关系 2.6 模型设定偏误 2.7 动 ...

  9. lecture 11:内生性与工具变量法

    内生性问题 "内生性"名称的由来 现在人们说某个模型有内生性问题(endogeneity issue),是指模型中的一个或多个解释变量与误差项存在相关关系. 显然,这个解释和内生性 ...

最新文章

  1. 用matlab怎么画视电阻率拟断面图,在MATLAB平台上实现可控源音频大地电磁反演数据三维可视化显示...
  2. Good Bye 2019 SZU cf集训C~D
  3. JOGL   java调用openGL
  4. Python3使用tkinter编写GUI程序
  5. 二维gabor滤波器matlab,matlab中实现Gabor滤波器 | 学步园
  6. fopen与读写的标识r,r+,rb+,rt+,w+.....
  7. 苹果发布iOS 15.3正式版 修复了Safari浏览器漏洞
  8. Drools 文档(目录)
  9. 干货 | 高效阅读英文文献你必须知道的技巧
  10. 关于流媒体压缩的问题xvidcore的问题
  11. 医疗行业缩写所表示含义
  12. 如何免费将XPS转成PDF格式
  13. app_start(‘com.ss.android.ugc.aweme‘) 打不开app 无反应 Activity not started, unable to resolve Intent {
  14. php7.2 eregi,php – 函数eregi()已弃用
  15. html视频顺序播放,三个视频并排显示按顺序播放的效果怎么制作?怎么使同框视频依次播放|视频合成软件...
  16. 会畅通讯会议客户端分析
  17. 分析classpath、path、JAVA_HOME的作用及JAVA环境变量配置(转发博客园)
  18. 液压管路渗漏图像识别检测方法研究
  19. 如何使用Google及kml下载
  20. SM1算法的EBC、CBC、OFB模式及其介绍

热门文章

  1. 南京工业大学计算机专业复试科目,南京工业大学复试科目.pdf
  2. 上海老大杜月笙——教你看穿一个人
  3. 智慧大棚一小步,农业发展一大步
  4. Java学习20天 String 类 常用方法 String、StringBuffer、StringBuilder三者的异同
  5. crmeb一款最适合二次开发的开源微信公众号小程序框架 轻编程
  6. Error Correction
  7. [LintCode/LeetCode] Rotate List
  8. RMAN备份之备份多个备份集到带库(一)
  9. arduino esp8266开发板下载出错解决方法
  10. 5G专网是个大西瓜(一):价值之问