200730 经过一个星期把这个基本Stata使用手册的合集更新完毕了。本篇是把之前的命令做了一个合集,如果需要单独的可以点到超链接中查看专题,希望与各位交流进步~

0. 分章节链接

  • 【统计学】基本Stata使用手册(1):基本操作
  • 【统计学】基本Stata使用手册(2):OLS回归
  • 【统计学】基本Stata使用手册(3):模型设定问题
  • 【统计学】基本Stata使用手册(4):工具变量法
  • 【统计学】基本Stata使用手册(5):面板数据
  • 【统计学】基本Stata使用手册(6):时间序列分析
  • 时间序列分析的进阶篇:
  • 【统计学】用Stata做时间序列分析

目录

  • 0. 分章节链接
  • 1 Stata基本操作
    • 1.1 Stata基本操作
    • 1.2 基本可视化指令
    • 1.3 统计特征分析
    • 1.4 命令运行结果运用
  • 2. OLS 回归
    • 2.1一元线性回归
    • 2.2 多元线性回归
    • 2.3 大样本 OLS
    • 2.4 二值选择模型
  • 3. 模型设定问题
    • 3.1 异方差与加权最小二乘
    • 3.2 自相关与广义最小二乘
    • 3.3 模型设定与数据问题
  • 4 工具变量法
  • 5. 面板数据
  • 6. 时间序列分析
    • 6.1 平稳时间序列
    • 6.2单位根与协整

1 Stata基本操作

1.1 Stata基本操作

  • 关闭一个数据集以使用另外一个
.clear
  • 审视数据
.describe
  • 查看具体数据
.list s lnw
.list s lnw 5/10 %只显示 lnw其中 5到 10的数据)
.list s lnw  if s > 16 %显示满足条件的数据
.set more off %连续滚动屏幕显示命令运行结果
.set more on %分页显示命令运行结果
.drop if s >= 16 %删除满足条件的数据
.keep if s >= 16 %保留满足条件的数据
  • 升序排列
.sort s
.list
  • 降序排列
.gsort -s
.list
  • 生成新的变量
.generate lns=log(s)
.gen s2=s^2 %生成二次项
.gen exprs=s*expr %生成交互项
.gen w=exp(lnw) %生成对数项
.gen colleg=(s>=16) %生成虚拟变量
.rename colleg college %变量重新命名
.replace clooege=(s>15) %更改变量设置
.drop s* %去除所有 s*的变量

1.2 基本可视化指令

  • 基本画图指令
.histogram s,width(1) frequency %直方图,frequency显示频率,默认显示频数
.scatter s lnw %画散点图
.tsline y,label(1980(10)2000) %画时间趋势图
.line lny lny1 lyear,lp(solid dash)
  • 加标签的散点图
.gen n=_n  %用于生成序号
.scatter lnw s,mlabel(n)
  • 将两个图画在一起
.twoway kdensity lnw || kdensity lnw if s==16,lpattern(dash)
.twoway kdensity wage,xaixs(1) yaxis(1) xvarlab(wage)||kdensity lnw,xaxis(2)
yaxis(2) xvarlab(ln(wage)) lp(dash) %两个图有不同的轴
.twoway connect consumption time,msymbol(circle) yaxis(1)|| connect temp
time,msymbol(triangle) yaxis(2) %选择线形连接各点
  • 画趋势线
.twoway scatter lnw s || lfit lnw s
  • .normalden(x)为标准正态的密度函数,normal(x)为标准正态的累积分布函数
  • .chi2den(k,x)表示自由度为kkk的卡方分布概率密度函数,chi2(k,x)表示自由度为kkk的卡方分布累积分布函数。
  • .tden(k,t)为自由度为kkk的ttt分布的概率密度函数。t(k,t)t(k,t)t(k,t)表示自由度为 kkk 的 ttt 分布累积分布函数。
  • .Tden(kl,k2,x)表示自由度为(k1,k2)(k_1,k_2)(k1​,k2​)的 FFF分布的概率密度函数。F(k1,k2,x)F(k_1,k_2,x)F(k1​,k2​,x)表示自由度为(k1,k2)(k_1,k_2)(k1​,k2​)的 FFF分布的累积分布函数。

1.3 统计特征分析

  • 查看统计特征
.summerize s  %返回Obs,Mean,Std.Dev.,Min,Max
.sum %显示所有变量的统计指标
.tabulate s %显示变量的经验累积分布函数
.pwcorr lnw s expr, sig ster(.05) %显示相关系数并将显著的标星
  • 计算表达式
.display expression
  • 概率密度函数的连续估计
.kdensity lnw,normal normop(lpattern(dash))
  • 标准化
.gen sd=(s-r(mean))/r(sd)

1.4 命令运行结果运用

  • 返回回归结果
.return list %返回r(N) r(sum_N) r(mean) r(Var) r(sd) r(min) r(max) r(sum)
.ereturn list %返回 e变量
  • 产生随机数的方法
.set seed 10101
.set obs 30
.gen x=runiform()
.gen x=rnormal() %~N(0,1)
.gen x=rnormal(m,s) %~N(m,s^2)
.gen x=rt(m) %~t(m)
.gen x=rchi2(m) %~chi^2(m)
  • 随机游走
program randwalk,rclass
drop _all
set obs 1000
gen eps=rnormal()
gen y=sum(eps)
gen t=_n
tsset t
reg y L.y
return scalar b1=_b[L.y] end
simulate beta=r(b1),seed(10101) reps(1000):randwalk
kdensity beta

2. OLS 回归

2.1一元线性回归

  • 一元回归
.regression y x
.regression y x,noconstant %表示是无常数项的回归
  • Monte Carlo模拟
.clear
.set obs 30
.set seed 10101
.gen x=rnormal(3,4)
.gen e=rnormal(0,9)
.gen y=1+2*x+e
.reg y x

2.2 多元线性回归

.reg y x1 x2
.reg lnw s expr ,noc %无常数项回归
.reg lnw s expr if rns %rns 为虚拟变量,为真时回归
.reg lnw s expr if ~rns %rns 为虚拟变量,为假时回归
.predict y %预测拟合值
.predict e,residual %预测残差
.vce %显示回归系数的协方差矩阵
.quietly reg y x1 x2 %不显示回归结果
.test s=0.1 %作单个回归系数的假设检验

2.3 大样本 OLS

.reg y x1 x2 x3,robust %解决异方差问题输出稳健标准误
.dis 1/_b[lnq] %_b[lnq]这lnq的 OLS估计值

2.4 二值选择模型

.probit y x1 x2 x3,r %Probit 模型
.logit y x1 x2 x3,r or %Logit模型,or表示显示机率比不显示回归系数
.predict y1
.estat clas %计算准确预测的百分比
.margins,dydx(*) %计算所有解释变量的平均边际效应
.margins,dydx(*) atmeans %计算所有解释变量在平均值处和边际效应
.margins,dydx(*) at(x1=0) %计算所有解释变量在 x1=0处的平均边际效应
.margins,dydx(x1) %计算解释变量 x1的平均边际效应
.margins,eyex(*) %计算平均弹性
.margins,eydx(*) %计算平均半弹性,x变化一单位引起 y变化百分之几
.margins,dyex(*) %计算平均半弹性,x变化1%引起 y变化几个单位

3. 模型设定问题

3.1 异方差与加权最小二乘

  • 画残差图
  .rvfplot %residual-versus-fitted plot .rvpplot varname %residual-versus-predictor plot
  • BP检验
.estat hettest,iid rhs %其中estat是为估计后统计量(post-estimation statistics),
hettest表示作异方差检验(heteroskedasticity test)p值越小,认为存在异方差
.estat hettest [varlist],iid %只对某些解释变量任辅助回归
  • White检验
.estat imtest,white %p值越小,拒绝同方差假设,即存在异方差
  • WLS(加权最小二乘)
.reg y x1 x2 x3 [aw=1/var] %aw 是 analytical weight,是振动项方差的倒数。
.reg y x1 x2 x3 [aw=1/var],r %WLS的稳健标准误
  • 实现 WLS的过程
.qui reg y x1 x2 x3
.predict e1,r
.gen e2=e1^2
.gen lne2=log(e2)
.reg lne2 x1 %假设hat(ln(sigma_i)^2)为 x1的线性函数
.predict lne2f
.gen e2f=exp(lne2f)
.reg y x1 x2 x3 [aw=1/e2f]

3.2 自相关与广义最小二乘

  • 时间序列算子
.tsset year %将 year作为时间变量
.reg y L(1/4).x % y对 x作一阶至四阶滞后的回归
  • 画残差图
.scatter e1 L.e1 %画残差与其滞后的散点图
.ac e1 %看残差的自相关图,ac表示自相关(autocorrelation)
  • BG检验
.estat bgodfrey,lags(p) nomiss0 %lags(p)指定滞后的阶数,nomiss0表示不添加 0的BG检验。
  • Q检验
.wntestq e1,lags(p) %wntestq 表示 white noise Q
.corrgram e1,lags(p) %画自相关图
  • DW检验
.estat dwatson
  • HAC稳健标准误
Newey y x1 x2 x3,lag(p) %提供 Newey-West标准误
  • 广义最小二乘(FGLS)
.prais y x1 x2 x3,corc %corc 表示使用 CO估计法,默认使用 PW估计法
.prais y x1 x2 x3,nolog %不显示迭代过程

3.3 模型设定与数据问题

  • 计算信息准则
.estat ic,%运用由大到小的序贯 t规则(解释变量个数)
  • Ramsey的RESET检验
.estat ovtest,rhs %p<\alpha,遗漏了高次项
  • 计算 VIF(方差膨胀因子)
.estat vif %max(vif)>10,认为存在多重共线性
  • 计算极端数据的影响力
.predict lev,leverage %极端数据的影响力,用 lev的最大值与平均值作比
  • 生成虚拟变量
.tabulate province,generate(prov) %tabulate 表示将变量按其取值列表,生成名称为
prov的虚拟变量。之后的回归指令为 reg y x1 x2 x3 prov2-prov30,必须少加一个
  • 经济结构变动(邹检验)
.reg c y
.scalar ssr=e(rss) %获利残差平方和
.reg c y if year<1992 %怀疑在1992年发生了经济结构变动
.scalar ssr1=e(rss)
.reg c y if year>=1992
.scalar ssr2=e(rss)
.di((ssr-ssr1-ssr2)/2)/((ssr1+ssr2)/32) %32=n-2k
.gen d=(year>1991) %生成虚拟变量再作回归
.gen yd=y*d
.reg c y d yd
.test d yd %检验y与yd的联合显著性
  • 缺失数据与线性插值
.ipolate y x,gen(newvar)

4 工具变量法

  • 二阶段最小二乘法(2SLS)
.ivregress 2sls y x1 x2 (x3=z1 z2),robust first %x1和x2为外生解释变量,x3为内生解释变量,z1和 z2为方程外的工具变量,first表示显示第一阶段的回归结果
  • 弱工具变量
.estat firststage %若此检验的 F统计量大于 10则可拒绝存在弱工具变量的原假设
  • 有限信息最大似然估计法(LIML)
.ivregress liml y x1 x2 (x3=z1 z2) %在弱工具变量下优于 2SLS
  • 过度识别检验
.estat overid %p<\alpha,有过度识别问题
  • 传统豪斯曼检验
.reg y x1 x2
.estimates store ols %存储 OLS的结果,记为 ols
.ivregress 2sls y x1 (x2=z1 z2)
.estimates store iv %存储IV的结果,记为 iv
.hausman iv ols,constant sigmamore %sigmamore表示统一使用更有效率的估计量
  • 异方差稳健的 DWH(Durbin-Wu-Hausman)统计量
.estat endogenous % p<\alpha,认为存在内生变量

5. 面板数据

  • 设定为面板数据
.xtset panelvar timevar %xtset表示为面板数据,面板变量 panelvar取值为整数且不重
复,给每个个体编号,timevar为时间变量
.encode country,gen(cntry) %生成数字型变量
.xtdes %显示面板数据的结构,是否为平衡面板
.xtsum %显示组内、组间与整体的统计指标
.xtline varname %对个体分别做时间序列图,叠放则加上选择项 ovarlay
  • 混合回归
.reg y x1 x2 x3,vce(cluster id) %id 指用来确定每位个体的变量,vce(cluster id)表
示以变量 id作为聚类变量计算聚类稳健的标准误
  • 固定效应
.xtreg y x1 x3 x3,fe r %fe表示固定效应统计量,默认为 re(随机效应统计量)
.reg y x1 x2 x3 i.id,vce(cluster id) %LSDV 法
  • 随机效应
.xtreg y x1 x2 x3,re r theta %theta 表示 显示 用于进行广义离着变换的\theta值
.xtreg y x1 x2 x3,mle %进行MLE估计
.xttest 0 %一个 LM检验,拒绝原假设则不应当使用混合回归,必须在 xtreg,re之后进行
  • 豪斯曼检验
.xtreg y x1 x2 x3,fe
.estimates store FE
.xtreg y x1 x2 x3,re
.estimats store RE
.hausman FE RE,constant sigmamore
.scc install xtoverid %下载安装命令 xtoverid
.qui reg y x1 x2 x3,r
.xtoverid %先使用稳健标准误,再检验过度识别
  • 组间估计
.xtreg y x1 x2 x3,be

6. 时间序列分析

6.1 平稳时间序列

  • 加入时间趋势
.gen t=_n
  • 季节趋势
.gen month=month((dofm(time))
.tab month,gen(m) %生成月度虚拟变量
  • 日期数据导入
.gen newvar=date(varname,”YMD”) %导入格式为YMD的日期数据
.gen newvar=monthly(varname,”YM”)
.gen newvar=quarterly(varname,”YQ”)
.gen newvar=mdy(M,D,Y) %合成为单一的日期变量
.format newvar %td %让新的时间变量仍然以通常的日期格式 HRF显示
.format newvar %tm
.format newvar %tq
  • 一阶差分
.gen dlny=d.lny
  • 自相关图
.corrgram dlny %作自相关图
.ac dlny,lags(20) %作自相关图
  • 一阶自回归
.reg dlny l.dlny,r
  • 高阶自回归
.reg dlny l(1/n).dlny,r %n阶自回归
  • 自回归分布滞后模型
.reg border l(1/2).border l.drought diff,r %ADL(2,1)
  • 向量自回归过程
.varsoc x y z,maxlag(#) %计算不同滞后期的信息准则
.varbasic x y z,lags(numlist) irf %脉冲响应函数,估计 VAR的便捷命令
.var x y z,lags(numlist) exog(w1 w2) %估计 VAR的正式命令,表示引入外生变量 w1 w2
.varlmar %自相关LM检验,p<\alpha,存在自相关
.varstable,graph %特征值检验是否为平稳过程并画图,若所有特征值在单位圆内,则为平稳过程
.varwle %对每个方程和所有方程各阶系数的联合显著性做沃尔德检验
.vargranger %进行格兰杰因果检验,p<\alpha,互为格兰杰原因
.fcast compute prefix,step(#) %计算解释变量未来#期的预测值,并把预测值赋予被解释变量加上前缀 prefix的变量名
.fcast graph varlist,observed %将 varlist的预测值画图,并与观察值比较
  • 脉冲响应函数
.irf create irfname,set(filename) step(#) replace order(varlist) %将有关脉冲
响应的结果存为irfname,step(#)表示考察截止#期的脉冲响应函数,
.irf graph irf,impulse(varname) response(varname) %画脉冲响应图,未正交化,其中
impulse(varname)指定脉冲变量,response(varname)指定反应变量
.irf graph oirf,impulse(varname) response(varname) %画正交化的脉冲响应图
.irf table oirf,impulse(varname) response(varname) %画正交化的脉冲响应表

6.2单位根与协整

  • 单位根检验
.dfuller y,lags(p) regress noconstant drift trend %ADF检验,Schwert(1989)建议取最大滞后阶数为 p_max=[12(T/100)^(1/4)]
  • 协整检验
.vecrank x y z,lags(#) max trend(none) trend(trend) %max表示 最大特征值检验,trend(none)表示不包括常数项或时间趋势,trend(trend) 表示包括常数项或时间趋势,输出 h=0到n-1的一系列检验,并以星号标出接受的 h值,也就是协整秩
.vec x y z,lags(#) rank(#) trend(none) trend(trend) sindicators(varlist) %其中rank(#)为协整秩的阶数,sindicators(varlist)表示加入季节虚拟变量
.veclmar %自相关的LM检验
.vecstable,graph %检验 VECM是否为平稳过程

参考文献:
[1]. 陈强,2015,《计量经济学与Stata应用》,高等教育出版社

【统计学】基本Stata使用手册:合集相关推荐

  1. 华为Dorado固态存储技术手册合集

    2019独角兽企业重金招聘Python工程师标准>>> 华为Dorado固态存储技术手册合集 华为固态存储系统Oceanspace Dorado是面向企业级高性能存储市场应用的SAN ...

  2. python使用手册-python 教程与手册(60IN1合集)

    python 教程与手册(60IN1合集)1个豆 下载地址: CGI介绍及使用Python来开发CGI应用示例.pdf dive into python Django绝对简明教程.pdf Gray H ...

  3. 2000-2020全要素生产率OP法+LP法+OLS和固定效应法三种方法合集含原始数据和计算过程Stata代码

    2000-2020全要素生产率OP法+LP法+OLS和固定效应法三种方法合集含原始数据和计算过程Stata代码 1.时间:OP法:2008-2020年.LP法2000-2020年.OLS和固定效应法2 ...

  4. stata代码命令全集:跟检验do文件、stata常用命令、代码大合集、面板熵值法

     一.常用模型代码整理 1.数据来源: 2.时间跨度:无 3.区域范围:无 4.指标说明: 包含如下模型代码: l OLS模型 l Heckman两阶段模型 l PSM+DID模型 l 固定效应模型( ...

  5. 一键下载2018年PPT合集+送58本运营手册

    这是一篇非常干的干货合集. 2018年至今的干货文章.PPT合集一次分享给大家. 更有58本纸质版<AI·超级用户数据运营手册>免费送. 参与方式在文末,非常简单~ 部分PPT展示: 干货 ...

  6. 计量模型、实证stata代码合集,附顶刊示例

    超强整理!计量实证常用代码合集! 1.指标说明: 包含以下资料: 中介效应(三步回归.Sobel检验.Bootstrap自抽样检验) Heckman两阶段回归结果 分组回归(组间系数检验) 工具变量回 ...

  7. Linux手册大合集,收藏!Linux常用命令合集

    收藏!Linux常用命令合集 1. 帮助命令 1.1 man 命令名称,man 的意思是 manual,即手册,对于大多数命令都可以使用这个命令来查看其使用的方法. 1.2 help 命令名称 或者 ...

  8. 【统计学】基本Stata使用手册(1):基本操作

    本篇为自己总结的基本Stata使用手册~今天更新的是第一部分:基本操作. 目录 1 基本操作 1.1 Stata基本操作 1.2 基本可视化指令 1.3 统计特征分析 1.4 命令运行结果运用 1 基 ...

  9. abb机器人指令手册_ABB机器人实战技巧超强合集

    更多内容请点击上方 ABB机器人实战技巧 关注 也可点击公众号下方 往期经典 浏览更多内容 转载请先后台留言,大家一起支持原创,推动机器人使用和发展 本公众号对各类ABB机器人应用,仿真,毕业设计提供 ...

  10. 【统计学】基本Stata使用手册(4):工具变量法

    本篇是本人总结的基本Stata使用手册(4):工具变量法~ 目录 4 工具变量法 4 工具变量法 二阶段最小二乘法(2SLS) .ivregress 2sls y x1 x2 (x3=z1 z2),r ...

最新文章

  1. oracle统计id出现次数,oracle 统计sql
  2. Fedora相关(一)
  3. WPF 4 单词拼写检查(SpellCheck)
  4. Java 多态之“绑定”
  5. Linux 三剑客之SED行天下
  6. c# 文件流读写文件
  7. Vue -- 项目报错整理(1):RangeError: Maximum call stack size exceeded
  8. python计算存款复利计算器_复利计算器循环
  9. Android SDK Manager无法显示可供下载的未安装SDK解决方案
  10. Elasticsearch 嵌套类型nested
  11. [导入]Replace函数vbTextCompare不支持日文韩文
  12. Linux系统修改远程连接22端口
  13. 大学计算机应用与基础第二版答案,大学计算机应用基础(第2版)上机指导与习题集...
  14. 微信怎么不支持华为鸿蒙,微信迟迟不加入鸿蒙,华为为何不着急呢?
  15. 去除面部黑色素小妙招_去除脸部黑色素7个小方法
  16. Net-speed 一键安装脚本
  17. 双译记:UCLA朱松纯团队验证机器人任务中可解释性,登Science子刊
  18. 华为设备配置链路聚合(手工负载分担模式)
  19. 新旧电脑数据传输|怎么实现两台电脑硬盘数据传输
  20. mongodb用户权限管理配置

热门文章

  1. java生成zipf分布_统计分布-Zipf分布
  2. 世界各国国家代号与区号
  3. 如何模拟地震、噪音、颠簸路面激励下的不确定性振动行为?
  4. FPGA实现cameralink解码
  5. cameralink解码编码FPGA代码定制
  6. 基于JSP网上购书系统
  7. C语言 设计项目课题,C语言课程设计课题.doc
  8. 哪个大佬有c#三层架构写的餐饮管理系统源代码
  9. 【网络科普】NAS和SAN - 网络附加存储和存储区域网络
  10. 搭建Android开发环境(超详细)