洛伦茨曲线和基尼系数

1905年,统计学家洛伦茨提出了洛伦茨曲线,如图一。将社会总人口按收入由低到高的顺序平均分为10个等级组,每个等级组均占10%的人口,再计算每个组的收入占总收入的比重。然后以人口累计百分比为横轴,以收入累计百分比为纵轴,绘出一条反映居民收入分配差距状况的曲线,即为洛伦茨曲线。

为了用指数来更好的反映社会收入分配的平等状况,1912年,意大利经济学家基尼根据洛伦茨曲线计算出一个反映收入分配平等程度的指标,称为基尼系数(G)。在上图中,基尼系数定义为:

                                                  式(1)

当A为0时,基尼系数为0,表示收入分配绝对平等;当B为0时,基尼系数为1,表示收入分配绝对不平等。基尼系数在0~1之间,系数越大,表示越不均等,系数越小,表示越均等。

基尼系数的计算方法详解

式(1)虽然是一个极为简明的数学表达式,但它并不具有实际的可操作性。为了寻求具有可操作性的估算方法,自基尼提出基尼比率以来,许多经济学家和统计学家都进行了这方面的探索。主要有以下四种计算方法

1.直接计算法

直接计算法在基尼提出收入不平等的一种度量时,就已经给出了具体算法,而且这种算法并不依赖于洛伦茨曲线,它直接度量收入不平等的程度。定义

                          式(2)

式中,△是基尼平均差,∣Yj-Yi∣是任何一对收入样本差的绝对值,n是样本容量,u是收入均值。定义

                                 式(3)

将公式带入后可得到基尼系数的计算方法为:

                  式(4)

直接计算法只涉及居民收入样本数据的算术运算,很多学者认为理论上看,只要不存在来源于样本数据方面的误差,就不存在产生误差的环节。

2.拟合曲线法

拟合曲线法计算基尼系数的思路是采用数学方法拟合出洛伦茨曲线,得出曲线的函数表达式,然后用积分法求出B的面积,计算基尼系数。通常是通过设定洛伦茨曲线方程,用回归的方法求出参数,再计算积分。例如,设定洛伦茨曲线的函数关系式为幂函数:
                                                                    式(5)

根据选定的样本数据,用回归法求出洛伦茨曲线,例如,α=m,β=n.求积分

                                           式(6)

计算

  式(7)

拟合曲线法的在两个环节容易产生谬误:一是拟合洛伦茨曲线,得出函数表达式的过程中,可能产生误差;二是拟合出来的函数应该是可积的,否则就无法计算。

    式(7)

拟合曲线法的在两个环节容易产生谬误:一是拟合洛伦茨曲线,得出函数表达式的过程中,可能产生误差;二是拟合出来的函数应该是可积的,否则就无法计算。

3.分组计算法

这种方法的思路有点类似用几何定义计算积分的方法,在X轴上寻找n个分点,将洛伦茨曲线下方的区域分成n部分,每部分用以直代曲的方法计算面积,然后加总求出面积。分点越多,就越准确,当分点达到无穷大时,则为精确计算。

假设分为n组,每组的收入为Yi,则每个部分P的面积为:

                    式(8)

加总得到

            式(9)

详细解答参看附件

基尼系数案例

基尼系数计算步骤:

1、将已知样本数据(收入数值)在EXCEL表中按照从小到大自动排序,形成第一列数据,字段名称“收入排序”

2、第二列数据字段名称设为“人数累计”,即从1开始逐个向下累加,每次累加1人

3、第三列数据字段名称设为“收入累计”,使用EXCEL公式表示:

本单元格数据=上单元格数据+同行的“收入排序”单元格数据

4、第四列数据字段名称设为“人数百分比”,用同行的“人数累计”单元格数据除以人员总数

5、第五列数据字段名称设为“收入百分比”,用同行的“收入累计”单元格数据除以收入总数

6、第六列数据字段名称设为“梯形面积”,以S2为例,S2=1/2*(收入百分比1+收入百分比2)*(人数百分比2-人数百分比1),按照前述的计算原理编辑公式即可,通过以上步骤,最后将“梯形面积”字段的数值累加,即为前文所述的B面积

7.用直角三角形面积(工资百分比*人数百分比)减去B面积即得A面积,则基尼系数可得。

下面是基尼系数的测试案例,具体Excle公式参看附件

使用Python代码实现如下:

#-*- coding:utf-8 -*-
#!/usr/bin/python
from scipy.integrate import odeint
import numpy as np
from matplotlib import pyplot as pl #解决matplotlib显示中文乱码问题
pl.rcParams['font.sans-serif'] = ['SimHei']
pl.rcParams['axes.unicode_minus'] = False
fig, ax = pl.subplots()#计算基尼系数
def Gini():# 计算数组累计值,从 0 开始wealths = [1.5, 2, 3.5, 10, 4.2, 2.1, 1.1, 2.2, 3.1, 5.1, 9.5, 9.7, 1.7, 2.3, 3.8, 1.7, 2.3, 5, 4.7, 2.3, 4.3, 12]cum_wealths = np.cumsum(sorted(np.append(wealths, 0)))# 取最后一个,也就是原数组的和sum_wealths = cum_wealths[-1]# 人数的累积占比xarray = np.array(range(0, len(cum_wealths))) / np.float(len(cum_wealths) - 1)# 均衡收入曲线upper = xarray# 收入累积占比yarray = cum_wealths / sum_wealths# 绘制基尼系数对应的洛伦兹曲线
    ax.plot(xarray, yarray)ax.plot(xarray, upper)ax.set_xlabel(u'人数累积占比')ax.set_ylabel(u'收入累积占比')pl.show()# 计算曲线下面积的通用方法B = np.trapz(yarray, x=xarray)# 总面积 0.5A = 0.5 - BG = A / (A + B)return Ga=Gini()
print(a)

运行结果为:

计算结果为:0.370254081731

转载于:https://www.cnblogs.com/OliverQin/p/8649605.html

【基尼系数】基尼系数的计算方法与计算案例相关推荐

  1. 共同富裕-三大维度-各省份、城市、农村基尼系数-附带多种计算方法

    1.数据来源 • 中国统计年鉴 • 自主整理 2.时间跨度 • 1988-2020 3.时间频率 • 年度 4.区域范围 • 31个省市⾃治区 5.主要指标 • 各省份基尼系数 • 各省份城市基尼系数 ...

  2. app运营:用户留存率详解与计算案例

    摘要: 文/BLUES留存率,越来越受到大家的关注,从网站用户到客户端产品,游戏产品,无线APP产品,都非常重视这一指标,留存率成为衡量一个产品是否健康成长的重要指标之一.留存率的"40–2 ...

  3. 【数字信号处理】线性时不变系统 LTI “ 输入 “ 与 “ 输出 “ 之间的关系 ( 线性卷积计算案例二 | 计算 卷积 )

    文章目录 一.线性卷积计算 案例二 一.线性卷积计算 案例二 给定如下两个序列 : x(n)={3,4,5}[−2,0]x(n) = \{ 3 , 4, 5 \}_{[-2,0]}x(n)={3,4, ...

  4. python 递归函数_Python尚学堂高淇|P82P86面向对象和面向过程的区别LEGB规则nonlocal_global递归函数阶乘计算案例...

    P82-递归函数-阶乘计算案例 #使用递归函数计算阶乘def factorial(n):if n==1:return 1else:return n*factorial(n-1)result=facto ...

  5. matlab实现iou计算,python实现IOU计算案例

    计算两个矩形的交并比,通常在检测任务里面可以作为一个检测指标.你的预测bbox和groundtruth之间的差异,就可以通过IOU来体现.很简单的算法实现,我也随便写了一个,嗯,很简单. 1. 使用时 ...

  6. 银行可视化大屏后端计算案例

    [摘要] 随着信息化建设的快速发展,可视化大屏需求越来越普及,然而大屏的背后意味着多样性数据源,传统的解决办法总是需要如下一些工作:ETL 工具先抽取清洗 DW 中的数据:文本文件需导入数据库中赋予计 ...

  7. 纳税计算——案例2_7

    纳税计算--案例2_7 题目 在我国,个人所得税是基于纳税人的情况和应征收人计算的.纳税人情况共分为三种:单身纳税人.已婚纳税人和家庭纳税人.另外,对于不同情况的纳税人,其税率是分档计算的,我国200 ...

  8. 数仓ADS层指标计算案例分享

    数仓ADS层指标计算案例分享 ADS层数据往往是最终的结果指标数据,在大屏展示,或者实时流处理时候使用,通过下面两个例子来练习业务大屏展示sql该怎么写. 1. 会员分析案例 1.1 数据准备 表结构 ...

  9. 【数字信号处理】线性时不变系统 LTI “ 输入 “ 与 “ 输出 “ 之间的关系 ( 线性卷积计算方法列举 | 线性卷积计算案例一 | 根据 线性卷积 定义直接计算 卷积 )

    文章目录 一.线性卷积计算方法 二.线性卷积计算示例一 ( 直接法 ) 一.线性卷积计算方法 线性卷积计算方法 : 直接法 : 根据 线性卷积 定义 直接计算 ; 图解法 : 不进位乘法 : 编程计算 ...

最新文章

  1. SSM登陆拦截器实现
  2. 什么是推理统计(inferential statistics)?
  3. Javascript变量的注意要点
  4. [密码学] 双重与三重DES
  5. 初探Golang(4)-map和流程控制语句
  6. uniapp小程序优化和减小代码体积的方式
  7. 第四代计算机cpu采用的超大规模集成电路,计算机一级试题a.doc
  8. 数字信号音频采集及时域频域加噪设计滤波器处理项目入门
  9. 如何成为技术大牛--摘自牛人
  10. 国内FRM证书福利政策大全
  11. 详解 Samaritan——饿了么最新开源的透明代理
  12. Ubuntu 16.04 桌面字体太小让它大大大
  13. 【SSL】2022.5.2 1125.集合
  14. “我比Goodfellow提前三年想到了GAN”
  15. 如何快速读懂开源代码?
  16. 等保测评--计算环境安全测评
  17. 南信与南邮谁的计算机专业更强,南信力压南邮!关于一流本科专业!
  18. 章节十四:Scrapy框架
  19. 用心做事,踏实做人,乐观面对,积极应对
  20. Java内存模型分析

热门文章

  1. 泛联新安:冲破“门槛”助力科技自立自强
  2. 《论文阅读》EmoBERTa: Speaker-Aware Emotion Recognition in Conversation with RoBERTa
  3. 为什么条件熵使用联合概率加权
  4. mysql日期函数(归档按年月日)
  5. 美团点评 TiDB 深度实践之旅(9000 字长文 / 真实“踩坑”经历)
  6. select函数用法详解,及实例分析
  7. idea打成war包
  8. 距离向量DV与链路状态LS算法的区别
  9. 【超全总结】集成环信消息推送注意事项(华为、oppo、vivo等)
  10. 计算机网络之物理层详解