损失次数模型-泊松分布

——非寿险精算的基本理论

1、定义

假设损失次数NNN服从参数为λ\lambdaλ的泊松分布,则发生kkk次损失的概率为:

p(N=k)=e−λλkk!p(N=k)=\frac {e^{-\lambda}\lambda^{k}}{k!}p(N=k)=k!e−λλk​

<有的同学可能会问,为什么泊松分布是这样的。问,就是,乌龟的屁股,“龟腚(规定)”。>

公式理解:

pkp_kpk​:表示的是损失次数NNN取值为kkk的概率。例如,损失发生次数为3的概率,可表示为:p(N=3)=e−λλ33!p(N=3)=\frac {e^{-\lambda}\lambda^{3}}{3!}p(N=3)=3!e−λλ3​,如果λ\lambdaλ为已知的话,便可求出最终结果。

2、方差和均值

E(N)=D(N)=λE(N)=D(N)=\lambdaE(N)=D(N)=λ

<这个比较简单一点,就给你们推导一下吧。>

<首先,唤起你们远古的概率论知识。>

离散型随机变量的均值和方差公式:

<损失次数只能是1次、2次等整数,不能是1.5次等小数,因此是离散型变量。>
E(X)=∑xkpkE(X)=\sum x_kp_kE(X)=∑xk​pk​

D(X)=E(X−E(X))2D(X)=E(X-E(X))^2D(X)=E(X−E(X))2

<记忆已唤醒,开始推导吧。>

2.1、均值E(N)E(N)E(N)推导

E(N)=∑Nkp(Nk)E(N)=\sum N_kp(N_k)E(N)=∑Nk​p(Nk​)

<把Nk=k,p(N=k)=e−λλkk!N_k=k,p(N=k)=\frac {e^{-\lambda}\lambda^{k}}{k!}Nk​=k,p(N=k)=k!e−λλk​带入上式>

=∑k=0nke−λλkk!=\sum_{k=0}^nk\frac {e^{-\lambda}\lambda^{k}}{k!}=∑k=0n​kk!e−λλk​

<当λ已知时e−λ为常数,因此可以提到∑前面\lambda已知时e^{-\lambda}为常数,因此可以提到\sum前面λ已知时e−λ为常数,因此可以提到∑前面>

=e−λ∑k=0nkk!λk=e^{-\lambda}\sum_{k=0}^n\frac {k}{k!}\lambda^k=e−λ∑k=0n​k!k​λk

<阶乘定义k!=k(k−1)...1=k(k−1)!所以上式可写成k!=k(k-1)...1=k(k-1)!所以上式可写成k!=k(k−1)...1=k(k−1)!所以上式可写成>

=e−λ∑k=1nkk(k−1)!λk=e^{-\lambda}\sum_{k=1}^n\frac {k}{k(k-1)!}\lambda^k=e−λ∑k=1n​k(k−1)!k​λk

=e−λ∑k=1n1(k−1)!λk=e^{-\lambda}\sum_{k=1}^n\frac {1}{(k-1)!}\lambda^k=e−λ∑k=1n​(k−1)!1​λk

<λk=λλk−1\lambda^k=\lambda\lambda^{k-1}λk=λλk−1,所以上式可写成>

=e−λ∑k=1nλλk−1(k−1)!=e^{-\lambda}\sum_{k=1}^n\frac {\lambda\lambda^{k-1}}{(k-1)!}=e−λ∑k=1n​(k−1)!λλk−1​

<当λ已知时,其为常数,因此可以提到∑前面\lambda已知时,其为常数,因此可以提到\sum前面λ已知时,其为常数,因此可以提到∑前面>

=e−λλ∑k=1nλk−1(k−1)!=e^{-\lambda}\lambda\sum_{k=1}^n\frac {\lambda^{k-1}}{(k-1)!}=e−λλ∑k=1n​(k−1)!λk−1​

<根据麦克劳林公式ex=∑n=0∞xnn!,所以∑k=1nλk−1(k−1)!=eλe^x=\sum_{n=0} ^∞\frac {x^n}{n!},所以\sum_{k=1}^n\frac {\lambda^{k-1}}{(k-1)!}=e^\lambdaex=∑n=0∞​n!xn​,所以∑k=1n​(k−1)!λk−1​=eλ,,带入上式>

=e−λλeλ=e−λeλλ=e−λ+λλ=λ=e^{-\lambda}\lambda e^\lambda=e^{-\lambda}e^\lambda\lambda=e^{-\lambda+\lambda} \lambda=\lambda=e−λλeλ=e−λeλλ=e−λ+λλ=λ

2.2、方差D(N)D(N)D(N)推导

D(N)=E(N−E(N))2D(N)=E(N-E(N))^2D(N)=E(N−E(N))2

=E{N2+(E(N))2−2NE(N)}=E\{N^2+(E(N))^2-2NE(N)\}=E{N2+(E(N))2−2NE(N)}

=E(N2)+E(E(N))2−E(2NE(N))=E(N^2)+E(E(N))^2-E(2NE(N))=E(N2)+E(E(N))2−E(2NE(N))

<这里有个小细节,E(N)E(N)E(N)代表的是N的均值,它不是随机变量而是一个常量,常量的均值还等于它本身。即E(E(N))2=(E(N))2E(E(N))^2=(E(N))^2E(E(N))2=(E(N))2,E(2NE(N))=2E(N)E(N)=2(E(N))2E(2NE(N))=2E(N)E(N)=2(E(N))^2E(2NE(N))=2E(N)E(N)=2(E(N))2,带入上式>

=E(N2)+(E(N))2−2(E(N))2=E(N^2)+(E(N))^2-2(E(N))^2=E(N2)+(E(N))2−2(E(N))2

=E(N2)−(E(N))2=E(N^2)-(E(N))^2=E(N2)−(E(N))2

<求均值时,已经求得E(N)=λE(N)=\lambdaE(N)=λ,所以后面只需求E(N2)E(N^2)E(N2)即可。根据前面离散型随机变量的均值公式可得>

E(N2)=∑Nk2p(Nk)E(N^2)=\sum N_k^2p(N_k)E(N2)=∑Nk2​p(Nk​)

<这里大家或许会有一个疑问,为什么乘的概率是p(Nk)p(N_k)p(Nk​),而不是p(Nk2)p(N_k^2)p(Nk2​)。大家可以看一下下表>

X x1x_1x1​ x2x_2x2​ x3x_3x3​
P p1p_1p1​ p2p_2p2​ p3p_3p3​
X2X^2X2 x12x_1^2x12​ x22x_2^2x22​ x32x_3^2x32​

<虽然随机变量由XXX变成了X2X^2X2,但其对应的概率值并没有改变,都是PPP,这就是为什么可以直接乘概率p(Nk)p(N_k)p(Nk​)的原因。>

<承接上面的推导公式,因为N=kN=kN=k,所以>

=∑k=0∞k2e−λλkk!=e−λ∑k=1∞kkλkk(k−1)!=\sum_{k=0}^∞k^2\frac {e^{-\lambda}\lambda^{k}}{k!}=e^{-\lambda}\sum_{k=1}^∞kk\frac {\lambda^{k}}{k(k-1)!}=∑k=0∞​k2k!e−λλk​=e−λ∑k=1∞​kkk(k−1)!λk​

=e−λ∑k=1∞kkλkk(k−1)!=e−λ∑k=1∞kλk(k−1)!=e^{-\lambda}\sum_{k=1}^∞kk\frac {\lambda^{k}}{k(k-1)!}=e^{-\lambda}\sum_{k=1}^∞k\frac {\lambda^{k}}{(k-1)!}=e−λ∑k=1∞​kkk(k−1)!λk​=e−λ∑k=1∞​k(k−1)!λk​

=e−λ∑k=1∞[(k−1)+1]λk(k−1)!=e^{-\lambda}\sum_{k=1}^∞[(k-1)+1]\frac {\lambda^{k}}{(k-1)!}=e−λ∑k=1∞​[(k−1)+1](k−1)!λk​

=e−λ[∑k=1∞(k−1)λk(k−1)!+∑k=1∞λk(k−1)!]=e^{-\lambda}[\sum_{k=1}^∞(k-1)\frac {\lambda^{k}}{(k-1)!}+\sum_{k=1}^∞\frac {\lambda^{k}}{(k-1)!}]=e−λ[∑k=1∞​(k−1)(k−1)!λk​+∑k=1∞​(k−1)!λk​]

=e−λ[∑k=2∞λk(k−2)!+∑k=1∞λk(k−1)!]=e^{-\lambda}[\sum_{k=2}^∞\frac {\lambda^{k}}{(k-2)!}+\sum_{k=1}^∞\frac {\lambda^{k}}{(k-1)!}]=e−λ[∑k=2∞​(k−2)!λk​+∑k=1∞​(k−1)!λk​]

=e−λ[λ2∑k=2∞λk−2(k−2)!+λ∑k=1∞λk−1(k−1)!]=e^{-\lambda}[\lambda^{2}\sum_{k=2}^∞\frac {\lambda^{k-2}}{(k-2)!}+\lambda\sum_{k=1}^∞\frac {\lambda^{k-1}}{(k-1)!}]=e−λ[λ2∑k=2∞​(k−2)!λk−2​+λ∑k=1∞​(k−1)!λk−1​]

=e−λ[λ2eλ+λeλ]=λ2+λ=e^{-\lambda}[\lambda^{2}e^{\lambda}+\lambda e^{\lambda}]=\lambda^{2}+\lambda=e−λ[λ2eλ+λeλ]=λ2+λ

<在求解E(N)E(N)E(N)时,已经回顾了概率论和微积分的一些知识点,所以在推导D(N)D(N)D(N)时,并没有列出具体的说明。>

<现在E(N2)E(N^2)E(N2)的值也推导出来了,根据前面对D(N)D(N)D(N)的推导,可以得到>

D(N)=E(N2)−(E(N))2=λ2+λ−λ2=λD(N)=E(N^2)-(E(N))^2=\lambda^{2}+\lambda-\lambda^{2}=\lambdaD(N)=E(N2)−(E(N))2=λ2+λ−λ2=λ

3、性质

  • 可加性

如果N1N_1N1​和N2N_2N2​分别是参数为λ1\lambda_1λ1​和λ2\lambda_2λ2​的泊松随机变量,则N=N1+N2N=N_1+N_2N=N1​+N2​是参数为λ1+λ2\lambda_1+\lambda_2λ1​+λ2​的泊松随机变量。

  • 可分解性<相当于可加性的反向>

如果两种保险责任的总索赔次数NNN服从参数为λ\lambdaλ的泊松分布,而两种保险责任发生的概率分别为a1和a2a_1和a_2a1​和a2​,且a1+a2=1a_1+a_2=1a1​+a2​=1,则两种保险责任的索赔次数N1N_1N1​和N2N_2N2​是相互独立的泊松随机变量,参数分别为λa1+λa2\lambda a_1+\lambda a_2λa1​+λa2​。

  • 当参数λ\lambdaλ很小时,泊松分布可以近似二项分布。

  • 如果保险事故发生的时间间隔服从指数分布,则在一个固定的时间区间内发生保险事故次数服从泊松分布。

  • 当参数λ\lambdaλ较大时,泊松分布可以用正态分布近似。

<个人比较懒,并没有仔细研究泊松分布性质的证明问题。从实务角度来看,仅仅记得有这些性质即可。哈哈哈~~~>

4、软件实操

<泊松分布性质的证明是比较枯燥的,但是我们用软件去观察它的这些性质,将会是一件非常有趣的事情。>

4.1、λ\lambdaλ的大小对泊松分布图像的影响

<直接上python代码>

import numpy as np
from scipy import stats
import matplotlib.pyplot as plt
import mathdef poissonpmf(lamda,sample):'''Parameters----------lamda : int泊松分布的均值.sample : int泊松分布的样本数量.Returns-------k : int泊松分布对应的k值.probability : float泊松分布取得该值时的概率.'''lamda = lamdasample = samplek = np.arange(sample)#会返回一个0至sample-1的连续整数列表probability = stats.poisson.pmf(k,mu=lamda)#当给定均值时,可以计算k值对应的概率return k,probabilitylamda=5
sample=40
k,probability=poissonpmf(lamda=lamda, sample=sample)#调用自定义的泊松分布函数
plt.subplot(1,1,1)#定义图片的布局,针对一张图片来说可以省略该代码
plt.plot(k,probability,"r",label="lamda="+str(lamda))#画曲线图,并定义曲线为红色"r",并显示图例label(后面是图例名称)
plt.plot(k,probability,"ro")#画散点图,并定义散点为红色
plt.title("Poisson distribution")#设置图片标题
plt.xlabel("k")#设置图片x轴说明
plt.ylabel("probability")#设置图片y轴说明
plt.legend(loc=0)#将图例放在合适的位置,让系统自动查找lamda=10
sample=40
k,probability=poissonpmf(lamda=lamda, sample=sample)
plt.subplot(1,1,1)
plt.plot(k,probability,"b",label="lamda="+str(lamda))#蓝色曲线("b")
plt.plot(k,probability,"bo")#蓝色散点("bo")
plt.title("Poisson distribution")
plt.xlabel("k")
plt.ylabel("probability")
plt.legend(loc=0)lamda=20
sample=40
k,probability=poissonpmf(lamda=lamda, sample=sample)
plt.subplot(1,1,1)
plt.plot(k,probability,"g",label="lamda="+str(lamda))#绿色曲线("g")
plt.plot(k,probability,"go")#绿色散点("go")
plt.title("Poisson distribution")
plt.xlabel("k")
plt.ylabel("probability")
plt.legend(loc=0)

<针对代码的含义这里就不详细说明了,有兴趣的可以直接查看代码后面的注释>

<输出结果>

当λ\lambdaλ越大时,泊松分布的峰值越小,图像变得越对称。

<有的同学可能看不懂图片,这里再解释一下吧。图片横轴表示的是损失次数NNN,纵轴表示的是该损失次数下对应的泊松分布的概率值>

4.2、泊松分布与正态分布

<需要先构建一个正态分布的概率密度函数,关于正态分布的问题这里就不详细展开了,主要是看一下随着λ\lambdaλ的变化,泊松分布和正态分布之间的关系>

def normalpdf(mu,sigma,simple):"""Parameters----------mu : float正态分布的均值.sigma : float正态分布标准差.simple : int生成的样本数量.Returns-------x : floatx轴值.probability : float取值为x轴值时,对应的概率密度函数值,相当于离散变量的概率."""mu = musigma = sigmasimple = simplex = np.arange(sample)probability=np.exp(-(x-mu)**2/(2*sigma**2))/(math.sqrt(2*math.pi)*sigma)#正态分布的概率密度函数return x,probability

<画图做比较>

lamda=5#获取不同lamda参数的图像,直接修改它即可
sample=lamda*2
k,probability_po=poissonpmf(lamda,sample)
k,probability_no=normalpdf(lamda,math.sqrt(lamda),sample)
plt.plot(k,probability_no,"r",label="normal")
plt.plot(k,probability_po,"g--",label="poisson")
plt.title("Poisson and Normal distribution" + "(lamda="+str(lamda)+")")#设置图片标题
plt.xlabel("x")#设置图片x轴说明
plt.ylabel("probability")#设置图片y轴说明
plt.legend(loc=0)#将图例放在合适的位置,让系统自动查找

<运行结果>

通过图片可以看出,随着λ\lambdaλ的逐渐变大,泊松分布和正态分布逐渐重合。

<看到这里,大家可能会疑惑,为什么其他性质没有用图片展现出来,因为我发现其他性质用图片并不好展现,或者是因为我还没找到方法。~~~>

—End—

*** 参考资料 ***

1、《非寿险精算学》孟生旺著

2、泊松分布的期望和方差_绿荫下的陪伴.的博客-CSDN博客_泊松分布的期望和方差

3、十个常见常用的麦克劳林公式_骄傲的张起灵的博客-CSDN博客_麦克劳林公式

4、Python计算泊松分布教程_梦想画家的博客-CSDN博客_python泊松分布

5、泊松分布_skysenlin的博客-CSDN博客_泊松分布

6、python使用matplotlib绘图_longwilll的博客-CSDN博客_python matplotlib

损失次数模型-泊松分布相关推荐

  1. 损失次数模型-负二项分布

    损失次数模型-负二项分布 --非寿险精算的基本理论 1.定义 一个成功概率为ppp的伯努利试验,不断重复,直至失败rrr次.此时成功的次数为一个随机变量,用XXX表示.称XXX服从负二项分布,记作X∼ ...

  2. 泊松分布与泊松回归模型

    泊松分布 Poisson分布(法语:loi de Poisson,英语:Poisson distribution,译名有泊松分布.普阿松分布.卜瓦松分布.布瓦松分布.布阿松分布.波以松分布.卜氏分配等 ...

  3. 简单介绍一下R中的几种统计分布及常用模型

    统计学上分布有很多,在R中基本都有描述.因能力有限,我们就挑选几个常用的.比较重要的简单介绍一下每种分布的定义,公式,以及在R中的展示. 统计分布每一种分布有四个函数:d――density(密度函数) ...

  4. ⅰcp经济模型_简单介绍一下R中的几种统计分布及常用模型

    统计学上分布有很多,在R中基本都有描述.因能力有限,我们就挑选几个常用的.比较重要的简单介绍一下每种分布的定义,公式,以及在R中的展示. 统计分布每一种分布有四个函数:d――density(密度函数) ...

  5. 三大深度学习生成模型:VAE、GAN及其变种

    本章将为读者介绍基于深度学习的生成模型.前面几章主要介绍了机器学习中的判别式模型,这种模型的形式主要是根据原始图像推测图像具备的一些性质,例如根据数字图像推测数字的名称,根据自然场景图像推测物体的边界 ...

  6. 泊松分布的分布函数_第114讲 SAS泊松分布与泊松回归

    西莫恩·德尼·泊松(Simeon-Denis Poisson 1781-1840)法国数学家.几何学家和物理学家.主要成就有统计学发现泊松分布与物理光学发现与发展--泊松亮斑等. 泊松分布的参数λ是单 ...

  7. 模型评估——定量分析预测的质量

    https://blog.csdn.net/hustqb/article/details/77922031 评分参数定义模型评价规则 公共案例预定义值 根据度量函数定义你的评分策略 应用你自己的评分对 ...

  8. 【论文阅读】Paraformer工业级非自回归端到端语音识别模型

    Paraformer: Fast and AccurateTransformer for Non-autoregressive End-to-End Speech Recognition 摘要 介绍 ...

  9. R语言基于决策树的银行信贷风险预警模型

     引言 我国经济高速发展,个人信贷业务也随着快速发展,而个人信贷业务对提高内需,促进消费也有拉动作用.有正必有反,在个人信贷业务规模不断扩大的同时,信贷的违约等风险问题也日益突出,一定程度上制约着我国 ...

最新文章

  1. 系统架构设计师视频教程免费下载
  2. 批量消除图片的杂色背景
  3. UltraEdit批量删除关键字所在的指定行
  4. 20155209 林虹宇 Exp9 Web安全基础
  5. 【Python】2.x与3​​.x版本的选用版本间的区别
  6. PHP 利用cron 实现文章同步至新浪、网易等微博
  7. 【Android XMPP】 学习资料收集贴(持续更新)
  8. Wireshark常用封装过滤规则
  9. Ps 初学者教程,如何在图片中创造双色效果?
  10. 祝学校计算机系的新年贺词,[学校班级新年祝福语]班级新年贺词
  11. JAVA字符编码:Unicode,GBK,GB2312,UTF-8
  12. tp6 集成swoole
  13. 谷歌浏览器查看版本信息及个人资料路径的命令方法
  14. 在 Windows 下用 GCC 编译器练习 C/C++ 的简单教程
  15. 大小写字母转换 (15分)
  16. linux上离线安装PostgreSQL和插件PostGIS
  17. 魅族android不兼容Android,魅族17系列彻底跟上时代,搭载基于Android 10的Flyme 8.1系统...
  18. 说说qwerty、dvorak、colemak三种键盘布局
  19. (转)Android系统WAP上网设置
  20. Apache Kafka实战读书笔记(推荐指数:☆☆☆☆☆)

热门文章

  1. 【AI达人创造营】红细胞形状异常检测在Edgeboard上的部署
  2. 【uniapp请求接口错误No address associated with hostname】
  3. HC-SR505红外感应模块驱动(STM32)
  4. 高通平台 Android9 adb shell “hwclock -w“ 报错
  5. 2021年化工自动化控制仪表考试内容及化工自动化控制仪表考试报名
  6. 嘉楠堪智kendryke K210资料汇总
  7. 摸鱼kik的Flutter架构搭建
  8. ie8浏览器html圆角问题,IE7,IE8浏览器CSS实现正圆角效果代码
  9. 计算机二级b5纸是多大尺寸,b5纸多大尺寸
  10. 电表远程抄表用电数据的问题