问题:在什么场合应当用几何平均值,而不是用算术平均值?!

问题:在什么场合应当用几何平均值,而不是用算术平均值?!

(7.6日注,也许题目改为在什么场合使用代数(几何,…)平均值合适?更妥当)

人们在很多场合(学生成绩统计、社会经济统计和科学实验等…)进行平均值的统计计算(先求N个样本的合计值再以样本数N除之)。这种平均值称为代数(或者算术)平均值。其实数学还推荐几何平均值(它是样本值的连乘积再开N次方),以至调和平均值(样本值的倒数的代数平均)。
在没有计算器或者计算机的时代,自然是代数平均值最容易计算,人们就习以为常地使用代数平均值了。但是现在计算机如此普及,普遍使用代数平均值究竟是一种习惯,还是满足某种理论要求?
在什么场合应当统计几何平均值,而不是用算术平均值?

本文引用地址: http://www.sciencenet.cn/m/user_content.aspx?id=341374

评论人1:zhaoxing [2010-7-5 16:59:41]

也被这一问题困惑很久,统计学的书看过十几二十种,但没有一本把这个问题说清楚过。
有的说几何平均适用于时序数据,有的说适用于增长或变化率计算,但都没说为什么。
从算法上,个人感觉几何平均可能更“平滑”一些,面对样本中存在极端值时的稳健性更好。

评论人2:lix [2010-7-5 18:05:19]

这个问题张老师是专家,我算回答张老师的课堂提问吧。我的理解,平均值是对一个分布的简化描述。这一简化,肯定要丢失一些信息。那么什么时候该用什么样的平均值,取决于您后继用这个平均值来干什么。比如说要用某地居民的平均收入来计算其平均幸福指数?由于岁入千万的个人,未必比岁入十万的幸福100倍(后继计算中有非线性),所以就可以考虑用几何平均数,压低岁入千万的个人对平均幸福指数的拔高效应。一般说来,可以考虑这个分布本身接近正态分布,还是这个分布的对数更接近正态分布。但是没有什么固定的原则。

下面是作者第2天(2010.7.6)的回答:对不同的平均值的认识

感谢zhaoxing赵星老师和李小文老师的关注和发表的认识。我现在补充说明如下:

1.         代数平均值在很多理论分析中也常用到,它计算方便,理解容易,这没有什么不对之处。毕竟,我做统计,我做主。

2.         从数学角度看,几何平均值没有什么理由比代数平均值地位低一等。它的计算困难问题,也因为电脑的普及而消失。但是使用几何平均值时,必需注意数学上的连乘积与开方运算的脾气。需要明确,变量值(样本值)可能出现负数的情况,不能用样本的连乘积或者几何平均值,因为变量的负值会带来连乘积的值时正时负,让你不放心,开方还出现负数开方,更是不可理解。所以对于变量可能存在负值的样本(如摄氏气温)不能统计其几何平均值(连乘积)。

3.         类似地,变量可能为0的样本,会使连乘积=0,所以这类变量也不能统计几何平均值。即,变量可能=0,或者小于0的样本,不能分析其几何平均值。

4.         既然有上面这些注意点,何必还计算几何平均值?请注意有的变量本身就天然具有不可能为0,不能取负值的本性,抓住这个特征,说不定使更容易看透其规律。物体具有的动能、人的年龄、人具有的财富、百分比的值等很多变量仅能取正值。这些特点,有时需要把握和利用而不是忽略。

5.         利用信息熵最大(我称为复杂程度最大),仅配合代数平均值确定不变,可以推导出该随机变量的概率密度只能服从负指数分布。在这种知识提示下,你统计代数平均值自然是妥当的。而且你会发现,另外一批样本的代数平均值与第一批几乎相同,而其几何平均值却不同。

6.         另外,利用信息熵最大,仅配合几何平均值(不是代数平均值!)确定不变,可以推导出该随机变量的概率密度只能服从幂率分布。在这种知识提示下,你统计几何平均值自然是妥当的。而且会发现,另外一批样本的几何平均值与第1批几乎相同,而其代数平均值却不同。是的,现在幂率分布在分形研究里很时髦,为什么一些分形现象里满足幂率分布?因为该系统的变量几何平均值具有保守性(不变),并且满足熵最大(最混乱、最复杂)。

7.         前面两段说明,在系统里随机性体现信息熵最大,并且仅存在一个约束条件,如果这个条件是(而且仅是)代数平均值不变则分布为负指数分布,如果是(而且仅是)几何平均值不变,则符合幂率。

8.         如果某变量体现的不是负指数分布,也不是幂率,而是所谓gamma分布,它对应的统计特点是说明?答案是:该系统体现信息熵最大的同时(也可以夸张地说这是热力学第二定律的体现,我使用了这个神秘的定律!)受到两个(而且仅是两个)条件的约束:变量的代数平均值以及(同时)几何平均值也是不变量(这两个平均值不需要相同,但是几何平均值必然小于代数平均值)。即此时概率分布不再是负指数或者幂率而是gamma分布了。此时,你会发现取用两批不同的大样本,双方的代数平均值应当相等,而且双方的几何平均值也相等。这里变量的代数平均值、几何平均值同等重要。而这些认识为你从理论解释该分布为什么恰好如此,提供了依据。合适的平均值的选取可能是迈向理论分析的合理跳板。

9.         以上这些认识基本来自《组成论》里对分布与复杂程度最大的系统性分析。这里就点到为止了。以上考虑与李小文老师考虑分布问题是一致的。

10.     初中3年级200个学生的百米成绩平均值是多少?这里需要先问百米成绩是以秒计算,去求平均值,还是以速度计算平均值。要知道速度是目前计算百米成绩的秒数的倒数!你是统计速度的平均值还是统计速度的倒数的平均值?这联系着统计学里的调和平均值的利用。如果你从调和平均值的角度分析(包括对于的分布)更容易获得理论说明,那么就应当统计调和平均值。这一切取决于随后的分析需要,看看哪种平均值是你需要踩的恰当的阶梯。

11.     结合目前是近千万学生高考,其学生分数如果符合正态分布,统计其代数平均值就可以了。如果符合gamma分布(偏态),我认为需要代数平均值、几何平均值都分析,并且用最大熵下加上代数平均值不变和几何平均值不变给予理论说明(这个理论结论已经准备在哪里了)。

12.     以上说明可能不尽合适,供进一步讨论。

本文引用地址:http://blog.sciencenet.cn/blog-2024-341374.html  此文来自科学网张学文博客,转载请注明出处。

转载于:https://www.cnblogs.com/yymn/p/4784475.html

问题:在什么场合应当用几何平均值,而不是用算术平均值?!相关推荐

  1. MVC模式计算两个正数的代数平均值与几何平均值

    1.计算两个正数的代数平均值与几何平均值. 1)两个JSP页面: (1)inputData.jsp(视图)页面提供两个表单,用户可以输入两个正数.inputData.jsp页面将用户输入的数据提交给一 ...

  2. 平均值不等式证明:算数平均值、几何平均值、调和平均值大小关系证明

    三个平均值不等式证明(算数平均值不小于几何平均值,几何平均值不小于调和平均值) 写在前面:最近在自学数学分析,学到这里时书上并未给出完整证明,同时在网上也没有找到想要的内容,因此这里记录一下推导过程, ...

  3. Python | 数学计算那点事儿不完全总结 - 计算平均值、几何平均值等等

    本文主要总结数据统计.分析过程中经历的一些数学计算实现方式. Update: 2022 / 12 / 1 Python | 数据数学计算那点事儿不完全总结 - 计算平均值.几何平均值等等 计算平均值 ...

  4. 华为OD机试 - 几何平均值最大子数组(Java JS Python)

    题目描述 从一个长度为N的正数数组numbers中找出长度至少为L且几何平均值最大子数组,并输出其位置和大小.(K个数的几何平均值为K个数的乘积的K次方根) 若有多个子数组的几何平均值均为最大值,则输 ...

  5. 【华为OD机试真题 Python】几何平均值最大的子数组

    前言:本专栏将持续更新华为OD机试题目,并进行详细的分析与解答,包含完整的代码实现,希望可以帮助到正在努力的你.关于OD机试流程.面经.面试指导等,如有任何疑问,欢迎联系我,wechat:steven ...

  6. 【华为OD机试真题 Java】几何平均值最大的子数组(100%通过+全网最详细注释)

    前言:本专栏将持续更新华为OD机试题目,并进行详细的分析与解答,包含完整的代码实现,希望可以帮助到正在努力的你.关于OD机试流程.面经.面试指导等,如有任何疑问,欢迎联系我,wechat:steven ...

  7. 华为OD机试用Python实现 -【几何平均值最大子数组】| 2023年3月被抽中

    华为OD机试题 最近更新的博客 华为 OD 机试 300 题大纲 几何平均值最大子数组 题目描述 输入描述 输出描述 说明 示例一 输入 输出 说明 示例二 输入 输出 说明 Python 代码实现 ...

  8. python求几何平均_创建复杂条件列(几何平均值)Python

    这将计算每个站点的几何平均值并检查其是否大于30:>>> df['geo_mean_acceptable'] = ( df.groupby('Site') .transform(la ...

  9. 【华为OD机试真题 python】几何平均值最大子数组【2023 Q1 | 100分】

    ■ 题目描述 [几何平均值最大子数组] 从一个长度为N的正数数组numbers中找出长度至少为L且几何平均值最大子数组,并输出其位置和大小.(K个数的几何平均值为K个数的乘积的K次方根) 若有多个子数 ...

最新文章

  1. 【Codeforces】427B Prison Transfer(别让罪犯跑了...)
  2. FB壕掷千万办换脸视频检测挑战赛,网友:这是帮Deepfake训练鉴别器吗?
  3. c#随机数生成编号_使用C#生成随机密码(纯数字或字母)和随机卡号(数字与字母组合)...
  4. [知识图谱实战篇] 三.Python提取JSON数据、HTML+D3构建基本可视化布局
  5. 安卓手机玩游戏卡顿怎么解决_手机卡顿怎么办?教你3个实用解决方法,两分钟解决卡顿难题!...
  6. 自制vue组件通信插件:教你如何用mixin写插件
  7. 找不到libmmd.dll无法继续执行代码_300 行代码带你秒懂 Java 多线程!| 原力计划...
  8. java 泛型 父子_使用通配符和泛型:完成父子类关系的List对象的类型匹配
  9. 怎么用c语言写贪吃蛇贴吧,刚学C语言,想写一个贪吃蛇的代码
  10. Python使用struct处理二进制(转)
  11. eq相等 ne、neq不相等 EL表达式
  12. 蓝桥杯2020山西省省赛太原理工大获丰收
  13. 分布式系统关注点(6)——「负载均衡」到底该如何实施?
  14. 解析WAP技术(转)
  15. Java 编码规范11(安全规约)
  16. sdau启航前端第一次作业
  17. 直角三角形第斜边计算
  18. MySql数据类型-读书笔记
  19. 电脑重装系统-利用PE系统盘安装
  20. dive into openstack ovn (by quqi99)

热门文章

  1. Satwe楼板能用弹性模计算吗_关于PKPM系列软件楼板模型问题的探讨
  2. 无线耳机哪个品牌好一点?综合体验,推荐几款高性价比的无线耳机
  3. oracle 视图怎么更新数据,Update视图数据(oracle)
  4. Redis之数据类型详解分析
  5. 飞利浦商显再加码,将引来新一轮的市场热潮?
  6. 2021-07-08IDEA+Java+Servlet+JSP+Bootstrap+Mysql实现Web学生成绩管理系统
  7. 以太坊 2.0 :双生以太奇谭
  8. 【艾琪出品】-【数据结构】测试题系列一,无向图的邻接矩阵、北京景点查询系统(含部分答案)
  9. 【百度C++面试题】如何才能获得百度的offer?你面试必须要会这些...
  10. SpringBoot在线拍卖竞价拍卖竞拍系统源码