03 -描述统计学- Lesson5 电子表格3_分析数据
03 描述统计学 Lesson5 电子表格3:分析数据
文章目录
- 03 描述统计学 Lesson5 电子表格3:分析数据
- 2.聚合函数
- 4.逻辑函数:IF 函数
- 6.逻辑函数:AND、OR、NOT
- 7.练习:逻辑函数
- 8.条件聚合函数
- 9.练习:COUNTIF、SUMIF 函数
- 10.数据透视表
- 11.练习:数据透视表
- 12.命名区域
- 14.Lookup函数
- 15.练习:VLOOKUP函数
2.聚合函数
聚合,就是把大量的数据特征用一个值来表达(Aggregation Fuction: Function that operates across a group of data resulting in a single value),有以下5个值:
- SUM 求和
- AVERAGE 平均数
- MAX 最大值
- MIN 最小值
- MEDIAN 中值(把数据从小到大排序,排在中间的那个值)
- STDEV 标准差(衡量每个值和平均值差异,差异越大,标准差越大)
其中 SUM 已经在前面使用过了,其他的用法和 SUM 一样。除了聚合函数,课程 1:50 开始还介绍了怎么快速建立条形图(Bar Chart):
- 选中数据
- ‘Insert’-‘Bar Chart’ 生成条形图
- ‘Design’ 可以修改默认样式
4.逻辑函数:IF 函数
IF 是编程中通用的条件判断关键字。代表如果达到条件执行一件事,如果达不到条件则执行另一件事。参照上面的语法:
- condition 是判断的条件
- value if TRUE 如果判断为真(通过判断)就执行这里的语句
- [value if FALSE] 如果判断为假(没通过判断)就执行这里的语句,注意用[ ]扩起来的意思是说,这个部分可以不写,则在判断为假的时候不执行任何操作。需要注意的是,如果省略了但条件判断为假,则会输出 False。
课程中的例子也是这样:
课程中的实操的例子中使用了 > 大于号作为比较运算符(Comparison Operator: Compare the relative size of equality of two values with these operators - Result is a logical value either TRUE of FALSE)。需要注意一点,比较运算符的输出为 TRUE 或 FALSE,共有以下几种:
Greater than 大于
- < Less than 小于
- = Equal 等于
= Greater thatn or equal 大于等于
- <= Less than or equal 小于等于
- <> Not equal 不等于
6.逻辑函数:AND、OR、NOT
AND 和 IF 一样是函数(函数的参数在小括弧中,Excel 中看到小括弧就是函数),是把多个条件的真假一起考虑,全部为真则输出真,否则就输出假:
` =AND(condition1,condition2,...) `
三种逻辑函数的总结:
- AND: true if all conditions are true
- OR: true if any condition is true
- NOT: reverses true and false
当然,逻辑函数最常见的是和IF一起使用:
7.练习:逻辑函数
对于3个条件,我们来进行拆解:
- 如果一个订单中任意一种水果的最大数量超过 10 件,
A1:D1>10
- 或订单中的总水果量超过 20 件,
E1>10
(注意这两个条件要用OR()
包裹起来 - 则将其标记为 “Special Order”,否则,则标记为 “No”。用IF嵌套AND表达。
PS:出错的怎么办:
- 公式出错的话会在单元格中出现
#VALUE!
- 同时左边出现小三角可以帮助定位错误,点击后会有提示:
可以在其他单元格将公式进行拆分,一步一步定位错误
- 比如所我开始写了
OR(A1:A4>10)
报错 - 其实原因是不支持A1:A4这种范围的比较
- 需要每个都比较,再用逗号分隔(测试了3次,搞定):
- 比如所我开始写了
注意IF判断之后要显示的文字要用双引号扩起来
当出错的时候,点击fx打开公式生成器一点一点排错很有帮助(可以看到嵌套中的结果):
8.条件聚合函数
将条件和聚合函数嵌套,就得到了条件聚合函数(Conditional Aggregation Function: Function that operates across a group of data with logical conditions)。
课程中的 COUNTIF 和 SUMIF 的区别是,前者是数有几个,后者是求和,扩展链接:
COUNTIF 函数
SUMIF 函数
9.练习:COUNTIF、SUMIF 函数
这节请注意 SUMIF 有3个参数:判断范围、判断条件、求和范围。另外,如果是在 MAC Office 上,所有涉及公式累的编辑和存储,建议完成后存储为 xlsx 格式,否则csv会丢失公式信息。
10.数据透视表
数据透视表是 Excel 非常强大的功能,一次输入数据,可以根据选择进行各种筛选和展示。(有点像Tableau这种敏捷BI程序,这个后续专门课程会讲)。MAC 打开数据透视表的方式是:
11.练习:数据透视表
数据透视表有些复杂,练习请一定要完成,练习中的计算salary的提示如下:
12.命名区域
MAC 和 Windows 的‘命名区域’位置相同:
14.Lookup函数
Lookup 是可以使用关键字在表格中查询其他信息的函数,包括LOOKUP(按行查找 Horizontal)和 VLOOKUP(按列查找 Vertical)(Lookup Function: Function that uses a keyword and index to “Look up” a value in a table.)
LOOKUP 函数
15.练习:VLOOKUP函数
练习按照 check list 分解做就可以了。注意要先创建2个‘命名区域’,再做VLOOKUP,在选择VLOOKUP的第二个参数时,就可以看到创建的 airline_lookup
和 airport_lookup
两个参数(MAC):
问题提示:
Q1 伦敦:
- 在完成 VLOOKUP 之后,使用 COUNTIF ,注意检查判断条件,题目中的 London Heathrow 的拼写和数据中是否一致。
Q2 唯一的航空公司:
- 方法1:使用数据透视表 + COUNTA
- 使用数据透视表可以将每个航空公司出现的次数计算出来(可以看出来那家航空公司的飞行的次数比较多):
- 对输出结果用
COUNTA
函数计算值的数量
- 使用数据透视表可以将每个航空公司出现的次数计算出来(可以看出来那家航空公司的飞行的次数比较多):
- 方法2:高级过滤 + COUNTA
- 使用‘高级过滤’将独特的数据过滤出来到新的位置(图中的例子是数不同的目的地机场,请同学们理解后自己完成不同航空公司的问题):
- 对输出结果用
COUNTA
函数计算值的数量 - 这种方式的区别是所有非独特值都依次有输出,可以copy文字道别的地方使用(比如word的报告中)
- 使用‘高级过滤’将独特的数据过滤出来到新的位置(图中的例子是数不同的目的地机场,请同学们理解后自己完成不同航空公司的问题):
Q3 航线第二多的航空公司:
- 在Q2的生成的数据透视表中,进行排序。MAC的操作提示如下:
03 -描述统计学- Lesson5 电子表格3_分析数据相关推荐
- 04 -描述统计学- Lesson6 电子表格4_可视化数据
04 描述统计学 Lesson6 电子表格4:可视化数据 文章目录 04 描述统计学 Lesson6 电子表格4:可视化数据 2.饼图 3.练习:饼图 4.柱形图 5.散点图和折线图 6.练习:图表类 ...
- 【Python数据分析与处理 实训03】 --- 酒类消费信息分析(数据分组聚合 group().agg()应用)
[Python数据分析与处理 实训03] - 酒类消费信息分析(数据分组聚合 group().agg()应用) 探索酒类消费信息 对于下面的数据集进行简单的一些数据的分析训练 若需要源数据请私信~ 1 ...
- python如何读取excel数据-使用Python读取电子表格中的数据
Python 是最流行.功能最强大的编程语言之一.由于它是自由开源的,因此每个人都可以使用.大多数 Fedora 系统都已安装了该语言.Python 可用于多种任务,其中包括处理逗号分隔值(CSV)数 ...
- 1.Excel业务分析数据
文章目录 大数据分析 1.Excel业务分析数据 1.1基本操作对象 2.数据加工 2.1 数据类型 2.2 快捷操作 2.2.1 文本数字转换为数值数字 2.2.2 快速输入数据 2.2.3 数据验 ...
- 足球数据API接口 - 【足球赛事分析数据】API调用示例代码
分享使用接口调用的示例代码,足球数据[足球赛事分析数据]接口 package com.huaying.demo.football;import java.nio.charset.StandardCha ...
- Udacity数据分析(进阶)——清洗与分析数据(Twitter数据集)
对狗狗评分的Twitter数据:清洗与分析数据 项目概述 数据集 项目要点 项目流程 1.收集 2.评估 目测评估df_one 编程评估df_one 目测评估df_two 编程评估df_two 目测评 ...
- python开发的程序中以电子表格显示数据_使用 Python 读取电子表格中的数据实例详解...
Python 是最流行.功能最强大的编程语言之一.由于它是自由开源的,因此每个人都可以使用.大多数 Fedora 系统都已安装了该语言.Python 可用于多种任务,其中包括处理逗号分隔值(CSV)数 ...
- 数据总量 40 亿+,报表分析数据 10 亿+,TiDB 在中通的落地与进化
作者:luzizhuo 原文来源: https://tidb.net/blog/3da1aed9 本文根据中通快递数据智能部基础架构负责人朱友志在[PingCAP DevCon 2021]上的演讲整理 ...
- App性能分析数据监控
App性能分析数据监控 APP的性能监控包括: CPU 占用率.内存使用情况.网络状况监控.启动时闪退.卡顿.FPS.使用时崩溃.耗电量监控.流量监控等等. 文中所有代码都已同步到github中,有兴 ...
- 命名管道 win7未响应_大数据分析Python建立分析数据管道
如果您曾经想通过流数据或快速变化的数据在线学习Python,那么您可能会熟悉数据管道的概念.数据管道允许您通过一系列步骤将数据从一种表示形式转换为另一种表示形式.数据管道是数据工程的关键部分,我们将在 ...
最新文章
- 数据预处理--噪声_为什么数据对您的业务很重要-以及如何处理数据
- 如何在本地站点打开html,如何在本地运行的网页上创建指向本地文件的链接?...
- 用Docker安装Gitlab
- 理解 async/await 的执行
- 一文弄懂AOP各种概念
- Idea导入maven工程,并运行
- freebsd php mysql_在freebsd和linux下安装mysql+php+apache2
- 【Paper】AAAI 2020 故事生成模型 之 角色一致性
- SQL Azure (15) SQL Azure 新的规格
- r语言如何计算t分布临界值_R语言系列第四期:R语言单样本双样本差异性检验...
- pmp采购管理--合同类型
- 推荐几个高质量的程序员 B 站视频账号
- PyTorch中BN层与CONV层的融合(merge_bn)
- SharePoint Online:软件边界和限制
- PHP 十六大魔术方法学习
- 奇虎360 -- 2013年校园招聘技术类笔试题
- wps上下标怎么对齐_wps如何设置表格对齐方式图解
- c语言符号运算优先级6,c语言运算符号的优先级
- coreldraw怎么画猴子_用CorelDraw制作一个可爱的调皮猴子
- EasyConnect
热门文章
- 特殊权限set_uid、特殊权限set_gid、特殊权限stick_bit、软链接文件、硬连接文件...
- Rectilinear Regions
- pdf转换成word免费版网页版哪个好?有这个网站就够了
- poj 1743 Musical Theme(最长重复子串 后缀数组)
- SpringBoot项目启动失败报错Annotation-specified bean name ‘xx‘ for bean class [xxx] conflicts with existing
- 欧拉回路 java_关于欧拉回路和欧拉路径
- 卧槽,牛逼!华为鸿蒙操作系统入门到精通
- 中国十大板材品牌之细木工板加工流程
- 收缩oracle表空间大小,oracle 缩小表空间大小(减小数据文件)
- VUE(2)$t 是啥?