python练习——探索 Chipotle 快餐数据
1. 将数据集存入一个名为 chipo 的数据框内
import pandas as pd
chipo = pd.read_csv('chipotle.tsv',sep='\t')
知识点:
读取csv文件 | data=pd.read_csv('a.csv') |
读取txt文件 | data = pd.read_table('a.txt') |
读取json文件 |
data=pd.read_json('a.json') |
读取excel文件 |
data=pd.read_excel('a.xsl') data=pd.read_excel('a.xslx') |
2. 查看前 10 行内容
chipo.head(10)
3. 数据集中有多少个列(columns)?
chipo.columns.size
或者
chipo.shape[1]
4. 打印出全部的列名称
chipo.columns
或者
chipo.keys()
5. 数据集的索引是怎样的?
chipo.index
6. 被下单数最多商品(item)是什么?
chipo["item_name"].value_counts().head(1)#下单数最多的商品是Chicken Bowl
7. 在 item_name 这一列中,一共有多少种商品被下单?
len(chipo["item_name"].unique())#
或者
chipo["item_name"].nunique()
知识点:
8. 一共有多少个商品被下单?
chipo["quantity"].sum()
9. 将 item_price 转换为浮点数
print("转换前的数据类型",chipo["item_price"].dtypes)
for i in range(len(chipo["item_price"])):chipo["item_price"][i]=chipo["item_price"][i].replace('$','')
chipo["item_price"]=chipo["item_price"].astype('float')
print("转换后的数据类型",chipo["item_price"].dtypes)
10. 在该数据集对应的时期内,收入(revenue)是多少?
chipo['sub_total'] = round(chipo['item_price'] * chipo['quantity'],2)#单价x数量
chipo['sub_total'].sum()
知识点:
round函数用于指定保留小数位数,返回四舍五入的结果
11. 在该数据集对应的时期内,一共有多少订单?
len(chipo["order_id"].unique())
或者
chipo["order_id"].nunique()
12. 每一单(order)对应的平均总价是多少
(chipo['quantity']*chipo['item_price']).sum()/chipo["order_id"].nunique()
python练习——探索 Chipotle 快餐数据相关推荐
- 探索 Apple 公司股价数据-Python实现
探索 Apple 公司股价数据 环境和数据 题目 代码 详解 这个例子比较适合数据挖掘入门一段时间.都还是比较基础的一些函数的应用. 环境和数据 这里使用的是pycharm2020.1.1 x64的 ...
- [译] 使用 python 分析 14 亿条数据
原文地址:Analysing 1.4 billion rows with python 原文作者:Steve Stagg 译文出自:掘金翻译计划 本文永久链接:github.com/xitu/gold ...
- Python数据分析入门笔记6——数据清理案例练习
系列文章目录 Python数据分析入门笔记1--学习前的准备 Python数据分析入门笔记2--pandas数据读取 Python数据分析入门笔记3--数据预处理之缺失值 Python数据分析入门笔记 ...
- 云计算和python学哪个_大数据、云计算该如何学习?
大数据之Linux+大数据开发篇 阶段一.大数据.云计算 - Hadoop大数据开发技术 课程一.大数据运维之Linux基础 本部分是基础课程,帮大家进入大数据领域打好Linux基础,以便更好地学习H ...
- 决策树详解python基于Kaggle的Titanic数据实现决策树分类
决策树详解&&python基于Kaggle的Titanic数据实现决策树分类 一 决策树算法详解 1.前期准备 实验目的准备 2.决策树概述 2.1 决策树 2.2 ID3算法原理 2 ...
- python提取表格数据匹配_excle表格处理python|python怎么提取excle表格数据
python怎么提取excle表格数据 通过实例来,在Excle表格中有数据和文字结合的内容 把Excle表格中的,复制--粘贴到word中. 按下ctrl F键,打开"查找和替换" ...
- linux python第一行数据,使用 Python 和 GNU Octave 绘制数据 | Linux 中国
了解如何使用 Python 和 GNU Octave 完成一项常见的数据科学任务. -- Cristiano L. Fontana 数据科学是跨越编程语言的知识领域.有些语言以解决这一领域的问题而闻名 ...
- OpenCV中图像以Mat类型保存时各通道数据在内存中的组织形式及python代码访问各通道数据的简要方式...
OpenCV中图像以Mat类型保存时各通道数据在内存中的组织形式及python代码访问各通道数据的简要方式 以最简单的4 x 5三通道图像为例,其在内存中Mat类型的数据组织形式如下: 每一行的每一列 ...
- Python Socket请求网站获取数据
Python Socket请求网站获取数据 ---阻塞 I/O ->收快递,快递如果不到,就干不了其他的活 ---非阻塞I/0 ->收快递,不断的去问,有没有送到,有没有送到,. ...
最新文章
- php 缓冲区,PHP的输出缓冲区
- 在C#中选择“.NET研究”正确的集合进行编码
- libgdx 3D 测试一
- Word2003文档打不开怎么办?1分钟帮你解决!
- 使用jQuery OCUpload实现excel文件一键上传功能
- ASP网页中 制作连续无缝滚动文字
- RestSharp使用说明
- 企业使用防伪税控开票子系统出现问题常见问题
- Mybatis-Plus
- 第七章 文本数据-学习笔记+练习题
- C虾仔笔记 - HorizontalScrollView水平滚动视图
- 安防市场视频监控比重大 并有新商机
- markdown及IDEA快捷键
- nyoj 1275-导弹发射 //lis
- 计算机视觉室内定位的原理,基于计算机视觉的室内定位与导航系统
- OpenCV各版本差异
- 【银行转账-功能测试分析】
- APIPOST 常见设置项
- [Java]应用冒泡排序法对数组进行升序排列
- 程序人生:Hello’s P2P
热门文章
- java实现支付宝扫码支付和回调的Demo源码
- vue创建脚手架时常见的报错
- AutoCAD二次开发自定义线型
- 高贵灰html设计,设计时代 经典案例 | 极简水泥灰,一种高贵的朴素
- 埃尔米特插值问题——用Python进行数值计算
- 最长回文子串(多种解法,附马拉车算法)
- 损失函数、风险函数、目标函数
- 无线投影协作服务器,安全高效 开启无线协作新模式_巴可 CSE-200_投影机导购-中关村在线...
- 2022合肥新站高新区招聘社区工作者每日一练及答案
- mac连接华为手机调试android程序