1. 将数据集存入一个名为 chipo 的数据框内 

import pandas as pd
chipo = pd.read_csv('chipotle.tsv',sep='\t')

知识点:

读取csv文件 data=pd.read_csv('a.csv')
读取txt文件 data = pd.read_table('a.txt')
读取json文件

data=pd.read_json('a.json')

读取excel文件

data=pd.read_excel('a.xsl')

data=pd.read_excel('a.xslx')

2. 查看前 10 行内容

chipo.head(10)


3. 数据集中有多少个列(columns)?

chipo.columns.size
或者
chipo.shape[1]


4. 打印出全部的列名称

chipo.columns
或者
chipo.keys()


5. 数据集的索引是怎样的?

chipo.index


6. 被下单数最多商品(item)是什么?

chipo["item_name"].value_counts().head(1)#下单数最多的商品是Chicken Bowl


7. 在 item_name 这一列中,一共有多少种商品被下单?

len(chipo["item_name"].unique())#
或者
chipo["item_name"].nunique()

知识点:

8. 一共有多少个商品被下单?

chipo["quantity"].sum()


9. 将 item_price 转换为浮点数

print("转换前的数据类型",chipo["item_price"].dtypes)
for i in range(len(chipo["item_price"])):chipo["item_price"][i]=chipo["item_price"][i].replace('$','')
chipo["item_price"]=chipo["item_price"].astype('float')
print("转换后的数据类型",chipo["item_price"].dtypes)


10. 在该数据集对应的时期内,收入(revenue)是多少?

chipo['sub_total'] = round(chipo['item_price'] * chipo['quantity'],2)#单价x数量
chipo['sub_total'].sum()

知识点:

round函数用于指定保留小数位数,返回四舍五入的结果


11. 在该数据集对应的时期内,一共有多少订单?

len(chipo["order_id"].unique())
或者
chipo["order_id"].nunique()


12. 每一单(order)对应的平均总价是多少

(chipo['quantity']*chipo['item_price']).sum()/chipo["order_id"].nunique()

python练习——探索 Chipotle 快餐数据相关推荐

  1. 探索 Apple 公司股价数据-Python实现

    探索 Apple 公司股价数据 环境和数据 题目 代码 详解 这个例子比较适合数据挖掘入门一段时间.都还是比较基础的一些函数的应用. 环境和数据 这里使用的是pycharm2020.1.1 x64的 ...

  2. [译] 使用 python 分析 14 亿条数据

    原文地址:Analysing 1.4 billion rows with python 原文作者:Steve Stagg 译文出自:掘金翻译计划 本文永久链接:github.com/xitu/gold ...

  3. Python数据分析入门笔记6——数据清理案例练习

    系列文章目录 Python数据分析入门笔记1--学习前的准备 Python数据分析入门笔记2--pandas数据读取 Python数据分析入门笔记3--数据预处理之缺失值 Python数据分析入门笔记 ...

  4. 云计算和python学哪个_大数据、云计算该如何学习?

    大数据之Linux+大数据开发篇 阶段一.大数据.云计算 - Hadoop大数据开发技术 课程一.大数据运维之Linux基础 本部分是基础课程,帮大家进入大数据领域打好Linux基础,以便更好地学习H ...

  5. 决策树详解python基于Kaggle的Titanic数据实现决策树分类

    决策树详解&&python基于Kaggle的Titanic数据实现决策树分类 一 决策树算法详解 1.前期准备 实验目的准备 2.决策树概述 2.1 决策树 2.2 ID3算法原理 2 ...

  6. python提取表格数据匹配_excle表格处理python|python怎么提取excle表格数据

    python怎么提取excle表格数据 通过实例来,在Excle表格中有数据和文字结合的内容 把Excle表格中的,复制--粘贴到word中. 按下ctrl F键,打开"查找和替换" ...

  7. linux python第一行数据,使用 Python 和 GNU Octave 绘制数据 | Linux 中国

    了解如何使用 Python 和 GNU Octave 完成一项常见的数据科学任务. -- Cristiano L. Fontana 数据科学是跨越编程语言的知识领域.有些语言以解决这一领域的问题而闻名 ...

  8. OpenCV中图像以Mat类型保存时各通道数据在内存中的组织形式及python代码访问各通道数据的简要方式...

    OpenCV中图像以Mat类型保存时各通道数据在内存中的组织形式及python代码访问各通道数据的简要方式 以最简单的4 x 5三通道图像为例,其在内存中Mat类型的数据组织形式如下: 每一行的每一列 ...

  9. Python Socket请求网站获取数据

     Python Socket请求网站获取数据 ---阻塞 I/O     ->收快递,快递如果不到,就干不了其他的活 ---非阻塞I/0 ->收快递,不断的去问,有没有送到,有没有送到,. ...

最新文章

  1. php 缓冲区,PHP的输出缓冲区
  2. 在C#中选择“.NET研究”正确的集合进行编码
  3. libgdx 3D 测试一
  4. Word2003文档打不开怎么办?1分钟帮你解决!
  5. 使用jQuery OCUpload实现excel文件一键上传功能
  6. ASP网页中 制作连续无缝滚动文字
  7. RestSharp使用说明
  8. 企业使用防伪税控开票子系统出现问题常见问题
  9. Mybatis-Plus
  10. 第七章 文本数据-学习笔记+练习题
  11. C虾仔笔记 - HorizontalScrollView水平滚动视图
  12. 安防市场视频监控比重大 并有新商机
  13. markdown及IDEA快捷键
  14. nyoj 1275-导弹发射 //lis
  15. 计算机视觉室内定位的原理,基于计算机视觉的室内定位与导航系统
  16. OpenCV各版本差异
  17. 【银行转账-功能测试分析】
  18. APIPOST 常见设置项
  19. [Java]应用冒泡排序法对数组进行升序排列
  20. 程序人生:Hello’s P2P

热门文章

  1. java实现支付宝扫码支付和回调的Demo源码
  2. vue创建脚手架时常见的报错
  3. AutoCAD二次开发自定义线型
  4. 高贵灰html设计,设计时代 经典案例 | 极简水泥灰,一种高贵的朴素
  5. 埃尔米特插值问题——用Python进行数值计算
  6. 最长回文子串(多种解法,附马拉车算法)
  7. 损失函数、风险函数、目标函数
  8. 无线投影协作服务器,安全高效 开启无线协作新模式_巴可 CSE-200_投影机导购-中关村在线...
  9. 2022合肥新站高新区招聘社区工作者每日一练及答案
  10. mac连接华为手机调试android程序