• 首先读取数据
#读取红酒数据
target_url = "https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv"
df = pd.read_csv(target_url, sep = ";")#打印数据形状和数据类型的个数
print (df.shape)
print (df.get_dtype_counts())

数据释义:每一行代表一组数据,1-11列代表红酒不同属性的检测值,最后一列代表红酒质量指数,下面通过将质量指数映射到(0,1)区间,根据优劣程度对应到所画折线图的不同颜色(cm.RdYlBu函数:值越小越劣对应线条越红,反之越蓝),进而分析判断好酒劣酒在哪些质量指数数据上有差异。

  • 判断鉴定红酒优劣的指标
##根据红酒质量的不同画不同颜色的折线
#1,将数据值标准化
_df = (df*1.0-df.mean())/df.std()
#2,将红酒质量指数映射到(0,1)范围内
q = df.shape[1]-1
dq = df.iloc[:,q]*1.0
_dq = (dq-dq.mean())/dq.std()
_dq = 1.0/(1.0+math.e**(-_dq))
#3,画图:偏蓝色代表质量较好的红酒;偏红色线表质量较差的红酒
plt.figure(figsize = (10,5))
for i in range(df.shape[0]):_df.iloc[i,1:q].plot(color=plt.cm.RdYlBu(_dq[i]), alpha = 0.5)
plt.xlabel(df.columns.tolist()[0:q])
plt.show()


通过观察结果图发现:较好的红酒酒精含量相对较高,密度相对较低,非挥发性酸含量相对较低。

  • 分析各个属性间的关系
    最后通过画热度相关图,分析各个属性间的关系:
#热度相关图,黄色对应强相关。
plt.pcolor(df.corr())
plt.show()


在上图的展示中,以第1个属性为例,通过热度图可以发现它和第3个、第8个属性(绿色方块)有着较强的相关性,即非挥发性酸值大的话,糖分残留和ph值就会大,这和我们的化学常识相一致,同时这也变相说明上一部分的推理挥发性酸值越大–>糖分残留值越大(口感越甜)的红酒相对较为劣质,这和我们的常识也是相一致的。

零基础python机器学习笔记--代码实战第二天数据分析相关推荐

  1. 零基础Python修炼笔记——整理自官方文档

    零基础Python修炼笔记 题外话 "编外人员"学Python 书籍 交互课程 中小学儿童学习 教材和网站 科学工作者教程 视频 工具 后记 题外话 去年我自学Python的时候, ...

  2. 从零编写60%+胜率的短线择时信号!零基础python量化投资代码详解【邢不行】

    引言: 邢不行的系列帖子"量化小讲堂",通过实际案例教初学者使用python进行量化投资,了解行业研究方向,希望能对大家有帮助. ​ ​ 如果有人说你是百年难得一见的量化投资天才, ...

  3. 零基础python必背代码-零基础入门学习python 96集全

    零基础入门学习python 96集全 第000讲 愉快的开始(视频+课件)xa0 第001讲 我和Python第一次亲密接触(视频+课件)xa0 第002讲 用Python设第一个游戏(视频+课件+源 ...

  4. 零基础python必背代码-编程零基础应当如何开始学习 Python?

    学Python,最高效的方法其实就是自学+自问+实战(海伦泰勒学习法的精简版). 本文分为3大板块,不仅要帮你0基础入门,还专门写了进阶内容. 进阶内容中这51个Python的秘密,你可不一定知道. ...

  5. 零基础python必背代码-零基础小白Python入门必看:通俗易懂,搞定深浅拷贝

    Python中的深浅拷贝 在讲深浅拷贝之前,想先讲一下 is 和==的区别. 在进行对象是否相等比较的时候我们可以用is 和 == is:比较两个对象的引用是否相同,即它们的id 是否一样 == : ...

  6. 零基础python必背代码-30个Python常用极简代码,拿走就用

    学 Python 怎样才最快,当然是实战各种小项目,只有自己去想与写,才记得住规则.本文是 30 个极简任务,初学者可以尝试着自己实现:本文同样也是 30 段代码,Python 开发者也可以看看是不是 ...

  7. 【百度领航团】小白零基础python学习笔记

    计算机是什么 在现实生活中,越来越无法离开计算机了电脑.笔记本.手机.游戏机.汽车导航.智能电视 ... 计算机就是一个用来计算的机器! 目前来讲,计算机只能根据人类的指令来完成各种操作,人让它干嘛他 ...

  8. 零基础Python爬虫教程和实战(一)

    今天我们来学爬虫,这个系列预计会出11期 爬虫原理: ------------------什么是爬虫?----------------- 请求网站并提取数据的自动化程序 --------------- ...

  9. python行业中性_【建投金工丁鲁明团队 经典回顾】:零基础python代码策略模型实战...

    原标题:[建投金工丁鲁明团队 经典回顾]:零基础python代码策略模型实战 编者按 本文<零基础python代码策略模型实战>,属于大数据选股领域,报告发布时间为2018年3月8日. 内 ...

最新文章

  1. [2017.02.23] Java8 函数式编程
  2. Leangoo看板协作工具与Trello还真的不一样
  3. python基础练习(四)
  4. 磁金融宣布完成1.2亿元B轮融资,宽带资本领投
  5. 做了极度危险的事情各种奔忙
  6. 746.使用最小花费爬楼梯
  7. python-视频抽帧、数据集命名
  8. 人工智能/机器学习/深度学习 经典必看书籍【附百度网盘链接】
  9. iOS 封装Healthkit
  10. 各种程序员的工作内容
  11. 20年管理学范围内知识点(潘永明)by:PoilZero
  12. 还在搞三层架构?了解下 DDD 分层架构的三种模式吧
  13. 人工智能数学基础--概率与统计7:学习中一些术语的称呼或表示变化说明以及独立事件的一些补充推论
  14. 华为Freelace pro音质突然下降的解决方案
  15. python 基本概念整理
  16. ThreadLocal的短板,我TTL来补
  17. 【数据结构】递归斐波那契数列的时间复杂度、空间复杂度
  18. 【架构师】零基础到精通——架构发展
  19. ibatis mysql存储过程_分步详解 如何在iBatis中调用存储过程
  20. xampp 可道云_Windows下用kodexplorer可道云在本地搭建私有云的步骤

热门文章

  1. 一个 80 后失败创业者的告白
  2. Elastic Job学习笔记
  3. NEUQ图灵杯之A题——蔡老板的会议
  4. sharding-jdbc(ShardingSphere )、mycat、DRDS 三个分布式数据库中间件的简单介绍(纯理论说明)
  5. 入门视频采集与处理(BT656简介)
  6. DM8168 - BT656格式视频采集
  7. 诺依曼计算机组成,1.1.2 冯·诺依曼计算机模型
  8. DCDC电路-自举电容的作用
  9. 经典论文翻译--Minimum Snap Trajectory Generation and Control for Quadrotors
  10. 第二章 为Encog获取数据