主要步骤

1.全局概览
2.收集数据
3.探索数据,可视化数据获取洞见
4.为机器学习算法准备数据
5.选择模型并训练模型
6.调优模型
7.展示解决方案
8.上线,监控并维护系统

用真实数据做机器学习

学习机器学习时,用真实的数据集要比用模拟的数据要更加具有吸引力。幸运的是,有成千上万的开发数据集可供我们使用,下面列出几个选择:

  • UCI机器学习仓库 http://archive.ics.uci.edu/ml/
  • Kaggle数据集 https://www.kaggle.com/datasets
  • 亚马逊AWS数据集 http://aws.amazon.com/fr/datasets/

数据集索引:

  • http://dataportals.org/
  • http://opendatamonitor.eu/
  • http://quandl.com/
  • https://goo.gl/SJHN2k 维基
  • http://goo.gl/zDR78y Quora
  • https://www.reddit.com/r/datasets Reddit

这些数据都非常有学习实践价值,所以不要低估了这些数据的价值。最好是把这些数据用起来,能够极大提升机器学习的实战能力。

全局概览

这里选用的是加州房价数据。

我们要建立的模型需要能够从数据中学习并预测任意区域的房价中位数,在给定其他特征的情况下。

确定问题

到底目标是什么,可能构建一个模型并不是最终目标呢?这个模型能够给我们带来什么?确定问题很重要,它是指导我们整个机器学习后续流程的关键。

管道

To Be Continued.

参考:

《Hands-On Machine Learning with Scikit-Learning and Tensorflow》

【机器学习】端到端机器学习实践相关推荐

  1. 2.10 是否要使用端到端的深度学习-深度学习第三课《结构化机器学习项目》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 2.9 什么是端到端的深度学习 回到目录 2.11 总结 是否要使用端到端的深度学习 (Whether to use end-to-end deep learning?) 假 ...

  2. 2.9 什么是端到端的深度学习-深度学习第三课《结构化机器学习项目》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 2.8 多任务学习 回到目录 2.10 是否要使用端到端的深度学习 什么是端到端的深度学习 (What is end-to-end deep learning?) 深度学习中 ...

  3. 一份关于机器学习端到端学习指南

    人工智能.机器学习已经火了有一阵了,很多程序员也想换到这方向,目前有关于深度学习基础介绍的材料很多,但很难找到一篇简洁的文章提供实施机器学习项目端到端的指南,从头到尾整个过程的相关指南介绍.因此,个人 ...

  4. 业界 | 德勤预测:机器学习走向移动端成大势所趋,或将再掀行业新浪潮

    来源:AI科技评论 概要:早在20世纪70.80年代,大部分企业计算都由办公大楼地下室里的大型主机和微型计算机完成,工作人员则在操作由没有机载处理能力的阴极射线管监视器(被称为"绿屏&quo ...

  5. 机器学习中什么是端到端的训练方法(端到端学习)?(end2end learning)

    相对于深度学习,传统机器学习的流程往往由多个独立的模块组成,比如在一个典型的自然语言处理(Natural Language Processing)问题中,包括分词.词性标注.句法分析.语义分析等多个独 ...

  6. 端到端机器学习_端到端机器学习项目:评论分类

    端到端机器学习 In this article, we will go through a classification problem that involves classifying a rev ...

  7. 端到端机器学习_使用automl进行端到端的自动化机器学习过程

    端到端机器学习 Prerequisite: 先决条件: - Docker -码头工人 - Jupyter Notebook -Jupyter笔记本 - Python and Pip -Python和P ...

  8. 端到端机器学习”中的“端到端”应如何理解

    欢迎关注博主的公众号:happyGirl的异想世界.有更多干货还有技术讨论群哦~ 源链接  https://www.zhihu.com/question/264358398/answer/280694 ...

  9. 《机器学习实战 学习笔记》(二):端到端的机器学习项目

    文章目录 第2章 端到端的机器学习项目   1 使用真实数据( 加州房价预测 )      1.1 流行的各个领域的开放数据集存储库   2 观察大局      2.1 框架问题      2.2 选 ...

  10. 机器学习中的端到端学习(End-to-End Learning)

    传统机器学习需要将一个任务的输入和输出之间人为地切割成很多子模块,或者多个阶段,每个子模块(阶段)分开学习.比如一个自然语言处理任务(NLP),一般需要分词.词性标注.句法分析.语义分析.语义推理等步 ...

最新文章

  1. 人脑启发AI设计:让神经网络统一翻译语音和文本
  2. 在Elasticsearch中对 text 类型的字段进行聚合异常Fielddata is disabled,Set fielddata=true
  3. LinDaiDai的 2019 面试准备
  4. 计算机工具软件应用考试,《计算机常用工具软件》期中考试题
  5. django 别名与命名空间 reverse反转得到路径
  6. python调用函数的优点_python基础之函数
  7. 设置ie默认版本为ie7
  8. Spring Cloud技术栈简述
  9. TPMS烧录器安装 SNP739
  10. 锂离子电池正极材料(x酸锂类,三元锂NCM,NCA)与负极材料 碳负极?
  11. 什么是无服务器架构,你理解对了吗?
  12. php 设置post大小_php – 设置$_POST变量
  13. aws课程_AWS DeepRacer,Reinforcement Learning 101和一门关于AI管治的小课程
  14. ATTCK v10版本战术介绍—资源开发
  15. I2C之RX-8025驱动
  16. Kubernetes(K8s) —— 容器编排管理技术
  17. 华为起诉三星启示几何 探讨知识产权在中国
  18. win7 32位装mysql_2017-11-16 Win7 32位下安装Mysql
  19. 计算机科学时间长被拒,计算机科学与探索外审一般多长时间 - 论文投稿 - 小木虫 - 学术 科研 互动社区...
  20. JAVA数组扁平化整合_一文搞定数组扁平化(超全面的数组拉平方案及实现)

热门文章

  1. 数据结构上机实践第四周项目2 - 建设“单链表”算法库
  2. PyTorch 入坑九:权重初始化
  3. Vscode中HTML与CSS代码的快速写法
  4. (2)通过输入参数(测量数据)构建三维体模型(01)
  5. jmoiron sqlx mysql_mysql 一(或其他数据库)
  6. 原生编辑器_微信小程序 广告原生模板广告
  7. ansible 建 kubernetes 证书签名请求_Java中的微信支付(2):API V3 微信平台证书的获取与刷新...
  8. matlab中input输入多个数_python怎么一次输入两个数
  9. VS2010调用python编写的代码error:cannot open file 'python27_d.lib'.
  10. 虚拟电脑键盘app_App发布倒计时