李宏毅机器学习 深度学习入门
1. Keras
Kearas 是深度学习小白入门的最佳工具之一。Keras是一个高层神经网络API的集合,Keras由纯Python编写而成并基Tensorflow、Theano以及CNTK后端。
相比tensorflow,它可以在半小时能掌握使用,而tensorflow则需要耗费更多的时间和精力才能使用。但它无法构造一些自己设计的网络。
使用Keras学习深度学习,本质上就是搭积木:
2. 深度学习的Hello world
使用的数据集是MNIST,即手写数字识别。
下图依然为我们熟知的三大步:
2.1 构建序贯模型(定义函数集合)
其中第一个隐藏层需要指定输入维度,其他的隐藏层不需要输入。
2.2 定义损失函数
注意:这里仅包括loss的那一项。
2.3 定义优化算法和训练参数(训练)
训练参数batch_size为100,epoch为20:
2.4 模型评估和预测
2.5 使用GPU加速
方法一 命令行输入python YourCode.py THEANO_FLAGS=device=gpu0
方法二 代码输入import osos.environ["THEANO_FLAGS"] = "device=gpu0"
3. 小批量梯度下降
小批量梯度下降就是从样本中随机抽取batch_size个样本,然后进行训练。在之前看过paper对应的代码实现中,就是把样本划分为几个batch,在一个epoch中逐个batch进行迭代更新。
batch_size是个很重要的参数。batch size最好使用2^n个。
判断快慢不能单看某一个batch的更新速度,要看一个epoch的更新速度,batch size大一些,会稳定一些,可以进行并行运算加速,但是太大,GPU吃不消,batch size太大,由于随机性比较小,容易卡在saddle point。
为什么采用小批量梯度下降会比随机梯度下降要快呢?
小批量梯度下降多个batch可以作并行运算,而随机梯度下降无法做。举个不恰当的例子,如1+1+…1(逐次累加100次)的时间<同时算5个1(一共20个组)+合并的时间。
李宏毅机器学习 深度学习入门相关推荐
- 机器学习/深度学习入门资料汇总
作者:刘才权 编辑:栾志勇 经常被同学和朋友询问机器学习或深度学习入门,有哪些不错的参考资料.老实讲,这个问题在网上随便一搜就是一大把的答案.我自己在最开始的时候也有同样的困惑,同样在搜索引擎和论坛里 ...
- 【吐血推荐】机器学习/深度学习入门资料汇总及学习建议【入门必看】
机器学习入门,初学者遇到的问题非常多,但最大的问题就是: 资料太多!!!看不完!!!不知道如何取舍!!! 一.机器学习的数学基础 正规的机器学习数学基础主要有: 数学分析(微积分),线性代数,概率论, ...
- 人工智能,机器学习,深度学习入门好文,强烈推荐
让我们从机器学习谈起 导读:在本篇文章中,将对机器学习做个概要的介绍.本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践.当然,本文也面对一般读者,不会对阅读有相关的前提要 ...
- 李宏毅-机器学习深度学习-第六讲-深度学习介绍
哔哩哔哩视频地址:https://www.bilibili.com/video/av94411666?p=10 (请自行拷贝到浏览器打开) 李宏毅深度学习–第六讲–深度学习介绍
- 2022李宏毅机器学习深度学习学习笔记--第一周
文章目录 摘要 机器学习的基本概念 机器学习 不同的函式类别 gradient descent 深度学习(Deep learning) Case study 摘要 本文主要介绍什么是机器学习,机器学习 ...
- 全球名校AI课程库(43)| 李宏毅 · 机器学习(深度学习)课程『Machine Learning』
- 机器学习深度学习算法及代码实现
原文地址:https://blog.csdn.net/qq_31456593/article/details/69340697 最近在学机器学习,学习过程中收获颇多,在此留下学习记录,希望与同道中人相 ...
- 一篇文章解决机器学习,深度学习入门疑惑
前言 进入正文前,我们先来看则新闻: 只看图不多说. 由此可见国家对人工智能的重视程序,趁早学习,让我们也贡献一份力量. 这篇文章要说的东西 研究生有不少日子,和之前的几个学长以及几个学弟偶尔也聊聊天 ...
- python3人工智能网盘_《Python3入门人工智能掌握机器学习+深度学习提升实战能力》百度云网盘资源分享下载[MP4/5.77GB]...
内容简介 本资源为<Python3入门人工智能掌握机器学习+深度学习提升实战能力>百度云网盘资源分享下载,具体看下文目录,格式为MP4/5.77GB.本资源已做压缩包处理,请勿直接在百度网 ...
最新文章
- 推荐15个国外使用 CSS3 制作的漂亮网站
- RocketMQ消息丢失场景及解决办法
- CIO需“野蛮生长” 2017中国CIO高峰论坛7月开幕
- (62)时钟中断切换线程,时间片管理, KiDispatchInterrupt
- 洛谷P1966 火柴排队(逆序对)
- wxWidgets:使用 wxWidgets 的示例控制台(与 GUI 相对)程序
- js的object的key需要引号吗_今天你用书名号了吗?
- Oracle EBS R12.1.1 应用克隆 - 3
- YBTOJ洛谷P3292:幸运数字(线性基、点分治/倍增)
- 在命令提示符中运行c语言程序,【命令提示符运行exe】命令提示符运行文件_命令提示符运行程序-系统城...
- TCPIP协议详解----网络基础知识
- Python实现离线字典+听写单词(一):获取离线字典
- Android之录制歌曲
- linux7如何改ssid,ssid怎么设置,教您网络ssid怎么设置
- IT人才异军突起 有招网引领业界精英
- 官方rom提取原签名工具_官方和第三方ROM的提取与分解
- 双11有哪些好用的降噪蓝牙耳机值得推荐?降噪蓝牙耳机性价比排行
- 南京标志设计-logo商标设计-企业VI形象识别系统
- android自动接收并填充短信验证码
- c++学习笔记(七、异常和I/O)
热门文章
- 西瓜书线性回归和最小二乘法公式推导
- 魔咒词典题解——牛客
- 专业的猎头能为你做什么
- Oracle查询一段时间内的每一天
- Win11地平线4 Xbox live无法登录?或者地平线4无法使用在线模式?尝试一波!!!
- JAVA 证书信任 :unable to find valid certification path to requested target
- contains invalid call from '~PRES8 (The user did n......
- 去掉chrome开发者提示
- 如何在Linux中安装nasm最新版本
- cool edit 如何制作声音淡出效果?