【吃瓜之旅】本系列是针对datawhale《吃瓜教程-西瓜书和南瓜书》的学习笔记。本次是对西瓜书第五章的个人学习总结。本次学习的是神经网络,因为之前深度学习学过这里的相关内容,以及西瓜书第三章的铺垫。本章相对比较好理解~不过也拓展了一些知识,除了介绍神经元、感知机、多层网络、BP算法,也介绍了一些其他的神经网络开了开眼,BP成功的背后也有很多神经网络模型,也许他们也有绽放的一天吧。本章也介绍了老朋友深度学习。打算学完这本书,把代码录一遍就投入花书的世界。加油加油,本次学习快结束了。不过这样的生活才刚开始。

目录

第五章:神经网络

5.2 感知机与多层神经网络

5.3 误差逆传播算法

5.4 全局最小与局部最小

5.5 其他神经网络

5.6深度学习


第五章:神经网络

5.1神经元模型

本节介绍了神经网络模型中最小组成部分,神经元模型。神经网络是通过计算机和神经科学交叉学科研究的成果。最小单元神经元模型类似神经,在接收外部信号后将信号传递到其他神经元。神经元模型(M-P神经元):当神经元模型在接收外部数据后,对每个数据属性接受的权重不同,以W标记。同时需要通过神经元的阈值,经过“激活函数”后对通过的信号进行反馈。

这里的激活函数情况是(a)所示,但由于这样的阶跃函数存在不连续,不光滑的特点。为了激活函数更容易处理,选择sigmoid函数,保证输出区间在(0,1)。

5.2 感知机与多层神经网络

值得注意的是这里的数据前提书线性可分,也就是二维环境下有直线可以区分样本,

这里将w转x-θ变为w转x  由于将θ看做亚节点

看完感知机的概念后回到那个线性不可分的问题,也就是如下图所示的异或问题,你没办法找到一条直线去解决:

这里就需要我们采用多层神经网络去处理。

以上为解决异或问题的多层神经网络。有了多层神经网络,就可以解决更复杂的问题。但是多层神经网络的参数计算也更困难,该如何计算呢?

5.3 误差逆传播算法

误差逆传播算法就是鼎鼎大名的BP算法,也就是深度学习的鼻祖吧。最成功的深度学习算法,理论上可以解决所有分类和回归问题。不过……

革命尚未成功,同志仍需努力!

回到BP模型:

通过对上图的推到,得到bp网络每个参数的梯度计算方法,也就是知道每个参数的优化方向。在训练模型时,不断训练E,在学习率η控制下使其得到最小值。

上图就是上述推导后用法的计算图,也就是BP算法的计算图。

书上介绍了两种BP算法  累计和标注,标准对每个X都会做一次更新参数,而累计对训练数据做完后再更新参数。一般建议先累计,到差不多后做标准BP。

对于神经网络也会带来过拟合问题,以下是过拟合定义:

解决过拟合采用如下两个方法:

  1. 早停
  2. “正则化”

5.4 全局最小与局部最小

一般我们计算可能到局部最小,因为η学习率的存在,可能得到一个损失函数最低的参数组后不会再变动。可能跳不出这个坑。但是大家还是没有放弃找到全局最小,这里给出三种解决办法:

5.5 其他神经网络

这里介绍了几种别的神经网络,感觉后面可能用得到:

5.5.1RBF

RBF特点就是需要一个中心,用于聚类。

5.5.2 ART

ART是自己和自己竞争的模型,可以做到学且不忘。

5.5.3 SOM

SOM特点就是高维向二维无监督抽象,感觉不错也可以用于无监督聚类。

5.5.4 级联相关网络

级联相关网络,特点就是自己给自己分层。

5.5.5 Elman

这个Elman就是RNN,对于时间序列和语言处理有很好的效果。

5.5.6 Boltzmann机

Boltzmann机是输入和输出互相训练隐藏层,好奇怪的计算。是基础退火算法的升级版。可以求得全局最优的一种BP替代方法,但是计算消耗较大。不过我觉得国内量子计算发展的可以,这个东西将来可能也会替代BP这样的网络吧。这块做了解学习啦。

5.6深度学习

这里主要说了深度学习中随着层数增加较少过拟合问题,但是计算复杂度也变多。

引出“预训练+微调”的方法及“权共享”的方法提升网络计算效率。

玉汝于成,功不唐捐。

【吃瓜之旅】第五章吃瓜学习相关推荐

  1. Tensorflow 2.x(keras)源码详解之第十五章:迁移学习与微调

      大家好,我是爱编程的喵喵.双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中.从事机器学习以及相关的前后端开发工作.曾在阿里云.科大讯飞.CCF等比赛获得多次Top名次.现 ...

  2. Head First HTML与CSS、XHTML++笔记(第四章 WEB镇之旅 第五章 认识媒体)

    第四章 链接(详解<a>元素) 目标锚 在目标位置 <h2><a id="chai">contentTest</a></h2& ...

  3. 计算机科学导论第五章计算机组成 学习笔记+习题答案

    第五章 计算机组成 通过本章的学习,学生应该能够∶ 列出计算机的三个子系统; 描述计算机中央处理单元(CPU)的作用; 描述典型计算机中指令周期的取指令-译码-执行阶段; 描述主存和它的地址空间; 区 ...

  4. KCNA考试 第五章:kubernetes学习实践

    文章目录 1. 简介 2. 学习目标 3. Kubernetes对象 4. 与Kubernetes交互 4.1 Demo: kubectl 5. Pod 概念 5.1 Demo: Pods 6. 负载 ...

  5. 云原生入门 第五章:kubernetes学习实践

    Python微信订餐小程序课程视频 https://edu.csdn.net/course/detail/36074 Python实战量化交易理财系统 https://edu.csdn.net/cou ...

  6. 莫烦Matplotlib可视化第五章动画代码学习

    5.1 Animation 动画 import numpy as np import matplotlib.pyplot as plt from matplotlib import animation ...

  7. 学习笔记----周志华《机器学习》第五章(神经网络)(一)

    周志华的<机器学习>算作一本入门的宝书.本文是对周志华的机器学习第五章神经网络的学习笔记.在第五章主要涉及的内容:神经网络.常见激活函数.感知机.多层前馈神经网络 .反向传播算法(BP算法 ...

  8. 第五章——决策树笔记(《统计学习方法》-李航)

    第五章--决策树笔记(<统计学习方法>-李航) 本文主要记录自己学习李航的小蓝书的过程,之前的4张有时间再补上.本文只做知识点整理,不做详细的见解,因为我认为,依照本人的知识水平,不可能比 ...

  9. stty详解-Unix/Linux编程实践教程第五章 学习stty

    读书笔记-第五章 连接控制 学习stty 先放上思维导图 为设备编程&设备就像文件 前面所学的知识都是基于文件的,而在unix/linux系统中,所有的设备(打印机,终端,话筒,摄像头等等)也 ...

最新文章

  1. oracle所有的乱码解决方案
  2. 【深度学习】Keras和Tensorflow框架使用区别辨析
  3. 【转】Mac下安装和配置Redis
  4. 李宏毅深度学习——优化方法
  5. 【阿里云OSS】访问控制
  6. GitHub上README.md教程(copy)
  7. 哈工大威海c语言实验报告 第八章 无法运行程序,哈工大威海c语言实验报告.doc...
  8. mysql修改表结果
  9. 真美 | 你破坏Java代码的样子,真美!
  10. 物理安全是指保护计算机,计算机网络 物理安全
  11. selenium chromedriver 无头浏览器检测
  12. JavaWeb——动态 web 资源开发
  13. 对话诊断(X)2022IJCAI-My nose is running.Are you also coughing?:Building a Medical Diagnosis Agent with
  14. 【强大知名的CAD绘图工具】AutoCAD 2019 for Mac
  15. 图像增广 || 通过仿射变换实现图像的平移、缩放、旋转、翻转、错切,及MATLAB实现与分析
  16. 2020年复旦大学计算机学院夏令营经历
  17. 什么是Remoting
  18. 录音如何生成二维码?
  19. 解决uniapp微信开发小程序背景本地图片渲染层网络层错误问题
  20. Matlab图像中的unit8和double的处理问题

热门文章

  1. 算法笔记5.5 质因子分解
  2. javaFX资源加载
  3. 概述长程攻击,Part-2:应对方法
  4. invoke,十分钟搞定强大的Python任务自动化工具
  5. Unity中UGUI小地图实现的原理
  6. python使用xlwings操作wps
  7. dsp调音一次多少钱_如何快速学会汽车音响DSP调音技术?
  8. 数字化决策要依靠什么才能实现
  9. AD10 画封装经验【突出长度的问题】【 PCB中任意形状封装修改网络名】
  10. 同个局域网内的A,B两个电脑主机,A能PING通B电脑,B无法PING通A 电脑,双方均能学习到对方ARP地址