本文将主要讲解全连接神经网络的基本结构,包括对神经元、网络的输入 & 输出,权重w & 偏置b,激活函数的理解与符号约定。主要参考Neural Networks and Deep Learning这本书,非常适合初学者入门。

一、神经元—神经网络的组成单元

神经元模型的符号约定:输入:x⃗\vec{x}x,权重(weight):w⃗\vec{w}w,偏置(bias):bbb,未激活值:zzz,激活输出值:aaa
神经元可用于解决部分二分类问题——当有一个类别未知的x⃗\vec{x}x输入感知机,若输出值a = 1时,感知机被激活,代表_x_属于第一类;若输出值a = 0时,感知机未激活,则代表x属于第二类。而对于sigmoid神经元,若输出值a ≥ 0.5时,代表x属于第一类,否则为第二类。

二、sigmoid神经元的优势

不难看出,感知机可以轻松实现“与非”逻辑,而与非逻辑可以组合成其他任意的逻辑,但对于一些过于复杂的问题,我们难以写出其背后地逻辑结构。这时候神经网络就能大显身手:它可以自适应的学习规律,调节网络地权重和偏置等参数,我们只需要用大量的数据对其正确地训练,即可得到我们想要的效果!
那有一个很有意思的问题:相比于阶跃函数,为什么我们在神经网络中更愿意采用sigmoid函数作为激活函数呢?

首先,由于感知机的激活函数为阶跃函数(在0处突变),权重的一个小的变化就可能导致输出值的突变,而如果将激活函数替换为sigmoid函数,输出值的变化就能发生相应的小的变化,有利于网络学习;另外,由于采用二次代价函数作为损失函数时,利用BP算法求梯度值需要对冲激函数求导,sigmoid函数正好时连续可导的,而且导数很好求。

三、全连接神经网络结构

为了便于理解,先画一个三层的全连接神经网络示意图,激活函数都选用sigmoid函数。全连接神经网络指除输出层外,每一个神经元都与下一层中的各神经元相连接。网络的第一层为输入层,最后一层为输出层,中间的所有层统称为隐藏层。其中,输入层的神经元比较特殊,不含偏置bbb,也没有激活函数σ(⋅)\sigma(·)σ(⋅)。

神经网络结构的符号约定:wkjlw^l_ {kj}wkjl​代表第lll层的第kkk个神经元与第(l−1)(l-1)(l−1)层的第jjj个神经元连线上的权重;WlW^lWl代表第lll层与第l−1l-1l−1层之间的所有权重www构成的权重矩阵。bkl、zkl、aklb^l_ {k}、z^l_ {k}、a^l_ {k}bkl​、zkl​、akl​分别代表第lll层的第kkk个神经元对应的偏置、未激活值、激活值;b⃗l、z⃗l、a⃗l\vec{b}^l、\vec{z}^l、\vec{a}^lbl、zl、al则分别代表第lll层的所有偏置组成的列向量、所有未激活值组成的列向量以及所有激活值组成的列向量。

注意!wkjlw^l_ {kj}wkjl​的**上角标数字lll是连线右边的层的层数,而下角标数字kjkjkj**是先写连线右边的层中神经元所在的位置kkk,再写连线左边的层中神经元所在的位置jjj,此顺序是为了使W⋅x⃗W·\vec{x}W⋅x时无需转置,方便书写。

下面展示了一个手写体识别的三层全连接神经网络结构:

隐藏层的功能可以看作是各种特征检测器的组合:检测到相应特征时,相应的隐藏层神经元就会被激活,从而使输出层相应的神经元也被激活。

近期的更新计划是 1. 如何利用梯度下降算法求解损失函数的最小值(即网络的训练过程)、2. 如何利用BP反向误差传播算法优化梯度求解、3. 梯度下降算法的常见变种。后面也会更新一些BP网络、CNN网络源代码,欢迎关注,有不严谨之处请指正~

【深度学习原理】神经网络结构 符号约定相关推荐

  1. 【深度学习】神经网络结构搜索(NAS)与多模态

    [深度学习]神经网络结构搜索(NAS)与多模态 文章目录1 概述 2 经典的NAS方法2.1 搜索空间2.2 搜索策略2.3 性能评估 3 多模态 4 多模态表示学习 Multimodal Repre ...

  2. 神经网络和深度学习(4)--符号约定

    神经网络和深度学习 上一篇 主目录 下一篇 [前言] 这里会使用到很多的符号,各种符号代表不同的含义.为了方便查询,将符号的含义整理在这里. 注:X.shape可以查看矩阵X的维度 符号 含义 x 表 ...

  3. 深度学习原理-----循环神经网络(RNN、LSTM)

    系列文章目录 深度学习原理-----线性回归+梯度下降法 深度学习原理-----逻辑回归算法 深度学习原理-----全连接神经网络 深度学习原理-----卷积神经网络 深度学习原理-----循环神经网 ...

  4. 深度学习原理-----全连接神经网络

    系列文章目录 深度学习原理-----线性回归+梯度下降法 深度学习原理-----逻辑回归算法 深度学习原理-----全连接神经网络 深度学习原理-----卷积神经网络 深度学习原理-----循环神经网 ...

  5. 视频教程-深度学习原理详解及Python代码实现-深度学习

    深度学习原理详解及Python代码实现 大学教授,美国归国博士.博士生导师:人工智能公司专家顾问:长期从事人工智能.物联网.大数据研究:已发表学术论文100多篇,授权发明专利10多项 白勇 ¥88.0 ...

  6. 深度学习原理学习小结 - Self-Attention/Transformer

    文章目录 深度学习原理学习小结 - Self-Attention/Transformer Self-Attention基本原理 引入 核心概念 计算方法 Transformer基本原理 知识补充 编码 ...

  7. python神经网络原理pdf_《深度学习原理与 TensorFlow实践》高清完整PDF版 下载

    1.封面介绍 2.出版时间 2019年7月 3.推荐理由 本书介绍了深度学习原理与TensorFlow实践.着重讲述了当前学术界和工业界的深度学习核心知识:机器学习概论.神经网络.深度学习.着重讲述了 ...

  8. 深度学习原理与TensorFlow实践

    深度学习原理与TensorFlow实践 王琛,胡振邦,高杰 著 ISBN:9787121312984 包装:平装 开本:16开 用纸:胶版纸 正文语种:中文 出版社:电子工业出版社 出版时间:2017 ...

  9. DL:深度学习算法(神经网络模型集合)概览之《THE NEURAL NETWORK ZOO》的中文解释和感悟(六)

    DL:深度学习算法(神经网络模型集合)概览之<THE NEURAL NETWORK ZOO>的中文解释和感悟(六) 目录 DRN DNC NTM CN KN AN 相关文章 DL:深度学习 ...

最新文章

  1. Java 快速排序算法实现-----面试
  2. 用Python画一只蝙蝠
  3. python3位水仙花数计算
  4. 取sql数据乱码_不基于备份和表,生产系统数据误删就能完全恢复
  5. JS 三级联动 下拉列表
  6. twisted系列教程十四— pre-fireed deferred
  7. HTML高仿哔哩哔哩(B站)视频网站整站模板
  8. java事件 socket_java中有关socket通信的学习笔记
  9. java程序包r不存在_java - 从命令行使用Gradle构建时,“程序包R不存在”错误 - 堆栈内存溢出...
  10. 在SQLServer2005中使用全文搜索
  11. 信号在网线和集线器中的传输(《网络是怎样连接的》).md
  12. 高中计算机基础知识操作题,高中信息技术-word上机操作题
  13. 文本分析苏轼的词以及苏轼的人生轨迹地图
  14. VS Code 的常用快捷键和插件(一)
  15. 【java】JavaFX从零开始实现拼图小游戏
  16. 计算机应用基础考试试题及答案 在word中,用户建立的文件默认,2009年10月全国自考计算机应用基础历年真题...
  17. Javascript 合集 自己整理的收藏 记录一下(最下面有惊喜)
  18. 富文本关键字搜索高亮,解决方法及优化(收藏!)
  19. 2万字库PHP汉字转拼音(UTF-8)
  20. java数据结构代码(全)

热门文章

  1. 一、在linux下安装jenkins
  2. 疫情下的防护——虹膜识别
  3. win10去掉快捷方式小箭头_windows10去除快捷方式箭头,一个小操作,让你的桌面更好看...
  4. 老婆和老公(保证不哭再看)
  5. HJ80 整型数组合并(unique)
  6. 个人形象设计之配饰的搭配选择(1)
  7. Sightseeing Trip(Floyd)
  8. 浅析视频监控技术及AI发展趋势下的智能化视频技术应用
  9. Cozmo人工智能机器人SDK使用笔记(3)-视觉部分vision
  10. likely与unlikely