Transformer就是一个Sequence-to-sequence的model,他的缩写,我们会写做Seq2seq,那Sequence-to-sequence的model,又是什么呢?

我们之前在讲input a sequence的,case的时候我们说input是一个sequence,那output有几种可能

●一种是input跟output的长度- 样,这个是在作业二 的时候做的
  ●有一个case是output指,output一 个东西,这个是在作业四的时候做的
  ●那接来作业五的case是,我们不知道应该要output多长,由机器自 己决定output的长度,即Seq2seq

1.举例来说,Seq2seq一个很好的应用就是语音辨识

在做语音辨识的时候,输入是声音讯号,声音讯号其实就是一串的vector ,输出是语音辨识的结果,也就是输出的这段声音讯号,所对应的文字

我们这边用圈圈来代表文字,每一个圈圈就代表,比如说中文裡面的一个方块子,今天输入跟输出的长度,当然是有一些关系,但是却没有绝对的关系,输入的声音讯号,他的长度是大T,我们并没有办法知道说根据大T输出的这个长度N一定是多少。

输出的长度由机器自己决定,由机器自己去听这段声音讯号的内容,自己决定他应该要输出几个文字,他输出的语音辨识结果,输出的句子裡面应该包含几个字,由机器自己来决定,这个是语音辨识

2.还有很多其他的例子,比如说作业五我们会做机器翻译


让机器读一个语言的句子 ,输出另外-一个语言的句子,那在做机器翻译的时候输入的文字的长度是N,输出的句子的长度是N',那N跟N'之间的关系,也要由机器自己来决定

输入机器学习这个句子,输出是machine learning,输入是有四个字,输出有两个英文的词汇,但是并不
是所有中文跟英文的关系,都是输出就是输入的二分之- -,到底输入 -段句子,输出英文的句子要多长,
由机器自己决定

3.甚至可以做更复杂的问题,比如说做语音翻译

语音翻译就是,你对机器说一句话,比如说machine learning,他输出的不是英文,他直接把他听到的英
文的声音讯号翻译成中文文字

你对他说machine learning,他输出的是机器学习

為什麼我们要做Speech Translation这样的任务為什麼我们不直接先做一个语音辨识,再做一个机
器翻译把语音辨识系统跟机器翻译系统,接起来就直接是语音翻译?

因為世界上有很多语言,他根本连文字都没有,世界上有超过七千种语言,那其实在这七千种语言,有超过半数其实是没有文字的,对这些没有文字的语言而言,你要做语音辨识,,可能根本就没有办法,因為他没有文字,所以你根本就没有办法做语音辨识,但我们有没有可能对这些语言,做语音翻译,直接把它翻译成,我们有办法阅读的文字

Seq2seq for Chatbot

Seq2seq for Syntactic Parsing(句法分析)     multi-la bel classification

Seq2seq for Object Detection

Encoder-Decoder


我们现在就是要来学,怎麼做seq2seq这件事,一般的seq2seq's model,它里面会分成两块一块是Encoder,另外一块是Decoder

Encoder
seq2seq model Encoder要做的事情,就是给一排向量,输出另外一排向量

给一排向量、 输出一排向量这件事情很多模型都可以做到,可能第一个想到的是 我们刚刚讲完的self-attention,其实不只self-attention,RNN CNN其实也都能够做到input- -排向量output另外一个同样长度的向量
在transformer裡面, transformer的Encoder,用的就是self-attention,这边看起来有点复杂,我们用另外

现在的Encoder裡面,会分成很多很多的block

每一个block ,其实并不是neural network的一层.
每一个block裡面做的事情,是好几个layer在做的事情。

每一个block 又是做这样的事情

Decoder


Encoder做的事情,就是输入一个Vector Sequence,输出另外一个Vector Sequence

接下来,就轮到Decoder运作了,Decoder要做的事情就是产生输出,也就是产生语音辨识的结果,
Decoder怎么产生这个语音辨识的结果

稍微比较一下它们之间的差异那你会发现说,如果我们把Decoder中间这一块,中间这一块把它盖起来,其实Encoder跟Decoder,并没有那麼大的差别

2021/2022李宏毅机器学习笔记-Transform相关推荐

  1. 李宏毅2021/2022春机器学习课程(机器学习基本概念简介)

    (强推)李宏毅2021/2022春机器学习课程_哔哩哔哩_bilibili 目录 1.机器学习是什么? 2.机器学习任务 2.1 regression回归问题 2.2 classification分类 ...

  2. 2021李宏毅机器学习笔记--21 Anomaly Detection

    2021李宏毅机器学习笔记--21 Anomaly Detection(异常侦测) 摘要 一.问题描述 二.Anomaly异常 三.Anomaly Detection(异常侦测)做法 3.1 Bina ...

  3. 2021李宏毅机器学习笔记--12 attack ML models

    2021李宏毅机器学习笔记--12 attack ML models 摘要 一.图像模型的攻击 1.1原理 1.2Constraint 1.3参数训练 1.4一个例子 1.5攻击方法 1.5.1FGS ...

  4. 2021李宏毅机器学习笔记--22 Generative Adversarial Network 01

    @[TOC](2021李宏毅机器学习笔记–22 Generative Adversarial Network 01(GAN,生成式对抗网络)) 摘要 GAN是建立于神经网络的基础上的,其核心思想是&q ...

  5. 李宏毅svm_【李宏毅机器学习笔记】 18、支持向量机(Support Vector Machine,SVM)...

    [李宏毅机器学习笔记]1.回归问题(Regression) [李宏毅机器学习笔记]2.error产生自哪里? [李宏毅机器学习笔记]3.gradient descent [李宏毅机器学习笔记]4.Cl ...

  6. 【李宏毅机器学习笔记】 23、循环神经网络(Recurrent Neural Network,RNN)

    [李宏毅机器学习笔记]1.回归问题(Regression) [李宏毅机器学习笔记]2.error产生自哪里? [李宏毅机器学习笔记]3.gradient descent [李宏毅机器学习笔记]4.Cl ...

  7. 【李宏毅机器学习笔记】 17、迁移学习(Transfer Learning)

    [李宏毅机器学习笔记]1.回归问题(Regression) [李宏毅机器学习笔记]2.error产生自哪里? [李宏毅机器学习笔记]3.gradient descent [李宏毅机器学习笔记]4.Cl ...

  8. 李宏毅机器学习笔记(5-8)

    记录学习李宏毅机器学习的过程,方便知识点的梳理 文章目录 目录 一.误差从哪里来 1.1Error 的来源 1.2估测 1.3估测变量的偏差和方差 1.4估测方差 1.5考虑不同模型的方差 1.6考虑 ...

  9. 2018-3-20李宏毅机器学习笔记十----------Logistic Regression

    上节讲到:既然是一个直线型,只需要求解w和b.为何还要那么费劲的使用概率??? 视频:李宏毅机器学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili https://www.bilib ...

最新文章

  1. Spring之LoadTimeWeaver——一个需求引发的思考---转
  2. 基于以太坊的去中心化宠物商店构建教程
  3. [Go] golang设置运行的cpu数
  4. Spark加载hadoop配置原理
  5. 6.Excel项目排期表
  6. LeetCode 637. Average of Levels in Binary Tree
  7. 华兴数控g71外圆循环编程_数控车床加工时的复合循环指令G70,G71,G72,G73
  8. Gratipay如何帮助解决“搭便车”问题
  9. ibatis 分页(转)
  10. 华为手机怎么使用读卡器_华为G7手机OTG功能详细使用教程
  11. 2019年计算机设计大赛(省赛)
  12. 如何在win10上连接苹果无线键盘
  13. Markdown表格合并单元格
  14. 太阳直射点纬度计算公式_高中地理:正午太阳高度公式的应用
  15. 单利终值和现值matlab,单利终值现值和复利终值现值公式
  16. SpringCache-redis缓存学习记录
  17. 输入法规则(U模式输入)
  18. 游戏平台搭建韩国大带宽CN2服务器哪里的比较便宜
  19. 如何用adobe audition剪切音频单独导出保存
  20. 数据挖掘 | 航空公司客户流失预测

热门文章

  1. 切换多个swiper之后滑动轮播图底下的分页器不动了?
  2. android中怎么实现轮播图,Android中轮播图的实现
  3. Python 练习题讲解
  4. 记录:不允许1130连接mysql_解决Navicat 报错:1130-host ... is not allowed to connect to this MySql server
  5. linux系统做gost镜像,linux下如何像ghost一样备份系统
  6. 电脑无法连接WiFi?WLAN图标消失?
  7. 汇编语言 王爽 第四版 实验5
  8. uboot和linux内核移植流程简述
  9. 88se9125 88se9230的驱动初始化有什么差异吗
  10. JNI - JAVA 数据类型转换