transformer:

position-embedding:

残差:我也会了

addnorm:我也会了

class Position_Embedding(nn.Module):def __init__(self, max_len, embedding_dim):self.max_len = max_lenself.embedding_dim = embedding_dimresult = torch.ones(self.max_len, self.embedding_dim, requires_grad=False)pos = torch.arange(max_len)[:, None]i_even = torch.arange(0, embedding_dim, 2)[None, :]i_odd = torch.arange(1, embedding_dim, 2)[None, :]even_value = pos / (10000**(2*i_even/self.embedding_dim))odd_value = pos / (10000**(2*i_odd/self.embedding_dim))result[:, 0::2] = torch.sin(even_value)result[:, 1::2] = torch.cos(odd_value)self.position_embedding = resultdef forward(self, x):position_embedding = x + self.position_embeddingreturn position_embedding

self-attention以及mask-padding部分:

周末忙完了自己实现一遍,带进任务,看看效果。

attention组合位置信息,全连接组合特征信息

transformer中的masked loss:不要算pad部分的loss  tf中有对应的函数(也可以利用CROSSentropy的一个ignore参数)

2023-03-22干活小计:相关推荐

  1. 2023-03-13干活小计

    08:30到达实验室 24:00左右离开 切片操作中:[]中,逗号,区分的是维度,冒号:区分的是索引,省略号- 用来代替全索引长度 rnn 文本分类终于跑完了 古诗生成: 正则表达式: #patter ...

  2. 2023-02-20干活小计:

    所以我今天的活开始了: In this paper, the authors target the problem of Multimodal Name Entity Recognition(MNER ...

  3. English Learning - L2-5 英音地道语音语调 弹力双元音 [ɪə] [ʊə] [eə] 2023.03.6 周一

    English Learning - L2-5 英音地道语音语调 弹力双元音 [ɪə] [ʊə] [eə] 2023.03.6 周一 朗读节奏 元音的长度 元音发音在清辅音和浊辅音前的区别 元音发音跟 ...

  4. excel函数:汉字转全拼_星期五的Excel函数:带过滤器的小计和总和

    excel函数:汉字转全拼 Last week, we used the Excel SUBTOTAL function to sum items in a filtered list, while ...

  5. Oracle关于分组小计再合计

    其实在之前就写过mysql关于分组小计再合计,只是当时限于知识和眼界所限,所以给了一个不能算是通用的方案的方案,仅仅只是从效果上完成了任务.随着时间的发展,见识到的东西也多了些,近期在使用Oracle ...

  6. SAP小技巧之 实现SMARTFORM打印中的小计与总计

    点击蓝字 关注我们 一 前言 公众号群里面有人在讨论SMARTFORM打印中的小计和总计的实现.好久没有做SMARTFORM了, 所以没有参与讨论. 后来网上查询了一下. 也没有找到很好的解决方案.所 ...

  7. Delphi报表开发ReportMachine的小计和总计的计算

    Delphi报表开发ReportMachine的小计和总计的计算 2011年7月2日 分类: Delphi, 开发笔记 最近在做一个Delphi的发货清单的打印程序,其中涉及到需要计算清单的小计和总计 ...

  8. English Learning - L2-7 英音地道语音语调 爆破音 [p] [b] [t] [d] [k] [g] 2023.03.13 周一

    English Learning - L2-7 英音地道语音语调 爆破音 [p] [b] [t] [d] [k] [g] 2023.03.13 周一 课前热身 辅音 辅音的定义 清辅音和浊辅音的区别 ...

  9. Go C画图 CSP-J 信息学奥赛 2023.03。13、14、15测试题

    2023.03.09.10.11.12 测试题(选做3-5题) 请将每1道题做完后,将AC截图发到QQ群里 请测试完成后,统计一下AC题目的个数 379.场记板 难度:1 登录 385.身高 难度:1 ...

最新文章

  1. 【组队学习】【28期】Datawhale组队学习内容介绍
  2. 日10亿级处理,基于云的微服务架构
  3. 【转】Python 代码调试技巧
  4. 关于类和对象的进一步讨论 C++
  5. 途牛订单的服务化演进
  6. Spring Boot构建多租户SaaS平台核心技术指南
  7. PAT甲级1120 Friend Numbers:[C++题解]set去重且有序
  8. 操作系统之多线程编程—读者优先/写者优先详解
  9. 爬虫爬到的网页源代码不是真正的源代码_Python爬虫经常爬不到数据?你可以看一下这篇文章...
  10. 备份工具之Xtrabackup
  11. 李迟2021年4月知识总结
  12. 【多元统计分析】课程总结
  13. 香农码字matlab,香农编码的MATLAB实现.ppt
  14. 1m照片的宽和高是多少_1M照片是多大
  15. 智能家居普及的最大障碍:如何“排座次”
  16. Scroll View控制菜单栏的伸缩
  17. 2021年,各类显卡的计算能力对比,天梯图
  18. 验证码识别论文总结---外文篇
  19. 服务器一直即将注销你的登录,win10系统提示即将注销你的登录如何解决
  20. 如何往虚拟机里面复制文件(末尾附带视频教程)

热门文章

  1. C919用了哪些人工智能(AI)技术?
  2. msp430G2553串口通信_launchpad串口通信
  3. 华捷艾米a200摄像头_华捷艾米:3D MR打破行业边界,优化产业结构,让生活更美好...
  4. Sony A200小试~
  5. linux卸载netdata,Arch Linux/Ubuntu/Debian/CentOS/Fedora上安装NetData性能监视工具
  6. dnspy 修改 伊格利亚战记 军队维护费和英雄维护系数
  7. 图书管理系统测试报告--登录功能测试篇
  8. 学生id号码是什么意思_ID号是什么?
  9. TMS320C6748定时器32位模式
  10. 群晖添加SSL证书,开启hhttps