Codex:
基于GPT的语言模型,用Github上的代码进行微调(有意思的是GPT的卖点就是不用微调)。
模型没怎么改动,主要精力在于准备预训练数据和微调数据集(微调数据集应尽可能和你要进行评估的任务相近)上
目标函数的分数不采用常见的BLUE分数因为相同的子序列多并不意味着写出的代码就有效,因此作者团队自己设计了一个pass@K,即每个词采样softmax分数总和0.95的输出,在这些词里面每次随机采样,最后看生成的答案能否通过测试,若以100次采样中有1次能通过测试则算成功,准确度能达到接近80%。

AlphaCode:
流程与Codex接近,用预训练和微调训练一个transformer模型(带完整的编码器和解码器,编码器适合长序列时双向理解文章),最后结果比Codex要好一点,在编程竞赛上能打败54%的人。
预训练数据也是在github上爬的,比Codex大了5倍,微调数据集采用的是CodeContest
编码器和解码器非对称设计,由目标任务进行归纳偏置。
中间有很多trick

准确度线性增加,数据集和模型参数指数级增长

OpenAI Codex、DeepMind AlphaCode论文精读阅读笔记相关推荐

  1. A Survey of Deep Learning-based Object Detection论文翻译 + 阅读笔记

    A Survey of Deep Learning-based Object Detection论文翻译 + 阅读笔记 //2022.1.7 日下午16:00开始阅读 双阶段检测器示意图 单阶段检测器 ...

  2. 关于动物识别论文的阅读笔记——青鳉鱼的个体识别和“面部反转效应”

    论文简介 论文中文翻译:<青鳉鱼的个体识别和"面部反转效应"> 论文名称:<Individual recognition and the 'face invers ...

  3. 【LOAM系列】四:LIO-SAM论文代码阅读笔记

    LIO-SAM IROS 2020 MIT Tixiao Shan 1.论文 1.1 概述 IMU预积分的运动估计对点云进行去畸变并产生激光里程计优化的初始估计. 激光雷达里程计用于估计IMU的零偏. ...

  4. 论文阅读笔记——A deep tree-based model for software defect prediction

    本论文相关内容 论文下载地址--Web Of Science 论文中文翻译--A deep tree-based model for software defect prediction 论文阅读笔记 ...

  5. 论文阅读笔记——基于CNN-GAP可解释性模型的软件源码漏洞检测方法

    本论文相关内容 论文下载地址--Engineering Village 论文阅读笔记--基于CNN-GAP可解释性模型的软件源码漏洞检测方法 文章目录 本论文相关内容 前言 基于CNN-GAP可解释性 ...

  6. 强化学习相关论文阅读笔记之稀疏奖励解决方法

    注:该系列文章为强化学习相关论文的阅读笔记,欢迎指正! 论文题目:<深度强化学习中稀疏奖励问题研究综述> 文章目录 1. 论文介绍 2. 论文结构 3. 研究背景 3.1 解决稀疏奖励的必 ...

  7. SaliencyReview:显著性检测综述阅读笔记

    typora-root-url: images SaliencyReviews 显著性检测论文综述阅读笔记 Author: wbzhang 2020/3/19 E-mail: wbzhang233@1 ...

  8. 【计算机视觉】Mip-nerf 论文精读记录

    [计算机视觉]Mip-nerf 论文精读记录 本人是刚入门的计算机视觉小白,此系列为nerf论文精读系列笔记记录,感兴趣的朋友可以关注一下,共同成长! Mip-NeRF: A Multiscale R ...

  9. 论文阅读笔记——VulDeePecker: A Deep Learning-Based System for Vulnerability Detection

    本论文相关内容 论文下载地址--Engineering Village 论文中文翻译--VulDeePecker: A Deep Learning-Based System for Vulnerabi ...

最新文章

  1. python没基础可以学吗-无基础学python,能学会吗?
  2. 论信息部门与业务部门的关系
  3. 截断骨干用于检测,YOLO-ReT开源:边缘GPU设备上的高性能检测器
  4. Codeforces Round #533 (Div. 2)题解
  5. Linux下如何可写挂载ntfs分区
  6. c语言中栈堆,全程剖析C语言中堆和栈的区别
  7. IIS Tomcat共享80端口
  8. 轻量化网络:Xception
  9. 在 Mac 上的 Pages 文稿中如何添加和替换文本?
  10. [网络安全自学篇] 四十八.Cracer第八期——(1)安全术语、Web渗透流程、Windows基础、注册表及黑客常用DOS命令
  11. 异速联某客户端无法登陆
  12. Windwos Server 2012 R2 安装LLDP协议驱动程序
  13. 联想服务器系统初始化失败怎么回事,win10重置初始化失败怎么解决
  14. HtmlHelper用法大全(上)
  15. 芝诺志愿者走进养老院送温暖
  16. Apache Doris1.0版本集群搭建、负载均衡与参数调优
  17. 白平衡,及白平衡调节过程
  18. Android: How to Capture Screen in Gingerbread(2.3中实现截屏)
  19. nvm安装,nvm的使用,nvm常用命令,nvm安装node报错,nvm切换不了,等系列集合
  20. 本地windows首次远程登录阿里云ECS服务器

热门文章

  1. fffffffffffffffffffffffffffff
  2. 【Linux】【开发环境】【RHEL】开发环境搭建系列之十——Linux主机环境下挂载samba服务器
  3. 2022嵌入式工程师面经(2023年1月更新)
  4. DirectUI界面编程(零)简介
  5. 《解救吾先生》TC枪版1.07GB迅雷bt种子ed2k下载
  6. ARM 开发板嵌入式linux系统与主机PC通过串口传输文件
  7. python爬虫去哪儿网_用python爬虫爬取去哪儿4500个热门景点,看看国庆不能去哪儿...
  8. VUE学习(七) 自定义列表鼠标移入变色,点击变色(仿el-table实现)
  9. linux的无值守安装实例
  10. Qcon演讲实录 | XQUIC与多路径传输技术Multipath QUIC