Goat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic Tasks

  • Introduction
  • Method
    • 语言模型
      • 数学问题学习能力
      • COT
  • 实验
  • 参考

Introduction

大语言模型现在已经展示了很好的效果在各种下游任务,如GPT4。但是GPT的数学能力还没有达到最优。

在这篇文章中,作者提出了Goat,通过领域数据微调LLaMA,包含1M指令数据,实现了在基础数学上的Sota水准。

然而在训练期间,作者也遭遇了一些困难,如在较大数值上的乘除法。
为了解决这个难题,作者把数据分为可学习问题与不可学习问题,当遇到与可学习问题,把它分解为多个乘除法。

Method

语言模型

作者认为数学能力表现出了Sota的能力归因于LLaMA的tokenizer,因为它可以把每一个数字分解成一个单独的token,而其他模型则不可以。如下图:

数学问题学习能力

在某个领域任务中,有些任务是可以学习的,有些任务是不能学习的,不可学习的任务可以分解为可学习的CoT任务。

作者通过实验,把数学任务分为这两类。可学习的任务,在一定的训练下就可以实现 高质量的直接输出。
而不可学习的任务,即使拓展再多的数据进行训练,即使是GPT4也不会有很好的结果。
通过Fine-tune成功分类了两类任务,如下图:

unlearnable 的任务为复杂的乘法与除法,这也符合人类的直觉。

作者也通过实验证明了之前的假设,在其他tokenizer的算法中,采取finetune的方法证明了其他tokenizer效果不好,甚至在LLaMA任务简单的任务效果也不好。

不是所有被划分为unlearnalbe的任务都不可学习,比如两位数✖️两位数的计算,可以通过在10个epoch上过拟合的方式得到90准确度。

相反的,采用之前的提及的分解CoT的方法,仅在1个epoch就可以达到很好的效果。

COT

作者把多位乘法与除法分解,以乘法为例子,把大的数放在左边,分解右面的小一点数(为了CoT长度不超过限制),分解为可学习的乘法,然后相加。

实验

参考

https://arxiv.org/pdf/2305.14201.pdf

Goat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic Tasks相关推荐

  1. 论文笔记--Goat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic Tasks

    论文笔记--Goat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic Tasks 1. 文章简介 2. 文章概括 3 文章重点技术 3.1 LLM的 ...

  2. LLMs:《Efficient and Effective Text Encoding for Chinese LLaMA and Alpaca》翻译与解读

    LLMs:<Efficient and Effective Text Encoding for Chinese LLaMA and Alpaca>翻译与解读 目录 相关文章 LLMs:&l ...

  3. AIGC之LLaMA:《LLaMA: Open and Efficient Foundation Language Models》翻译与解读

    AIGC之LLaMA:<LLaMA: Open and Efficient Foundation Language Models>翻译与解读 导读:该论文提出了一个开源的大规模语言模型LL ...

  4. 类ChatGPT的部署与微调(上):从LLaMA、Alpaca/Vicuna/BELLE、中文版

    前言 近期,除了研究ChatGPT背后的各种技术细节 不断看论文(至少100篇,100篇目录见此:ChatGPT相关技术必读论文100篇),还开始研究一系列开源模型(包括各自对应的模型架构.训练方法. ...

  5. nlp gpt论文_GPT-3:NLP镇的最新动态

    nlp gpt论文 什么是GPT-3? (What is GPT-3?) The launch of Open AI's 3rd generation of the pre-trained langu ...

  6. 陌生单词-专业英语代码编码符号1

    identical 相同的 identify 识别 lexically distant 词法遥远的 syntactic parsing 句法 transduction model 转换模型 To th ...

  7. 变压器 5g_T5:文本到文本传输变压器

    变压器 5g With the burgeoning of Transfer Learning, Deep Learning has achieved many wonders. More speci ...

  8. 2020年 ICLR 国际会议最终接受论文(poster-paper)列表(三)

    来源:AINLPer微信公众号(点击了解一下吧) 编辑: ShuYini 校稿: ShuYini 时间: 2020-02-21     2020年的ICLR会议将于今年的4月26日-4月30日在Mil ...

  9. A Deep Convolutional Neural Network for segmenting and classifying epithelial and stromal regions

      文章全名:<A Deep Convolutional Neural Network for segmenting and classifying epithelial and stromal ...

最新文章

  1. 模拟文件上传(一):手动文件上传
  2. 孙庆新:做产品,感觉从何而来
  3. mysql+drdb+HA
  4. 重视B/S架构系统的发展和开发设计理念
  5. Handler.postDelayed(new Runnable)是否运行在主线程
  6. 无心剑中译奥修《顺其自然》
  7. SkyEye图形化界面使用技巧篇(二)
  8. 默认是字典排序法_每日一课 | Python 进阶编程之字典的高级用法
  9. php实现无限级分类(递归方法)
  10. 源码装置vsftpd
  11. 软件压力测试报告要怎么写,如何做接口压力测试?压力测试报告应该包含哪些结果?...
  12. 谷歌插件--SuperCopy(解决网页中文字不可复制的问题)
  13. 基本办公软件的使用及技巧:便签篇
  14. 【UE4】如何获取/下载虚幻4(Unreal Engine4)源码
  15. MES系统是什么?对企业来说有何好处?
  16. linux视频对话框,抖音对话框视频怎么做?如何在视频画面上添加对话气泡框?视频加对话气泡的方法...
  17. 为什么企业微信只能群发一次?如何增加群发次数?
  18. 怎么把m4a转换成mp3,分享几个方法给大家!
  19. win7计算机开始里没有设置,win7电脑开始菜单的设置方法
  20. MFRC522与单片机测试过程及代码

热门文章

  1. AOP(四)之After增强处理
  2. Manjaro Linux 双显卡安装步骤及独立显卡运行游戏
  3. XXX.dll 不是有效的 Office 加载项,解决方法
  4. 极客日报:小米回应造车传闻;饿了么就春节“套路”骑手活动致歉;苹果研发 iPhone12 无线充电电池组...
  5. linux升级gcc版本详细教程
  6. 解决重启后 /mnt/hgfs下共享文件夹挂载失效问题
  7. 闲鱼开店不赚钱的四大原因
  8. 重装系统之后sublime text3快捷键生成html用不了
  9. Lua快速入门篇(XLua教程)(Yanlz+热更新+xLua+配置+热补丁+第三方库+API+二次开发+常见问题+示例参考)
  10. blender3.2.1 unit setting