Introduction

大语言模型现在已经展示了很好的效果在各种下游任务，如GPT4。但是GPT的数学能力还没有达到最优。

在这篇文章中，作者提出了Goat，通过领域数据微调LLaMA，包含1M指令数据，实现了在基础数学上的Sota水准。

然而在训练期间，作者也遭遇了一些困难，如在较大数值上的乘除法。
为了解决这个难题，作者把数据分为可学习问题与不可学习问题，当遇到与可学习问题，把它分解为多个乘除法。

Method

语言模型

作者认为数学能力表现出了Sota的能力归因于LLaMA的tokenizer，因为它可以把每一个数字分解成一个单独的token，而其他模型则不可以。如下图：

数学问题学习能力

在某个领域任务中，有些任务是可以学习的，有些任务是不能学习的，不可学习的任务可以分解为可学习的CoT任务。

作者通过实验，把数学任务分为这两类。可学习的任务，在一定的训练下就可以实现高质量的直接输出。
而不可学习的任务，即使拓展再多的数据进行训练，即使是GPT4也不会有很好的结果。
通过Fine-tune成功分类了两类任务，如下图：

unlearnable 的任务为复杂的乘法与除法，这也符合人类的直觉。

作者也通过实验证明了之前的假设，在其他tokenizer的算法中，采取finetune的方法证明了其他tokenizer效果不好，甚至在LLaMA任务简单的任务效果也不好。

不是所有被划分为unlearnalbe的任务都不可学习，比如两位数✖️两位数的计算，可以通过在10个epoch上过拟合的方式得到90准确度。

相反的，采用之前的提及的分解CoT的方法，仅在1个epoch就可以达到很好的效果。

COT

作者把多位乘法与除法分解，以乘法为例子，把大的数放在左边，分解右面的小一点数（为了CoT长度不超过限制），分解为可学习的乘法，然后相加。

实验

参考

https://arxiv.org/pdf/2305.14201.pdf

Goat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic Tasks相关推荐

论文笔记--Goat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic Tasks
论文笔记--Goat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic Tasks 1. 文章简介 2. 文章概括 3 文章重点技术 3.1 LLM的 ...
LLMs：《Efficient and Effective Text Encoding for Chinese LLaMA and Alpaca》翻译与解读
LLMs:<Efficient and Effective Text Encoding for Chinese LLaMA and Alpaca>翻译与解读目录相关文章 LLMs:&l ...
AIGC之LLaMA：《LLaMA: Open and Efficient Foundation Language Models》翻译与解读
AIGC之LLaMA:<LLaMA: Open and Efficient Foundation Language Models>翻译与解读导读:该论文提出了一个开源的大规模语言模型LL ...
类ChatGPT的部署与微调(上)：从LLaMA、Alpaca/Vicuna/BELLE、中文版
前言近期,除了研究ChatGPT背后的各种技术细节不断看论文(至少100篇,100篇目录见此:ChatGPT相关技术必读论文100篇),还开始研究一系列开源模型(包括各自对应的模型架构.训练方法. ...
nlp gpt论文_GPT-3：NLP镇的最新动态
nlp gpt论文什么是GPT-3? (What is GPT-3?) The launch of Open AI's 3rd generation of the pre-trained langu ...
陌生单词-专业英语代码编码符号1
identical 相同的 identify 识别 lexically distant 词法遥远的 syntactic parsing 句法 transduction model 转换模型 To th ...
变压器 5g_T5：文本到文本传输变压器
变压器 5g With the burgeoning of Transfer Learning, Deep Learning has achieved many wonders. More speci ...
2020年 ICLR 国际会议最终接受论文(poster-paper)列表(三)
来源:AINLPer微信公众号(点击了解一下吧) 编辑: ShuYini 校稿: ShuYini 时间: 2020-02-21 2020年的ICLR会议将于今年的4月26日-4月30日在Mil ...
A Deep Convolutional Neural Network for segmenting and classifying epithelial and stromal regions
文章全名:<A Deep Convolutional Neural Network for segmenting and classifying epithelial and stromal ...

Goat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic Tasks