文章目录

  • 前言
  • 一、ChatGPT做的事情
  • 二、ChatGPT基础介绍
  • 三、ChatGPT带来的研究问题
  • 总结

前言

ChatGPT简单原理介绍


一、ChatGPT做的事情


Chatgpt以句子为输入,输出这个句子后面接的词汇的概率分布,给每一个可能的符号一个概率,根据这个分布进行sample,每次sample出来的词汇可能都是不一样的,所以答案每次也都不相同。把输出的词汇加在输入给gpt的句子后面,重复上面的过程,直到最后出现一个符号代表结束。


在一个对话过程中,输入不仅是现在输入的句子,还包含过去所有的互动。
同时GPT在训练时是联网的,但是在测试时,是没有联网的,所以输出的很多结果比如网址、序列号等都是错误的,只是GPT瞎编出来的。

二、ChatGPT基础介绍

ChatGPT关键技术:预训练Pre-train
预训练也可以叫做自监督式学习Self-supervised Learning或基石模型(Foundation Model),成对资料通过无痛生成的叫做自监督式学习。ChatGPT是由GPT微调而来,GPT就是ChatGPT的基石。
G:Generative
P:Pre-train
T:Transformer

人类可以提供的成对资料相对来说是少的,GPT的获取成对资料的方式是通过获取网络上的句子,这些句子拆分成两部分,网络上的所有句子都可以是资料。

透过大量网络学习的过程是预训练,得到GPT,ChatGPT是GPT经过监督式学习的结果。这个继续学习的过程也就是微调(Finetune)

增强式学习适用于某些人类都不知道答案的情况下,只需要人类只需要评价这个答案的好坏就可以。

三、ChatGPT带来的研究问题

1.如何精准提出需求
先要对chatgpt进行催眠(prompting),比如请想象这类的描述。

2.如何更正错误->neural editing
比如发生在2022年的事情,GPT无法得出结果。如果那新的答案再去训练接龙,更新参数,可能会发生弄对一个答案,但是弄错更多答案的情况。

3.侦测AI生成的软件
如何用模型侦测一段文字是否是AI生成的

4.泄露秘密
对chatgpt绕着弯的诱导,是可以获得某些隐私答案,当然这些答案可能是错误的。


总结

学习视频地址:
1
https://www.bilibili.com/video/BV1TD4y137mP?p=2&vd_source=3a369b537e1d34ff9ba8f8ab23afedec
2
https://www.bilibili.com/video/BV1TD4y137mP?p=3&vd_source=3a369b537e1d34ff9ba8f8ab23afedec
3
https://www.bilibili.com/video/BV1TD4y137mP?p=4&vd_source=3a369b537e1d34ff9ba8f8ab23afedec

机器学习李宏毅学习笔记37相关推荐

  1. 机器学习李宏毅学习笔记35

    文章目录 前言 一.Meta learning 1.第一步 2.第二步 3.第三步 二.machine learning 和 meta learning区别 总结 前言 Meta learning元学 ...

  2. 机器学习李宏毅学习笔记33

    文章目录 前言 一.神经网络压缩 二.Network pruning----一种network compression技术 1.移除不同单位的区别 2.大乐透假说 总结 前言 神经网络压缩(一) 类神 ...

  3. Kaggle教程 机器学习入门学习笔记

    机器学习入门学习笔记 [跳转]<Kaggle教程 机器学习入门>系列课程目录 >> 决策树 简介:是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零 ...

  4. python嵩天课堂笔记_[Python机器学习]强化学习笔记(嵩天礼欣老师mooc第三周)

    [Python机器学习]强化学习笔记(嵩天礼欣老师mooc第三周) [Python机器学习]强化学习笔记(嵩天礼欣老师mooc第三周) 目录 强化学习 定义 马尔科夫决策过程 基本元素 值函数 最优值 ...

  5. 机器学习入门学习笔记:(4.2)SVM的核函数和软间隔

    前言 之前讲了有关基本的SVM的数学模型(机器学习入门学习笔记:(4.1)SVM算法).这次主要介绍介绍svm的核函数.软间隔等概念,并进行详细的数学推导.这里仅将自己的笔记记录下来,以便以后复习查看 ...

  6. 机器学习入门学习笔记:(3.2)ID3决策树程序实现

    前言 之前的博客中介绍了决策树算法的原理并进行了数学推导(机器学习入门学习笔记:(3.1)决策树算法).决策树的原理相对简单,决策树算法有:ID3,C4.5,CART等算法.接下来将对ID3决策树算法 ...

  7. 机器学习入门学习笔记:(2.3)对数几率回归推导

    理论推导   在以前的博客(机器学习入门学习笔记:(2.1)线性回归理论推导 )中推导了单元线性回归和多元线性回归的模型.   将线性回归模型简写为:y=ωTx+by = \omega^Tx+b:   ...

  8. 机器学习入门学习笔记:(2.2)线性回归python程序实现

      上一篇博客中,推导了线性回归的公式,这次试着编程来实现它.(机器学习入门学习笔记:(2.1)线性回归理论推导 )   我们求解线性回归的思路有两个:一个是直接套用上一篇博客最后推导出来的公式:另一 ...

  9. 吴恩达《机器学习》学习笔记十四——应用机器学习的建议实现一个机器学习模型的改进

    吴恩达<机器学习>学习笔记十四--应用机器学习的建议实现一个机器学习模型的改进 一.任务介绍 二.代码实现 1.准备数据 2.代价函数 3.梯度计算 4.带有正则化的代价函数和梯度计算 5 ...

最新文章

  1. 转: IO设计模式:Reactor和Proactor对比
  2. xml命名空间只是标记区分不同的空间的作用,一般与上网无关,虽然通常都写的是URL网址
  3. [Java] 02 String的常用方法
  4. 接口是否可继承接口? 抽像类是否可实现(implements)接口? 抽像类是否可继承实体类(concrete class)?...
  5. windows ffmpeg 的安装
  6. 浅谈GSM/GPRS模块软硬件设计(基于有方M660+模块和单片机)
  7. iqooneo系统要不要更新_IQOOZ1即将发布,和IQOOneo3、OPPORenoACE对比,谁更值得入手?...
  8. 基于深度学习的图像修补/完整方法分析
  9. php ftp login,关于php ftp_login()函数的10篇文章推荐
  10. 如何分析android的OOM,与java静态代码分析工具
  11. mysql 模糊匹配 拆字_一文,5 分钟搞明白 MySQL 是如何利用索引的!
  12. 和 对比_Yeezy350V2新灰橙真假对比
  13. Unity世界坐标转换屏幕坐标(概览)
  14. Trizol法提取RNA实验步骤
  15. ubuntu下开启/禁用笔记本触摸板
  16. 国产香氛品牌别样的生意经
  17. 软件发布版本区别介绍
  18. Sigmoid 函数的求导过程
  19. 【会议征稿|SPIE独立出版|往届已检索】第二届人工智能、虚拟现实与可视化国际学术会议(AIVRV 2022)
  20. 运维基础(二):Tomcat日志文件详解

热门文章

  1. flutter聊天界面-自定义表情键盘实现
  2. 打开这1个设置,你的华为手机还能变成路由器,无需消耗移动流量
  3. 周迅 女明星卸妆后判若两人 (图)
  4. 键盘的win键和Alt反了
  5. Mark-Sweep算法
  6. 阴沟里翻船 联想笔记本装不了XP?
  7. Google云计算之Bigtable
  8. 白学立体视觉(1): 双目视觉
  9. JSTL标签库及常用标签
  10. 从零开始学习移动端Web开发