文章目录

  • 前言
  • 一、准确性提升
    • 1.创造力
    • 2.视觉输入
    • 3.更长的上下文
  • 二、相比于ChatGPT有哪些提升
    • 1.GPT-4 的高级推理能力超越了 ChatGPT
    • 2.GPT-4 在多种测试考试中均优于 ChatGPT。
  • 三、研究团队在GPT-4模型都做了哪些改善
    • 1.遵循 GPT、GPT-2 和 GPT-3 的研究路径
    • 2.我们花了 6 个月的时间使 GPT-4 更安全、更一致。
    • 3.安全与对齐:
  • 四、和一些开发创新产品的组织合作
  • 五、其他
    • 详细研究报告
    • 基础设施:
    • 局限性
    • 可用性
  • 总结

前言

昨晚OpenAI公开了GPT-4的进展,并可以基于ChatGPT实现GPT-4的使用和访问。博主连夜总结出以下Xmind,那么GPT-4到底有哪些巨大的能力提升呢,让我们来一探究竟!【如需进一步交流,请私信】


一、准确性提升

GPT-4 可以更准确地解决难题,这要归功于其更广泛的常识和解决问题的能力。
GPT能力提升主要在三个方面:

1.创造力

如上图所示,是OpenAI官网展示的一个例子,这里我人肉翻译了下:
Input

用一个句子解释灰姑娘的情节,其中每个单词必须以字母表中从 A 到 Z 的下一个字母开头,> 不重复任何字母。

Output

美丽的灰姑娘充满热切地生活,最终找到了幸福;她激发了嫉妒的亲戚们,神奇的爱情滋养着富有的王子;她悄悄地拯救了他,水晶鞋取得胜利,奇妙地将他们紧密团结在一起,这对热情洋溢的年轻人友好相处。

从上述例子汇总我们可以发现,GPT-4 比以往任何时候都更具创造性和协作性。官网说它可以生成、编辑并与用户一起迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。

2.视觉输入

GPT-4还支持视觉输入


上面给出了一个例子:我可以用这些原料干什么,随后给出一张鸡蛋、面粉、奶油的图片。GPT-4给出如下回复:

Output

有很多种方法可以用这些食材制作美食!以下是一些可能的选择:

  • 煎饼或华夫饼
  • 可丽饼
  • 法式吐司
  • 煎蛋卷或意式烘蛋
  • 蛋奶酥或布丁
  • 蛋糕或纸杯蛋糕
  • 松饼或面包
  • 饼干或饼干
    这只是其中的一些例子,但可能性是无穷无尽的!

这回复简直太赞了!

3.更长的上下文


GPT-4 能够处理超过 25,000 个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。

二、相比于ChatGPT有哪些提升

1.GPT-4 的高级推理能力超越了 ChatGPT


Input

安德鲁从上午11点到下午3点有空,乔安娜从中午12点到下午2点,然后从下午3点半到5点有空。汉娜在中午12点有半小时空闲,然后在下午4点到6点有空。对于安德鲁、汉娜和乔安娜来说,安排一场时长30分钟的会议,有哪些开始时间的选项?

ChatGPT Output

以下是他们的空闲时间列表:

  • 安德鲁:上午11点至下午3点
  • 乔安娜:中午12点至下午2点,下午3点半至5点
  • 汉娜:中午12点至12点半,下午4点至6点
    根据他们的空闲时间,有一个30分钟的时间窗口,这三个人都有空,即下午4点至4点半。所以,会议可以安排在下午4点

GPT-4 Output

安德鲁:上午11点 - 下午3点
乔安娜:中午12点 - 下午2点,下午3点半 - 下午5点
汉娜:中午12点 - 12点半,下午4点 - 下午6点
可以安排30分钟会议的共同空闲时间:中午12点 - 12点半

2.GPT-4 在多种测试考试中均优于 ChatGPT。


在统一律师考试中,ChatGPT排名在倒数10%内,而GPT-4或者了前10%的好成绩,而在生物奥林匹克考试中,GPT-4的领先更加夸张,或者排名前1%的好成绩,而ChatGPT才排31名。


三、研究团队在GPT-4模型都做了哪些改善

1.遵循 GPT、GPT-2 和 GPT-3 的研究路径

我们的深度学习方法利用更多数据和更多计算来创建越来越复杂和强大的语言模型。

2.我们花了 6 个月的时间使 GPT-4 更安全、更一致。

在我们的内部评估中,与 GPT-3.5 相比,GPT-4 响应不被允许内容请求的可能性低 82%,产生事实响应的可能性高 40%

3.安全与对齐:

  • 1.通过人工反馈进行训练(人工+专家反馈)

    • 我们纳入了更多的人工反馈,包括 ChatGPT 用户提交的反馈,以改进 GPT-4 的行为。我们还与 50 多位专家合作,在 AI 安全和保障等领域获得早期反馈。
  • 2.从现实世界的使用中不断改进(现实世界反馈)
    • 我们已经将我们以前模型在现实世界中使用的经验教训应用到 GPT-4 的安全研究和监控系统中。与 ChatGPT 一样,随着越来越多的人使用它,我们将定期更新和改进 GPT-4。
    1. GPT-4 辅助的安全研究(自己使用)
    • GPT-4 的高级推理和指令遵循能力加快了我们的安全工作。我们使用 GPT-4 帮助创建用于模型微调的训练数据,并在训练、评估和监控过程中迭代分类器。

四、和一些开发创新产品的组织合作

  • Duolingo:一种对话类应用
  • Be My Eyes:使用GPT-4提高视觉能力
  • Stripe:使用GPT-4简化用户体验并打击欺诈
  • Morgan Stanley:使用GPT-4来管理公司内部知识库
  • Khan Academy:在试点项目中探索GPT-4的潜力
  • Government of Iceland:使用GPT-4保护本土语言
  • Etc.

五、其他

详细研究报告

https://openai.com/research/gpt-4

基础设施:

GPT-4 在 Microsoft Azure AI 超级计算机上接受过训练。Azure 的 AI 优化基础架构还使我们能够向世界各地的用户提供 GPT-4。

局限性

GPT-4 仍然有许多我们正在努力解决的已知局限性,例如社会偏见、幻觉和对抗性提示。随着社会采用这些模型,我们鼓励并促进透明度、用户教育和更广泛的人工智能素养。我们还旨在扩大人们在塑造我们的模型时的输入途径。

可用性

我们在 ChatGPT Plus 上提供 GPT-4,并作为开发人员构建应用程序和服务的 API。

总结

GPT-4的横空出世将ChatGPT的很多局限性突破了,虽然基础模型能力只有一点提升(官方团队谦虚之语),但是在各种测试中GPT-4都完爆ChatGPT了,如果想了解更多内容或者加入到AIGC&ChatGPT的研究交流中可以私信我!

宇宙最强-GPT-4 横空出世:最先进、更安全、更有用相关推荐

  1. 它来了!无人车穿梭在深圳的“宇宙最强街道”

    允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI 粤海街道,被网友戏称为"宇宙最强街道",这里是腾讯.中兴.华为.大疆的诞生地.这一街道拥有上百家上市公司,仅2018年就 ...

  2. 将宇宙最强vscode打造为刷题神器

    点击"简说Python",选择"置顶/星标公众号" 福利干货,第一时间送达 不知道各位童鞋平时刷题用什么工具,我平时都是用vscode,除了刷题,平时工作大部分 ...

  3. 全宇宙最强AI 聊天机器人模型ChatGPT惊艳来袭,你还不上车?居然能写演讲稿和帮忙写代码

    目录 1.ChatGPT介绍 2.ChatGPT如何注册,国内不可用 3.VS Code下载安装ChatGPT 3.1 打开VS Code找到ChatGPT 3.2 ChatGPT 详细安装步骤: 3 ...

  4. 宇宙最强,meltdown论文中英文对照版(三)

    本文由郭健郭大侠翻译,将分为三次连载完成,这是第三部分.郭大侠是蜗窝科技(http://www.wowotech.net/)的创始人,倡导"慢下来,享受技术"的健康理念,侠之大者, ...

  5. matlab西塔怎么打出来,龙珠超70话:格兰成宇宙最强,代价并不严重

    原标题:龙珠超70话:格兰成宇宙最强,代价并不严重 第七宇宙最强战士与龙珠超70话正式诞生,那就是向双珠神龙许愿的格兰诺拉,通过情报内容来看,格兰诺拉成为宇宙最强的情节恐怕会让很多读者非常不满,因为这 ...

  6. 用VSCode打造宇宙最强Markdown编辑器【VSCode篇】vscode+MPE插件+PigGo图床+最佳实践+使用技巧

    在昨天,简单写了一下Markdown,并学习了CSDN的Markdown扩展语法,让我们离用Markdown写博客的目标更近了一步.今天开始打造Markdown编辑工具,以帮助我们更好的写博客.这篇全 ...

  7. 如何将宇宙最强 vscode 打造为刷题神器

    这是「进击的Coder」的第 384 篇技术分享 作者:dansen 来源:ACM算法日常 " 阅读本文大概需要 3 分钟. " 不知道各位童鞋平时刷题用什么工具,我平时都是用 v ...

  8. 宇宙最强语言PHP的“全栈”框架——Laravel来了!

    在动态网页发展前期,编写一个Web应用程序的方法和今天有很大不同. 开发人员不仅负责编写应用程序中独特的业务逻辑代码,还负责编写跨站点的各个公共组件的代码,包括用户认证.输入验证.数据库访问和模板等内 ...

  9. 极智Paper | YOLOv7 更高 更快 更强

      欢迎关注我的公众号 [极智视界],获取我的更多笔记分享   大家好,我是极智视界,本文解读一下 更高.更快.更强的 YOLOv7:Trainable bag-of-freebies sets ne ...

  10. 更快更强,谷歌提出SWideRNet:全景分割新标杆来啦!

    作者丨Happy 编辑丨极市平台 导读 本文是DeepLab系列作者"Liang-Chieh Chen"大神在全景分割领域的又一力作.它在Wide-ResNet的基础上引入SE与& ...

最新文章

  1. 解决Mac下npm权限问题
  2. 聊一聊mongodb中的 explain 和 hint
  3. python中的参数
  4. spring各个jar包作用
  5. nginx 禁止某个IP访问
  6. VScode单步跟踪Nginx(虚拟机中搭建Nginx)源码
  7. 360安全卫士卸载干净-笔记
  8. 旋转矩阵与四元数的理解
  9. 树莓派4B通过Python读取MLX90614温度
  10. 问佛__如果浮躁了,静下来看看,慢慢体会下
  11. 【转换输出流小练习 】现有一字符串:”我爱Java”。将该字符串保存到当前项目根目录下的a.txt文件中。​
  12. 数据结构与算法【Java】05---排序算法总结
  13. CNCC 2018 今日开幕,五场特邀报告引爆「大数据推动数字经济」| CNCC 2018
  14. noip c语言算法教学视频,信息学奥赛课课通(C++)课程视频课程课件与代码
  15. javascript之DOM简介
  16. Liquibase集成达梦数据库、Activiti集成达梦数据库
  17. 酷!60 s 速学HTTP 状态码 !
  18. AS2.0列表带图片视频播放器【附原码下载】
  19. 基于Opencv的汽车车牌识别
  20. origin2019插入图片_科学图形软件Origin 2019b下载和安装

热门文章

  1. Zephyr内核——内核服务(调度,中断和同步)——中断
  2. 10款手机网页模板_手机wap网站模板_html5手机网站模板源码下载(一)
  3. python使用selenium入门
  4. 深度解读Gops全球运维大会腾讯专场分享(2022)
  5. qpython 3h怎么使用_怎么看PE保护膜的雾度?
  6. 计算机课导入语,浅谈小学音乐课导入语的运用.doc
  7. 小卷积核代替大卷积核原理
  8. 软磁磁芯材料的基本特性及常用磁性能参数
  9. Redis之Stream
  10. 2011年度3大妖男 韩火火 蒋木木 马宁