今天凌晨,OpenAI 发布了最新的 GPT-4。

根据发布会披露的内容来看,这个新一代比早先大家使用的 ChatGPT 的 GPT-3.5 内核强悍了一大截,再次刷新了编辑部对 AI 的认知。

首先,非常非常重要的一点是,GPT-4 可以接受文字以外的内容输入了,目前支持文字与图像的混合输入。

在官方的示例中,用户给 GPT-4 上传了一张梗图,问 GPT-4 这张图为什么好笑:

GPT-4 非常详细且精准地描述出了图片上的内容。

并且有思维条理的解释了,为什么这张图会让人觉得好笑。

这还不算完,就算是十分抽象的 Meme,它也能一本正经地给你解释笑点在哪里。

只不过么,GPT4 也还没到能通过图灵的程度。

当然,这个功能并不只是能解释梗图那么简单,它拥有无限的想象空间,比如:

在今天凌晨的官方直播视频中,GTP 的开发人员演示了 GPT-4 可以识别他手绘的一张网页草图,并且根据草图写出网页的前端代码。

手绘的网页草图,非常抽象 ▼

GPT-4 给出的网页以及代码 ▼

虽然这个示例里的网站非常简单,但 GPT-4 的理解能力和创造力还是让人觉得不可思议:

重要的不是它能不能做得很好,而是它能做到,这是一个质的飞跃。

甚至,目前已经有公司在搞这项技术的落地应用,打算把它和导盲服务结合起来。

这样一来,盲人只需要拍张照,GPT-4 就能立即复述出面前物品的信息。

而在文字问答方面,GPT-4 也有非常大的提升,输入字增加到了 2.5 万。

在专业领域上的回答,特别是 “ 问题复杂度足够高的时候……GPT-4 比老版本更细、更可信、更富有创造力 ”。

比如,在统一律师考试( Uniform Bar Exam )中,GPT-4 可以超过 90% 的人类考生,而老版本只能超过 10% 的人类考生,妥妥学渣学霸的区别。

在 GRE 数学和语文( 阅读与填空 )考试中 ,GPT-4 的考试成绩已经是哈佛、麻省理工、斯坦福大学生的水平了。

不仅自己回答问题能力变强了,GPT-4 还会人格扮演。

比如你提出一个问题,ChatGPT 只会机械式地回答,而 GPT-4 可以按你的要求以苏格拉底风格给你作答。

那这个玩法就多了呀。

向下滑动▼

不过,说了这么多,百闻不如一试。

即使已经是凌晨 2 点,编辑部依旧花重金( 20 美元/月 ),连夜让美国同事帮忙升级试用了一波。

遗憾的是,OpenAI 考虑到用户们搞幺蛾子的能力太狠,所以目前 GPT-4 的图片输入功能暂时不对公众开放,也没有说啥时候可以用上。

不过,我们还是可以试试它聪明的小脑瓜子。

先是给了一个全网疯传的“ 华为、阿里入职面试题 ”,挑战大获成功。

而隔壁的 ChatGPT 就有点拉了。

作为击败了 90% 人类的大律师,GPT-4 的推理能力应该强无敌吧。

所以我们又搞了道法考的经典案件,想掂量掂量 GPT-4 到底有几斤几两。

问:乙去甲家吃饭,结果电动车被偷了。于是乙准备偷辆别人的电动车,此时,喝醉的甲来帮忙撬锁,帮乙成功得手。结果调查后发现,乙偷的是甲的电动车,问甲算不算是盗窃罪?

虽然新旧两款结论都是正确的,但是旧版的解题过程,就有点乱来了。。

而在一些更需要 “ 创造性 ” 或是 “ 思考 ” 的问题,比如:

关于最近一次特斯拉投资者大会上 “ 实现全球可持续能源 ” 的计划,你觉得是可行的吗?为什么可行?

GPT-4 的表现就更让人吃惊了。

虽然 GPT-4 的知识库停留在 2021 年 9月,并没有覆盖半个月前的那场投资者大会,但它却神奇地未卜先知了。

而老版本 ChatGPT 的回答就逊色了很多,没有条理,还有一堆车轱辘话,没有建设性观点。

随后,我们又问了一个行业思考相关的问题:

你如何看待全球的碳排放战略,它能成功吗?

老版只能浮于表面笼统地给点泛泛的概念,而 GPT-4 的回答明显维度更宽、思考更深,洋洋洒洒列了 10 点,更加细致有条理,并且含有更多专业词汇与内容,可以说几乎完美地回答了这个问题。

上面这些,还仅仅只是我们编辑部的试验,在一些大佬们手上,GPT-4 令人恐惧的表现就更多了。

比如仅仅只用了 60 秒,就做出了一款 Pong 游戏,20 秒就能做出贪吃蛇游戏。

不可否认,GPT-4 比起旧版来说,强的不是一点半点。不过我们试出来的问题,其实也不少。

我们搞了套高中数学竞赛试卷来考它,结果,一试就尴尬了。。第一道选择题,新旧两个版本就都解错了。

难道说,斯坦福、麻省理工还不如。。?

因为 GPT-4 可以支持更长的输入文本,所以我们就又测试了它的总结概括能力。

这下馅露得更大了。

我们甩给它的是,差评君之前发过的一篇文章的链接,其实 GPT-4 是没有联网的,正常来说是没法总结的。

结果,它愣是凭空捏造了两个文章总结,而且和我们给的文章没有任何关系。

直到在我反复指正两次,语气都加重了,它才承认自己的错误。

直到后面我们把原文直接贴进去后,GPT-4 才展露了它超强的总结能力。

说实话,这个胡编乱造的能力让我们心里一惊,于是就又想了个测试方法。

前两天,小黑胖把“ 手拿把攥 ”记混成“ 手拿把蒜 ”,被编辑部嘲笑了很久,于是我们就问 GPT-4 “ 手拿把蒜什么意思?”

结果牛掰了,GPT-4 在理解了一部分“ 把蒜(攥) ”是形容事情轻而易举的基础上,引经据典地胡编乱造,颇有种当年我写作文时,引用的俄罗斯文学家“ 沃兹基索德 ”的味道了。

要知道,如果是真实场,这个半真半假、引用权威的胡说八道的后果将是非常严重的,堪称最高级的谎言。

明明连更老的 ChatGPT 也不敢这么捏造来源地胡说,更高级的 GPT-4 怎么会这样呢?

我们猜测,就是因为新版本更倾向于表现出 “ 更具有深度思考 ”,这么一来,在回答很多问题的时候,GPT-4 会自己给自己加戏,才会出现这些闹剧。

虽然我们试了这么多漏洞,但总的来讲,这次发布的 ChatGPT,无论是基础功能、想象空间、逻辑能力、思考能力,都比之前强了一大截。

明明距离老版本 ChatGPT 颠覆我们的认知才没几个月,它们就又掏出了一个船新版本,我们只能说:

恐怖如斯。

更恐怖的是,其实 GPT-4 诞生时间,可能比我们想的还要早很多,之前 OpenAI 发布基于 GPT-3.5 的 ChatGPT 时,内部员工就质疑过为啥发个这么古早的版本。

而我们也早就接触过 GPT-4 了,New Bing 官方今天发了个公告,承认了 New Bing 其实就是 GPT-4。

所以这么说的话,有没有种可能,GPT-5 也已经近了呢?

我已经开始期待除了文字、图片以外,视频、音频等形式的输入了。

上手ChatGPT威力加强版后,我发现它很强,但也有点拉。。。相关推荐

  1. 看完后才发现,很多用iPhone的人,实在是愧对乔布斯!

    2019独角兽企业重金招聘Python工程师标准>>> 看完后才发现,很多用iPhone的人,实在是愧对乔布斯! 很多人花了四五千买部苹果,结果只用到四五百块钱的普通手机功能. iP ...

  2. 发现一个很强的国产软件。可以给视频加动画大头贴

    发现一个很好的国产软件, 叫拍拍看,有中文版和英文版,却被众人当成了国外软件,还认为中文的免费版是国人盗版的. 中国人真是越来越贱了. 看到电脑报和电脑爱好者上介绍这个就去看了看,英文网址http:/ ...

  3. 运行 Java、Python、Go 等 25 种代码后,发现性能最强的竟然是它!

    本文通过一道程序面试题,使用不同的编程语言来实现,检验每种语言的简单版本与优化后版本的运行速度分别是多少,横向对比 Python.Go.C++.C.Rust 等编程语言的性能, 作者 | Ben Ho ...

  4. 荣耀3手机android 5.0吗,荣耀Play3上手后,发现竟然和想象中的不一样……

    荣耀Play3上手后,发现竟然和想象中的不一样-- 2020-03-11 20:08:15 17点赞 0收藏 6评论 对于荣耀Play3这部机子,在发布时就遭到网上很多网友的唾骂,可笑的是骂来骂去始终 ...

  5. java后端开发(九):mybatis的威力加强版之mybatis-plus

    前言 后端一半的时间都是在和关系型数据库打交道,那么虽然我们用 mybatis 这个 ORM 框架,简化代码的开发.但是代码中涉及到太多的重复操作,比如对用户的增删改查和对设备的增删改查.我们毕竟是贪 ...

  6. android三国2,三国群英传2威力加强版安卓

    三国群英传2威力加强版安卓版本是一款非常给力的单机三国题材策略手游,完美还原历史战役,著名历史桥段在此上演,玩家在游戏中将亲身经历各场战役,和诸多武将英雄一起征战三国,玩法非常热血,快来点击下载试试吧 ...

  7. Alfred 有道 workflow 威力加强版

    2019独角兽企业重金招聘Python工程师标准>>> 最近学习 吴恩达 的DeepLearning 的时候,发现自己的 python水平有点弱.就像想找个练手的东西写一写.想来想去 ...

  8. 一支不足百人的团队创造了ChatGPT :90后挑大梁,应届生11人,华人抢眼

    来源:AI前线 整理:凌敏 让全网沸腾的 ChatGPT,其背后团队不足百人. ChatGPT 发布以来,在短短 2 个月时间月活破亿,成为历史上用户增长最快的消费应用.有分析机构感叹:"在 ...

  9. 闲来无事,20 分钟水了一个贷款计算器(Chatgpt 协助下),发现了房贷的 3 个秘密

    闲来无事,20 分钟水了一个贷款计算器(Chatgpt 协助下),发现了房贷的 3 个秘密 这是一篇来自社区的投稿,作者谢绍康,He3 开放平台的内测用户,贷款计算器工具作者,以下为原文. 在搞定这款 ...

最新文章

  1. 为什么我劝你不要当数据科学家?
  2. Delphi 控制摄像头
  3. 每天一道LeetCode-----将链表中满足条件的节点移动到前面
  4. Python介绍、发展史、安装、变量、注释、输入
  5. 精进不休 .NET 4.0 (2) - asp.net 4.0 新特性之url路由
  6. Volley源码学习3--log类
  7. git status
  8. 微信表情包储服务器,微信新功能!不用存图就能发出海量表情包
  9. Jenkins Robot framework 持续集成环境搭建
  10. APP开发难吗?澳大利亚10岁儿童已开发5个手机App
  11. wps linux 在线安装程序,WPS for Linux 字体安装包
  12. Halcon对文件的创建、读取、写入、删除等操作
  13. 合肥大学c语言试题及答案,合肥工业大学C语言题库程序填空题库2.doc
  14. oracle11g监听配置访问QA
  15. 【张朝阳的物理课笔记】 1. 力,牛顿定律,飞船角速度
  16. mysql内表和外表_内表查询用到外表
  17. 论程序员如何正确上班摸鱼
  18. php面试时的自我称呼,PHP程序员面试自我介绍
  19. 抑郁量表c语言程序,抑郁自评量表(SDS)
  20. FOne HCI超融合系统

热门文章

  1. 简单Burp爆破使用方法
  2. 基于BOLT的仿迅雷加速器界面开发(二)
  3. 25、基于原型的切比雪夫低通滤波器匹配设计理论
  4. 什么情况?苹果把办公室建到了黑莓软件部门后院
  5. 【杂谈】ChatGPT是否可以取代人类的工作
  6. 百度飞桨表格识别网络SLANET学习笔迹
  7. 火鸡节日特辑,亚马逊12.99超值午餐配送开始啦
  8. 美洽客服系统怎么同步顾客身份
  9. python josn文件
  10. 6 仓储管理系统 门店端功能