文 | Serendipity@知乎

前言

GPT4上午朋友圈已经刷屏啦,不过我还在忙,刚刚才登上 GPT-4 ,现在来体验一下~

附 GPT-4 能力测试站(无需魔法,仅供国内研究测试):

https://gpt4test.com

附 ChatGPT 能力测试站(同样无需魔法,仅供国内研究测试):

https://yeschat.cn

测试一:文本真实性

GPT-4

还是我最喜欢的老问题——“林黛玉倒拔垂杨柳”

GPT-3.5(即ChatGPT )


可以看出两点:

  • 关于第一个问题,GPT-4 的文字描写更好了
  • 关于第二个问题,GPT-4 应该加入了更多的知识,立马判断“但在原著中,并没有提及她在游园时倒拔垂杨柳这个情节。”,诈骗属性减少了些——GPT-4 比 GPT-3.5 更可靠。

此外,其在微积分以及司法考试上提升巨大。

测试二:可靠性

经典问题:西红柿炒螺丝钉这道菜怎么做?

GPT-4

GPT-3.5(即ChatGPT )

可以看出,GPT-4 的回答可靠性上升了不少(“因为通常我们不会将螺丝钉(一个金属制品)与食物相结合”),不会像之前一样瞎答题了。而且,交互也更有创新型,给出了“推荐一个类似的美食”的回答。ChatGPT 则是回答 “西红柿炒螺丝钉是一道传统的中国家常菜”。对于中文的理解能力和回答能力上升不少,逻辑能力有所提升。

测试三:数学能力

简单测试了一个问题,可以看出GPT-3.5(即ChatGPT )的解题能力明显不如 GPT-4。

GPT-4

GPT-3.5(即ChatGPT )

很明显 GPT-4 做对了,而 ChatGPT 直接错了。

GPT-4 微积分

测试四:多模态

GPT-4 可以接受文本和图像提示,这与纯文本设置并行,允许用户指定任何视觉或语言任务。但是,因为现在用户还没法输入多模态信息,只能输入文本信息。所以我找了官网给出的样例来说明下这部分改动,也是 GPT-4 相对 ChatGPT 最强大的变化了。

图片解释

简单点说,就是输入一组图片,并且输入一个问题“解释图片内容,笑点是什么?”

论文阅读

通过解析图片信息来总结分析论文内容

做题能力

做题能力大幅增强,小镇做题家哭泣/(ㄒoㄒ)/~~

总结

因为 GPT-4 刚出的缘故,我也只是粗略测试一下。目前看来,能力确实提升不少,可惜的是多模态功能用户暂时无法使用。之后会再找更多些例子来测试下的,谢谢~

附 GPT-4 能力测试站(无需魔法,仅供国内研究测试):

https://gpt4test.com

附 ChatGPT 能力测试站(同样无需魔法,仅供国内研究测试):

https://yeschat.cn

GPT4和ChatGPT的区别,太让人震撼相关推荐

  1. GPT-4和ChatGPT的区别

    人工智能技术是当今的热门话题,随着技术的不断进步,越来越多的新技术被应用到各个领域中.GPT(Generative Pre-trained Transformer)是一项基于AI技术的自然语言处理(N ...

  2. 豆瓣9.6分!这部BBC的纪录片太让人震撼!

    全世界只有3.14 % 的人关注了 爆炸吧知识 英国广播公司BBC的纪录片素来就是高质量的代名词,推出的<地球无限>(Planet Earth).<地球的力量>(Earth T ...

  3. GPT-4和ChatGPT效果对比,差别太大了

    文|Serendipity@知乎 前言 GPT4上午朋友圈已经刷屏啦,不过我还在忙,刚刚才登上 GPT-4 ,现在来体验一下~ 附 GPT-4 能力测试站(直接注册即可,无需魔法): https:// ...

  4. 全国计算机二级算国奖吗,如何区分竞赛证书的等级和含金量?(太多人傻傻分不清国奖、省奖、市奖)...

    原标题:如何区分竞赛证书的等级和含金量?(太多人傻傻分不清国奖.省奖.市奖) 止到今天,已经有近90所高校发布了自主招生简章,各学校对五项学科竞赛成绩都有不同的要求,然而很多同学和家长还是傻傻搞不清国 ...

  5. 对话美团 CEO 王兴:太多人关注边界,而不关注核心

    博主说:虽然经常使用美团和大众点评,但之前并没有真正的去了解"新美大"的历史,偶然读了这篇美团网 CEO 王兴写的文章之后,让自己对美团有了新的认知,无论是从使命还是愿景来说,美团 ...

  6. AIGC和ChatGPT的区别

    AIGC和ChatGPT的区别主要在于: - AIGC是一个广泛的概念,包括多种类型的内容生成:ChatGPT是一个具体的产品,只涉及文本生成. - AIGC可以应用在多个领域和场景:ChatGPT主 ...

  7. 从刘福泉炮轰“社科院的调查太雷人”谈:一辈子租房又何妨

    从刘福泉炮轰"社科院的调查太雷人"谈:一辈子租房又何妨 最近看到这样一则新闻:在得知社科院有关福州房价泡沫最大的数据计算与采集过程后,刘福泉直言,这种计算理论有缺陷,数据采集方式有 ...

  8. 【大数据人工智能AI2.0】GPT-4 office 全家桶发布,打工人凛冬将至 :Microsoft 365 Copilot (副驾驶)简介

    GPT-4 发布,只是一个开始. GPT-4 office 全家桶发布,打工人凛冬将至 Microsoft 365 Copilot 简介 北京时间今天凌晨,微软又发布了基于 GPT-4 的办公软件全家 ...

  9. 借贷宝如何找到自己的二维码(太多人问了)

    动动手指,20元人民币立即到手:http://www.cnblogs.com/mfryf/p/4754384.html 注册提现流程:扫码领取20元现金-->下载借贷宝APP -- 打开APP点 ...

最新文章

  1. excel导入SQL脚本
  2. ubuntu14.04下使用A3E生成satg配置
  3. Android开发之自定义Dialog二次打开报错问题解决
  4. python话雷达图-使用Python绘制雷达图
  5. Matplotlib pyplot中title() xlabel() ylabel()无法显示中文(即显示方框乱码)的解决办法...
  6. Asp.net MVC调试-使用IP监听
  7. 7-Zip CommondLine 使用记录
  8. java mousepress_Java线程原语弃用
  9. 【分享】一个集成tracert和ping的网络监测工具
  10. CSS 元素的绝对定位 position: absolute 和 position: fixed
  11. python xlwt设置单元格的自定义背景颜色
  12. 项不会计算为接受 0 个参数的函数_玩转excel函数:详解四种计数函数,从基础到提高...
  13. 分享一套基于HTML5的网络拓扑图组件 Qunee下载
  14. 微信小程序轮播图滚动带动背景图变换及滚动对应图片下标
  15. 什么叫结构化程序设计?它的主要内容是什么
  16. Windows7 Ghost 旗舰装机版
  17. dell电脑如何安装ubuntu系统_Dell电脑 U盘启动盘 安装ubuntu
  18. 计算机设置任务栏的大小要先,教你win7系统电脑调整任务栏预览窗口大小的方法...
  19. 清风数学建模——插值算法
  20. python求几何平均_R语言的几何平均数,调和平均数,平方平均数

热门文章

  1. 【励志】我的研究生三年-公子龙
  2. 设置路由器的两种方法
  3. 高通推人工智能引擎,骁龙660等平台支持
  4. WUST 1255 巧克力(线段树的单点区间更新查询)
  5. win10 wdk不能部署到win7 的解决方法
  6. ios调用系统相册显示英文,修改成中文
  7. 日语新年(春节)祝福语
  8. 分页+frament+PullToRefresh+轮播
  9. JDBC访问数据库的步骤
  10. 用python画路飞代码_用Python画路飞骷髅图案【附代码】