GPT4和ChatGPT的区别,太让人震撼
文 | Serendipity@知乎
前言
GPT4上午朋友圈已经刷屏啦,不过我还在忙,刚刚才登上 GPT-4 ,现在来体验一下~
附 GPT-4 能力测试站(无需魔法,仅供国内研究测试):
https://gpt4test.com
附 ChatGPT 能力测试站(同样无需魔法,仅供国内研究测试):
https://yeschat.cn
测试一:文本真实性
GPT-4
还是我最喜欢的老问题——“林黛玉倒拔垂杨柳”
GPT-3.5(即ChatGPT )
可以看出两点:
- 关于第一个问题,GPT-4 的文字描写更好了
- 关于第二个问题,GPT-4 应该加入了更多的知识,立马判断“但在原著中,并没有提及她在游园时倒拔垂杨柳这个情节。”,诈骗属性减少了些——GPT-4 比 GPT-3.5 更可靠。
此外,其在微积分以及司法考试上提升巨大。
测试二:可靠性
经典问题:西红柿炒螺丝钉这道菜怎么做?
GPT-4
GPT-3.5(即ChatGPT )
可以看出,GPT-4 的回答可靠性上升了不少(“因为通常我们不会将螺丝钉(一个金属制品)与食物相结合”),不会像之前一样瞎答题了。而且,交互也更有创新型,给出了“推荐一个类似的美食”的回答。ChatGPT 则是回答 “西红柿炒螺丝钉是一道传统的中国家常菜”。对于中文的理解能力和回答能力上升不少,逻辑能力有所提升。
测试三:数学能力
简单测试了一个问题,可以看出GPT-3.5(即ChatGPT )的解题能力明显不如 GPT-4。
GPT-4
GPT-3.5(即ChatGPT )
很明显 GPT-4 做对了,而 ChatGPT 直接错了。
GPT-4 微积分
测试四:多模态
GPT-4 可以接受文本和图像提示,这与纯文本设置并行,允许用户指定任何视觉或语言任务。但是,因为现在用户还没法输入多模态信息,只能输入文本信息。所以我找了官网给出的样例来说明下这部分改动,也是 GPT-4 相对 ChatGPT 最强大的变化了。
图片解释
简单点说,就是输入一组图片,并且输入一个问题“解释图片内容,笑点是什么?”
论文阅读
通过解析图片信息来总结分析论文内容
做题能力
做题能力大幅增强,小镇做题家哭泣/(ㄒoㄒ)/~~
总结
因为 GPT-4 刚出的缘故,我也只是粗略测试一下。目前看来,能力确实提升不少,可惜的是多模态功能用户暂时无法使用。之后会再找更多些例子来测试下的,谢谢~
附 GPT-4 能力测试站(无需魔法,仅供国内研究测试):
https://gpt4test.com
附 ChatGPT 能力测试站(同样无需魔法,仅供国内研究测试):
https://yeschat.cn
GPT4和ChatGPT的区别,太让人震撼相关推荐
- GPT-4和ChatGPT的区别
人工智能技术是当今的热门话题,随着技术的不断进步,越来越多的新技术被应用到各个领域中.GPT(Generative Pre-trained Transformer)是一项基于AI技术的自然语言处理(N ...
- 豆瓣9.6分!这部BBC的纪录片太让人震撼!
全世界只有3.14 % 的人关注了 爆炸吧知识 英国广播公司BBC的纪录片素来就是高质量的代名词,推出的<地球无限>(Planet Earth).<地球的力量>(Earth T ...
- GPT-4和ChatGPT效果对比,差别太大了
文|Serendipity@知乎 前言 GPT4上午朋友圈已经刷屏啦,不过我还在忙,刚刚才登上 GPT-4 ,现在来体验一下~ 附 GPT-4 能力测试站(直接注册即可,无需魔法): https:// ...
- 全国计算机二级算国奖吗,如何区分竞赛证书的等级和含金量?(太多人傻傻分不清国奖、省奖、市奖)...
原标题:如何区分竞赛证书的等级和含金量?(太多人傻傻分不清国奖.省奖.市奖) 止到今天,已经有近90所高校发布了自主招生简章,各学校对五项学科竞赛成绩都有不同的要求,然而很多同学和家长还是傻傻搞不清国 ...
- 对话美团 CEO 王兴:太多人关注边界,而不关注核心
博主说:虽然经常使用美团和大众点评,但之前并没有真正的去了解"新美大"的历史,偶然读了这篇美团网 CEO 王兴写的文章之后,让自己对美团有了新的认知,无论是从使命还是愿景来说,美团 ...
- AIGC和ChatGPT的区别
AIGC和ChatGPT的区别主要在于: - AIGC是一个广泛的概念,包括多种类型的内容生成:ChatGPT是一个具体的产品,只涉及文本生成. - AIGC可以应用在多个领域和场景:ChatGPT主 ...
- 从刘福泉炮轰“社科院的调查太雷人”谈:一辈子租房又何妨
从刘福泉炮轰"社科院的调查太雷人"谈:一辈子租房又何妨 最近看到这样一则新闻:在得知社科院有关福州房价泡沫最大的数据计算与采集过程后,刘福泉直言,这种计算理论有缺陷,数据采集方式有 ...
- 【大数据人工智能AI2.0】GPT-4 office 全家桶发布,打工人凛冬将至 :Microsoft 365 Copilot (副驾驶)简介
GPT-4 发布,只是一个开始. GPT-4 office 全家桶发布,打工人凛冬将至 Microsoft 365 Copilot 简介 北京时间今天凌晨,微软又发布了基于 GPT-4 的办公软件全家 ...
- 借贷宝如何找到自己的二维码(太多人问了)
动动手指,20元人民币立即到手:http://www.cnblogs.com/mfryf/p/4754384.html 注册提现流程:扫码领取20元现金-->下载借贷宝APP -- 打开APP点 ...
最新文章
- excel导入SQL脚本
- ubuntu14.04下使用A3E生成satg配置
- Android开发之自定义Dialog二次打开报错问题解决
- python话雷达图-使用Python绘制雷达图
- Matplotlib pyplot中title() xlabel() ylabel()无法显示中文(即显示方框乱码)的解决办法...
- Asp.net MVC调试-使用IP监听
- 7-Zip CommondLine 使用记录
- java mousepress_Java线程原语弃用
- 【分享】一个集成tracert和ping的网络监测工具
- CSS 元素的绝对定位 position: absolute 和 position: fixed
- python xlwt设置单元格的自定义背景颜色
- 项不会计算为接受 0 个参数的函数_玩转excel函数:详解四种计数函数,从基础到提高...
- 分享一套基于HTML5的网络拓扑图组件 Qunee下载
- 微信小程序轮播图滚动带动背景图变换及滚动对应图片下标
- 什么叫结构化程序设计?它的主要内容是什么
- Windows7 Ghost 旗舰装机版
- dell电脑如何安装ubuntu系统_Dell电脑 U盘启动盘 安装ubuntu
- 计算机设置任务栏的大小要先,教你win7系统电脑调整任务栏预览窗口大小的方法...
- 清风数学建模——插值算法
- python求几何平均_R语言的几何平均数,调和平均数,平方平均数