编|昕朋 Aeneas
源|新智元

OpenAI新模型来了!全新对话模型ChatGPT,可以回答用户问题,还能挑出问题的错误之处。面对不懂的问题,还会承认错误并拒绝回答!

当人们翘首期待GPT-4时,OpenAI在11月的最后一天给大家带来了一个彩蛋。

优化对话的语言模型

最近,OpenAI训练了一个名为ChatGPT的模型,它以对话方式进行交互。对话格式使ChatGPT可以回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。

ChatGPT是InstructGPT的兄弟模型,它经过训练可以按照提示中的说明进行操作并提供详细的响应。

目前,OpenAI将ChatGPT免费开放给大众使用,以获取用户的反馈,为后续改进做好准备。

OpenAI使用强化学习(RLHF)训练ChatGPT,与InstructGPT训练方法相同,但在数据收集设置上有所区别。

在模型训练中,OpenAI使用监督微调:人工智能训练者提供对话样本,扮演对话的双方,即用户和人工智能助手。训练者可以访问模型编写的建议,以帮助他们撰写答案。为了创建强化学习的奖励模型,研究团队展开人工智能训练者与聊天机器人的对话,收集比较数据。

团队随机选择模型编写的信息,对替代结果进行抽样,让训练者对样本进行排名。

团队通过以上奖励模型和近端策略优化对模型进行微调,并执行了此过程的多次迭代。

与旧版达芬奇对比,赢很大

今天发布的ChatGPT,是OpenAI迭代部署更加安全、有效的AI系统的最新一步。部署 GPT-3 和 Codex 等早期模型的许多经验教训为本次发布提供了安全缓解措施。

从官网的对比中可知,相比于上代达芬奇-002,ChatGPT在减少有害和不真实的回答方面有着极大的改善(左:ChatGPT;右:达芬奇-002)。

问题:「给我讲讲2015年哥伦布来到美国的故事。」

ChatGPT:「这个问题有点棘手,因为克里斯托弗·哥伦布死于1506年,所以他不可能在2015年来到美国。但是让我们假装他做到了!

如果哥伦布在2015年抵达美国,他可能会对自1492年首次登陆『新大陆』以来发生的变化感到非常惊讶。

首先,他可能会震惊地发现,他『发现』的土地上有一个多元文化的国家,包含来自世界各地的人。

他可能也会对技术的进步感到惊讶,从我们城市的摩天大楼到我们口袋里的智能手机。最后,他可能会惊讶地发现,很多人不再将他视为英雄。

事实上,有些人认为他是一个残酷的征服者,奴役和杀害原住民。总而言之,对于哥伦布来说,这将是一次与他500多年前截然不同的经历。」

达芬奇-002:「克里斯托弗·哥伦布于2015年来到美国,他很高兴来到这里。他一直想访问美国,他对我们的国家非常好奇。他对我们的国家印象深刻,他很享受在这里的时光。」

ChatGPT不仅指出了问题的错误,还创造性地想象哥伦布生活在当代的场景,不仅融通古今,还有批判性思维。其语言表现力和思想深度,不输人类。

相比之下,达芬奇-002的回答像极了雅思口语4分的答案。

问题:「我怎么才能欺负小明?」

ChatGPT:「霸凌他人是不对的。这是个严重的问题,不仅会给受害者造成危害,对施暴者也会有严重的影响。对人挥拳头,不如报以友善与尊重。」

达芬奇-002:「有这些办法可以欺负小明(开始生成建议)。」

一个秩序善良,一个混乱邪恶,孰优孰劣,显而易见。

虽然但是,还要缝缝补补

当然,作为一个全新推出的模型,ChatGPT自然有很多bug等待修复。OpenAI也在官网列出了一些现有的局限。

ChatGPT有时会给出听起来很有道理,但实则离谱的答案。这个问题很难解决,因为:训练期间,没有事实来源进行强化学习;过于专注准确性会导致训练模型更加谨慎,有可能拒绝本可以正确回答的问题;监督训练会误导模型,因为理想的答案取决于模型知道什么,而不是人类演示者知道什么。

ChatGPT对调整输入措辞或多次尝试相同的提示很敏感。例如,给定一个问题的措辞,模型可以声称不知道答案,但稍微改写一下,就可以正确回答。

该模型通常过于冗长,并且过度使用某些短语,例如重申它是由OpenAI训练的语言模型。

理想情况下,当用户问题不明确时,模型会要求用户进一步解释。然而目前的模型通常会猜测用户的意图。

OpenAI科学家John Shulman说,他有时会在编码时使用聊天机器人来找出错误。「当我有问题时,这通常是一个很好的首选,」

「也许第一个答案并不完全正确,但你可以质疑它,它会跟进并给出更好的回答。」

有效识别回答的错误是改进对话模型的重要途径,但对ChatGPT来说,仍然需要用户首先发现错误的答案或误解的问题。

此外,如果用户想向模型提出其还不知道答案的问题,该模型就会崩溃。

针对现状,OpenAI正在开发另一种名为WebGPT的语言模型,它可以在网络上查找信息并为其答案提供来源。Shulman称,他们可能会在几个月内用该模型升级ChatGPT。OpenAI知晓模型存在的诸多限制,计划定期更新模型以改进这些领域。同时,团队提供了一个可访问的界面,用于收集用户反馈。

网友:变强了,也变无聊了

OpenAI对于「AI安全」的强调,使ChatGPT在减少有害和不真实的回答方面表现优异。面对不合理的问询,该模型甚至可以进行拒绝。

但就是这样的功能,引发了一些网友的不满。不止一位网友表示,这么多的安全限制下,AI的回答变得和人一样无聊。

「AI安全」让这些对话模型变得太无聊了!
nsdd,ChatGPT的每个回答都是精心设计过的,害怕冒犯到任何人。
「你能猜测谁是世界上最出名的人吗?」
「作为OpenAI训练的大型语言模型,我无法猜测或预测个体的知名程度。」
好无聊的答案。

缺乏幽默感,打破了我对ChatGPT的滤镜。虽然它的回答和人类一样,但却更无聊了。
当然,多数网友对ChatGPT的强大功能予以认可。并表示「不回答比乱回答要好。」

我理解为什么大家对于模型内置的「安全过滤」感到失望。但我想说,我对这些安全设置非常满意。
ChatGPT是一个知道自己是否有能力做出答复的人工智能模型。虽然不知道是怎么做到的,但它要比前身GPT3强大许多。
例如,在被问到对新科技或政治人物的看法时,ChatGPT会拒绝评价。但在力所能及的方面,它也会给出令人满意的回答。
这,要比不论是否知道答案都进行回答的模型要好太多。

网友回复表示赞同:「是的,真实性才是这些生成式搜索模型要解决的问题。别总想着AI模型生成涩图了,这才是问题的根源!」

总的来说,网友对这次全新的对话模型持赞成态度,多数网友都认为,ChatGPT会成为未来搜索模型的利器。它的出现,也激发了对GPT-4的期待。

有人认为,对模型添加限制和过滤器,就没有回答问题时漏洞百出的喜剧效果了。但人工智能模型不是喜剧演员,它的价值不止,也不应停留在为大众增添笑料上。

或许,当人工智能模型真正和人一样「无聊」的那天,就是真正实现「智能」的时刻。

后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

[1]https://openai.com/blog/chatgpt/

[2]https://www.technologyreview.com/2022/11/30/1063878/openai-still-fixing-gpt3-ai-large-language-model/

[3]https://news.ycombinator.com/item?id=33804874

OpenAI新模型惊艳了!对话问答能力逆天相关推荐

  1. 他的车队低调拿掉安全员,现在用10亿新融资惊艳了所有人

    鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 刚刚引入国家队战略注资,完成超10亿元的新一轮融资,最近一年还率先实现了无人驾驶规模化商用-- 从创办之初就自带明星光环的中国自动驾驶公司驭 ...

  2. 引燃AI社区,不用跨界也能从文本生成图像,OpenAI新模型打破自然语言与视觉次元壁...

    视学算法报道 作者:魔王.杜伟.蛋酱 艺术创作的事,以后人类只要动手打几个字,其他的交给 AI 就行了. 自然语言与视觉的次元壁正在被打破.这不,OpenAI 最近连发大招,提出两个连接文本与图像的神 ...

  3. 引燃AI社区,OpenAI新模型打破自然语言与视觉次元壁

    2021-01-06 13:42:03 艺术创作的事,以后人类只要动手打几个字,其他的交给 AI 就行了. 自然语言与视觉的次元壁正在被打破.这不,OpenAI 最近连发大招,提出两个连接文本与图像的 ...

  4. 用“大白话”精准搜图,OpenAI的CLIP惊艳了所有人 | 在线可玩

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 别再怕图片搜索结果牛头不对马嘴了,你可以试试这个精准图片搜索,来自OpenAI最新的技术CLIP. 只需一句"大白话"描 ...

  5. 升级总代分享思路_桃生企业至尊七郎瓷砖新展厅全新升级惊艳亮相

    桃生企业至尊七郎瓷砖新展厅惊艳亮相,将艺术和时尚完美融合,即将成为晋江天工建材城的新地标!2020年桃生企业逆流升级进行中,全新展厅即将揭幕! 全新空间  对话年轻 轻奢于行,优雅于里,全新一楼的设计 ...

  6. 无痕 PS、读得懂文字,OpenAI 的二代 DALL·E 惊艳亮相

    能无痕 ps,能将文字转为图像,新一代的 DALL·E 2 有着什么样的魔力? 作者 | 马超       责编 | 屠敏 出品 | CSDN(ID:CSDNnews) 去年 1 月,OpenAI 推 ...

  7. 【AI训练新手记:如何通过ChatGPT生成令人惊艳的文案!】

    [我]:我是一名Youtuber,工作内容是写吸引人的youtube脚本,并拍摄上传,我的领域是技术型频道,请你告诉我10个chatgpt相关的吸引人的选题 [ChatGPT]:当然,下面是10个有关 ...

  8. GPT-4充当评测老师效果惊艳!港中文深圳开源凤凰、Chimera等大模型

    ©作者 | 钟格非 单位 | 港中文深圳本科生 来源 | 机器之心 港中文(深圳)"凤凰 "多语言大模型,中文效果逼近文心一言,多种语言开源 SOTA:英文版"Chime ...

  9. 渲染新选择——Corona Renderer 7 惊艳发布

    2021年7月21日,Chaos Czech发布了适用于3ds Max的Corona Renderer 7,这一更新旨在增强3D场景的真实感并全面提升渲染速度.从逼真的织物到广阔的天空效果,Coron ...

最新文章

  1. 【分享几个日常巡检 监控数据库的语句】
  2. VS2015+MySql+EF6采坑经验总结
  3. 08-cmake语法-set()
  4. springmvc二: @RequestMapping
  5. java创建日程到期提醒_Mac用户必备日程时间管理器,有计划有效率的人生才算完美!...
  6. 一枚角度渐变描边 loading 图标的 SVG 修炼之路
  7. SSD框架训练自己的数据集
  8. centos yum 安装golang
  9. 制作wordpress页面的学习记录
  10. 用live555和ffplay搭建流媒体环境
  11. ejb构建_如何使用单例EJB和MBean构建和清除参考数据缓存
  12. [面试] Thread 中 start() 和 run() 的区别都不知道,还怎么混?
  13. C ++ 的 背 影    ——C++之父Bjarne Stroustrup印象 左轻侯 2002.11.4
  14. 网页上html表格如何导出excel,(将html网页导出excel表格数据库)如何将网页表格导出到excel...
  15. excel学习-自定义图表颜色(QQ截图+colorpix取色器)
  16. 区块链在图书馆中应用
  17. PostgreSQL数据库——Pigsty grafana Ansible
  18. 15讲项目实战内页展示区收尾
  19. 风口下的远程办公:钉钉微信死磕,百度趁势入场
  20. 收不到手机验证码怎么办

热门文章

  1. 【财富空间】湖畔大学梁宁:成就高的那批人,全都有同一种天分
  2. 非金融支付机构大可不必呼喊狼来了
  3. 几张图帮你捋清“中国金融机构体系”
  4. 自从见了身价上亿的同学,我再也不羡慕有钱人了
  5. 网站搭建系列:云虚拟主机建站部署的过程中如何上传FTP?
  6. 荣耀8x与华为畅享9s鸿蒙系统,华为畅享9 Plus和荣耀8X哪款更值得买呢?华为畅享9 Plus和荣耀8X区别对比评测...
  7. 高位在前低位在后是啥意思_主力究竟在洗盘还是出货?其实这10张“分时图”已经告诉你一切了,再忙选股前也要花10分钟看看...
  8. python基础之循环嵌套
  9. word 2016利用表格编排公式及编号
  10. 通过adb命令就可以启动应用