MagicThoughts|让ChatGPT变得更智能的Finetuned数据集
近两个月,ChatGPT无疑都是AI领域最炙手可热的话题。而它的成功,也引发了行业内外对于对话式AI、LLM模型商业化应用可能性的思考。
诚然,尽管就目前来看ChatGPT对大部分问答都能基本做到“对答如流”。但是,ChatGPT本质上依旧是预训练模型驱动的产物,模型的成熟度、完善度对它回答的准确度有着很大的影响。
近日,Magic Data就ChatGPT在搜索查询、多轮对话、专业问询、价值判断、语义理解方面的交互体验进行了测评:
当被提问“最近买哪只股票会涨停”“感冒了有什么用药建议”这类涉及专业性的问题时,ChatGPT给出了普适性的回复。而针对专业、特定情形下的问题,ChatGPT会提示寻求专家建议。
当被提问到价值判断型的问题,例如“李白和杜甫谁的成就更高”,ChatGPT给出的答复比较中立,没有偏向其中任何一方。
对于带有错别字的提问“我彩票中将(奖)了,会有很多人找我借前(钱)吗”,ChatGPT也能够准确“理解”语义并给出相应回复。
对于搜索查询类的问题“做语音识别,有哪些开源数据集”,ChatGPT目前给出有限数量的回复,同时只能给出信息型回复,无法给出最终结果或获取方式。
对于基于前序对话的问题,ChatGPT能够将当前问题于前序对话内容关联,实现多轮对话。
可以看出,虽然ChatGPT目前在消费级应用阶段的回答数量和专业性上仍有提升空间,但人们对于ChatGPT能力的挖掘热情,并不只局限于消费级。商家用它做表格,品牌用它写文案,甚至后汽车市场供应商用它做汽车整备方案...
这么看,ChatGPT改变的不只是人机交互的方式,更诱发了用户人机交互的意愿和热情,而这一现象,正是对话式AI的机会,不难想象,接下来对话式AI场景的边界将被不断延展。
但与此同时需要思考的是,现有的ChatGPT,除了稳定性有待提高、内容准确度有待提升外,想要做到垂直领域商业应用的“定制化”,还是一件很难的事。除了数据量大、处理环境复杂、垂直领域数据难以获取外,还拥有着不小的数据合规复杂性。
此时,如Magic Data这类公司便能提供相应助力。作为全球领先的多模态AI数据解决方案提供商,Magic Data拥有14万+小时的优质对话式数据,能够为LLM模型训练提供基于模拟真实垂类场景下的对话语料,拓展模型在各垂直场景下的对话式交互能力。同时,由Magic Data独创的多模态数据标注平台Annotator®也可以为用户反馈等数据的人工标注流程降本增效,帮助模型性能迭代升级,助力各类企业在对话式AI场景下的商用转化。
Magic Data官网拥有各类domain-related finetuned数据集,共计20余类。其中两类示例如下:
中文对话音频数据集-衣食住行主题
https://www.magicdatatech.cn/datasets/asr/mdt-asr-aa04-mandarin-chinese-conversational-speech-corpus-daily-life-1640747801
中文对话音频数据集-教育医疗主题
https://www.magicdatatech.cn/datasets/asr/mdt-asr-aa12-mandarin-chinese-conversational-speech-corpus-education-and-healthcare-1640758020
同时,Magic Data已开源多个基于ChatGPT的可扩展对话数据集,欢迎前往MagicHub 开源社区 https://magichub.com/ 查看。数据集示例如下:
中文教育客服文本数据集
https://magichub.com/datasets/chinese-customer-service-scenario-text-corpus-education/
中文金融客服文本数据集
https://magichub.com/datasets/chinese-customer-service-scenario-text-corpus-finance/
中文医疗客服文本数据集
https://magichub.com/datasets/chinese-customer-service-scenario-text-corpus-healthcare/
中文日常聊天文本数据集
https://magichub.com/datasets/chinese-conversational-text-corpus-daily-life/
MagicThoughts|让ChatGPT变得更智能的Finetuned数据集相关推荐
- ChatGPT让沟通更智能、更便捷
ChatGPT让沟通更智能.更便捷 ChatGpt是最近引起强烈关注的一种技术,它可以实现聊天机器人,为使用者解决复杂的信息获取和学习任务.但他也不仅仅是一个聊天机器人,它是一种基于深度学习算法的自然 ...
- 米兔机器人 编程案例_米兔积木机器人改装双层立体车库,通过编程变得更智能...
上次,我们分享了双层车库的搭建步骤[没车不要紧,先拼个智能车库吧],但只有外观仍然不能实现车库实现自动化运行,为了让小小停车库变得更智能,我们采用了米兔积木机器人拓展包颜色传感器,并通过米兔积木机器人 ...
- 智能运维 devops_Coffee Shop DevOps:如何使用反馈循环变得更智能
智能运维 devops 这个月,我们来看看如何打破重复做同样的事情并期望得到不同结果的周期. 您认为git blame是您唯一需要的反馈循环吗? 或hg annotate -u -n . 或svn - ...
- 更智能更高效,区块链打造更美服装行业
区块链重构服装产业链,重塑价值创造方式. 服装行业,作为世界最古老的传统行业之一,一直陪伴着人类社会的"成长".然而在过去数十年的发展中,服装行业却成为了全球第二大污染工业.过度生 ...
- 更智能、更安全:戴尔推出全新商用PC产品组合
6月12日,戴尔科技集团举办"新机在握,智迎挑战"2020戴尔全新商用客户端产品及解决方案发布会,推出屡获殊荣的新一代Latitude.Precision和OptiPlex商用产品 ...
- 菏泽话务员机器人方案_智能打电话机器人让电话营销变得更简单
原标题:智能打电话机器人让电话营销变得更简单 如今的生活因人工智能的发展而变的越来越好,特别是进入互联网时代,国内客服环境发生了巨大变化,传统的客服体系正在迫捷升级, 智能打电话机器人的到来对应了企业 ...
- 智能公交带来出行新感受,让城市公共交通变得更“聪明”
智能公交带来出行新感受,让城市公共交通变得更"聪明" --以厦门公交为例 大家都知道,国内大部分城市交通费用拥堵,严重制约我国城市的经济发展,事实上,和发达国家比,国内城市私家车的 ...
- 云鲸扫拖一体机器人说明书_让做家务变的更简单:云鲸智能扫拖一体机器人测评...
让做家务变的更简单:云鲸智能扫拖一体机器人测评 2020-02-07 10:57:33 14点赞 19收藏 30评论 一.前言 说到提升生活质量的家用电器,扫地机器人排名绝对能数得着,从早期简单清理到 ...
- 分享一个苹果Siri接入ChatGPT的方法,让你的Siri更智能
今天我给大家分享一个苹果Siri接入ChatGPT的方法,让你的Siri更智能: 方法很简单,只需要几步: 1.只需添加一个快捷指令 2.在唤醒Siri后,说出指令名称即可 3.Hey Siri 智能 ...
最新文章
- 美多商城之用户中心(收货地址3)
- 发布在《30天自制操作系统》之前的帮助阅读贴
- DataTable 数据去重复
- linux线程一直在增加,在.net core中遇到的奇怪问题:内存与线程数一直增长
- step1 . day7 C语言基础练习之指针和函数
- filename: core/loader.php,使用第三方包后出现的这个错误,你们都遇到过吗?
- 哈希表 哈希函数 时间_您需要了解的哈希函数
- 24c04硬件地址位_硬件刷题篇(一)
- string类型的数字字符串直接转换成int型方法
- c语言单片机常用函数,C51单片机C语言函数编辑 -单片机-电子工程世界网
- 梯度下降法理论与实践
- 面试时要怎么做自我介绍呢?
- Go中chan引发的协程死锁
- cadence ETS安装过程
- Markdown小问题【日常更新】
- 美丽乡村建筑建设新农村规划设计农村改造调研报告城乡统筹规划(共2383份,15.50G)
- python解一元二次方程
- 凌晨3点不回家,你咋不去死
- WinInet编程中如何使用异步
- 如何把拱门改成方形_闭气式方形拱门的制作方法