来源:量子位

做Excel表,真就动动嘴就够了!

看,输入想要干的事:给学生成绩排个名吧。

简单敲个回车,表格唰一下就列好了!

检查一遍也没错。

还能跨表格处理。

比如标记出两张不同表格中排名都在前十的学校。

哦豁,还有点超越ChatGPT?

毕竟给ChatGPT提出类似的要求,它只能帮我写出对应的代码,操作还得自己手动来。

这就是最近在知乎上引起关注的AI工具ChatExcel,一发布就登上了热榜。

它主打用对话的形式实现Excel复杂操作(Chat-to-Excel),告别记函数、手动设置公式。

做好的成品,支持一键导出成标准Excel表格,连复制粘贴这道工序都省了。

而且不用注册网页上就能用不限使用次数,相当利好懒人和Excel小白。

甚至懂Excel技能的人都感慨,自己会的这些是不是要没用了。

这就是由北京大学深圳研究生院/信息工程学院3位硕博生,独立开发的项目。

目前已开放Demo供大家试玩。

看到这可能很多人都以为,“这又是一个受到ChatGPT影响开发的项目嘛”。

还真不是

GitHub项目上的第一个commit是在22年3月就提交了。

而背后真正的契机——

其实是团队中一位小哥,想用技术帮女票解决点工作中的小烦恼啦。

这到底咋回事?量子位联系了主创团队,来一一给大家揭秘~

ChatExcel表现如何?

咳咳,别人女票的事稍后再谈,咱们先来看看ChatExcel的表现到底咋样。

总体来说,它想做的事就是跳过学习Excel、跳过写函数公式,直接把脑子里的需求变成表格里的内容。

团队在知乎首发产品时,用了一张图做解释:

老规矩,我们来上手体验下。

进入主页面后,网站默认展示demo,点击UPLOAD就能上传自己的表格。格式需要是标准Excel文件。

我们找隔壁ChatGPT生成了一份学生成绩单,让ChatExcel进行计算操作。

主要测试了需要插入函数的Excel操作。比如:

给总分在255以上的人标记为A,总分在240-255的人标记为A-,总分在210-240的人标记为B。

打完内容,敲一下回车,它就开始处理了。

假如老师想知道谁是单科第一呢?输入:

找到表格中数学成绩最高分的人。

然后,它就生成了一个新的界面,里面只有最高分童鞋。

如果还想对表格进行其他操作,点一下页面中的“UNDO”,它就能返回到操作前的表格了。

我们还让它对表格中的学生进行成绩排名、并列出名次,ChatExcel都没有出错。

除此之外,它还能连续完成任务

比如想在表格里增加一栏平均分,可以先要求它增加一列:

再进一步输入需求,让它把计算好的结果填进去:

最后得到的表格,点击“DOWNLOAD”,即可导出为普通的Excel表格。


体验下来,感觉ChatExcel主要有两大特点:

  • 连贯性

  • 准确性

比如之前也有帮人生成Excel公式的工具,excelformulabot能实现这一功能,但它是独立在表格外的,需要自己把单元格带入到给出的公式了。

如果是具体一些的描述,还会出现给不出公式的情况。

而对比ChatGPT来说,ChatExcel计算的准确性更突出。

比如计算同一个表格的平均数,ChatGPT不是弄错到底有多少个人,就是计算的时候带错数字,反复纠正都救不回来……

所以,ChatExcel是怎么做到的?背后原理到底如何?

把“乙方思想”贯彻到底

ChatExcel的原理一言以蔽之,就是直接把“大白话指令”转换成类似于VBA这样的程序语言,然后再执行程序。

底层基于Transformer架构,基本技术路线就是无监督训练+具体场景微调。

但NLP模型搞数学,一直都很容易出错,强大如ChatGPT都很难避免。

为此,团队在训练模型的过程中,将重点放在了符号逻辑上,期间还有意引入了一些逻辑符号的新知识。

由此我们也看到,它在计算上出错的概率并不高。

除了数学能力出众之外,ChatExcel最大的一个特点就是持续交互

这是因为ChatExcel每次的生成结果,都是基于用户提出的新需求+上一轮生成的表格。对模型的理解力及运算其实提出了更高的要求。

为什么要实现这一功能?

团队介绍说,如Dall·E、ChatBCG等AI工具,完成任务的方式都是单次不持续的。但在人们的实际使用过程中,想法是一步步推进的。

举例来说,用户和ChatExcel之间的关系就好比甲乙双方,ChatExcel是乙方,用它处理表格的我们就相当于甲方:

要求只管提,改到满意为止。(Doge)

同样,这个乙方思维也体现在开发团队自己身上。

Demo发布后,很多人跑来围观、试用和提建议。最常出现的反馈是,ChatExcel有点理解不了提出的要求,需要重新措辞调整。

对于这些情况,团队先阐明态度:建议我们全盘接收

同时也进一步解释了原因,目前开放的demo还不是很完善。

这一方面是为了看看大家的反馈做进一步优化;另一方面,也是希望收集更多的语料,让模型之后能更聪明一些。

比如,有人就提出:

既然都已经有“undo”(撤销)操作,什么时候可以把它处理表格的过程显示出来。

还有人附议,表格数据太多就很难检查它是否处理正确

提高ChatExcel执行任务的透明度,方便检查错误。

对于这些建议,团队和我们说,他们已经在开始着手调整了。

比如很多人反馈的语言理解问题,他们打算之后在对话框下根据用户的输入,推荐一些标准操作语句,大家直接选择就可以了,不用自己研究措辞,有点现在AI客服那味儿。

除此之外,还有这些功能也在开发的路上了:

  • 表格上传格式更加兼容

  • 展示ChatExcel处理表格的具体过程,更加透明化
    ……

以及ChatExcel更加具体的原理介绍,之后也会在官网以博客的形式发布。

甚至包括代码,也会进行开源

受到女票启发,把业余项目做成正式课题

说来ChatExcel的诞生,也是相当因吹斯听了。

它受启发于团队成员的女票、导师立刻拍板认可、把业余项目做成正式课题……

这还要从KidCY拉起小团队说起。

他们都来自北京大学深圳研究生院信息工程学院袁粒老师的课题组,已经是准博了,还有一位成员正在读硕士。

作为机器学习的基础理论研究者,他们日常和论文打交道更多。

为啥突然从理论研究转向应用?

这还得从Kid的女票说起。

他说自己的女朋友是一位中学信息老师,日常工作中经常需要帮年纪大的老师处理Excel表格问题。

为了帮女朋友多分担一点工作(bushi) ,当然也看到确实有很多人深受Excel复杂操作困扰,Kid就萌生了试试看的想法。

我觉得Excel公式的使用,多少还是需要编程思维的,这对于很多人、尤其是不擅长电脑操作的人来说,很不友好。而拿着工具书从头啃,也确实比较麻烦。

当时正值OpenAI的Copilot大火,看到AI在提升生产力上大有可为,他就拉着CY一起,打算仔细研究研究这事儿。

但事情前期,并没有想象中顺利。

一方面,它刚开始只是个业余项目,大家都是抽空来做。

另一方面,团队在技术路线上也做过重大调整。

最初,他们觉得ChatExcel应该是往判别式模型那块儿走的,于是就顺着这一思路推进,但没想到:

前期处理工作量太大,需要引入非常非常多的符号逻辑,数据要求很高。

这对于小团队来说基本上是致命的,因为数据量意味着人力物力时间成本都会飙高。

没有办法,Kid和CY就坐下来重新复盘这件事:

我们想到李沐老师发过一个视频,讲“BERT和GPT之争”,我们最初都觉得BERT各种指标表现更好。GPT呢,有点摸不清它想干啥。

但仔细一想,从任务本身的需求来看,生成式才是我们真正想要的东西。

加之去年OpenAI一系列生成式工作开始大火(如Copilot、Dall·E),两个人最后决定,推翻原有思路,重新从生成式模型做起

明确了技术路线,后续推进也就更顺了。

加上这项工作还得到了导师袁粒的认可和支持,团队在资源和经费上也更充裕了一些。

(p.s.但团队也和我们解释说,目前其实还不能负担太多成本,运行速度会受到影响、一些命令行识别也还存在问题

不管怎样,历经1年时间,ChatExcel终于发布demo。

但这只是计划的第一步

团队表示,接下来还将对产品做更多迭代升级,并会开源代码、揭秘背后技术。

对于ChatExcel的定位,他们坚持“小而美”。

Kid介绍说,大模型的确是当下的趋势,如OpenAI、百度等都在通用大模型领域不断推进成果。但他们认为,在一些子任务领域上,模型的能力还有待提升,这可能会是未来的一个趋势。

由此,他们目前会更加专注于模型特定场景下的能力提升。

至于长远目标,团队希望打造一个“Chat生态”交互式AIGC

终极“Chat生态”(幻想版)大概会长这样:

而回到ChatExcel本身,团队表示的确有商业化的考虑,但会是To B层面的。

(听说demo一发布就已经有不少公司联系他们了)

在To C这边,会坚持公益开放的形式,人人都能用。

而回看整个开发过程,Kid和CY的很多感受都记忆犹新。

比如看到ChatGPT做表格大火后,他们又惊又喜。

“惊”,是因为开始担忧会不会有很多同类产品出来?自己的项目没有生存余地了?

Kid说自己看到这些新项目不断涌出后,晚上都要睡不着觉了。

“喜”,则是因为觉得自己的想法和趋势发展一致,这也是一种肯定。

至于项目本身,他们的态度非常坦然,问题全盘接受,但对自己的成果也很有自信。

我们现在依旧觉得自己的方案很“优雅”。

感觉做理论的人转来做应用,总是能想到一些奇怪的思路hhh。

(应受访者要求文中Kid、CY为化名)

传送门:
https://chatexcel.com/
参考链接:
[1] https://www.zhihu.com/question/586673687
[2] https://zhuanlan.zhihu.com/p/607997627

推荐阅读

  • 西电IEEE Fellow团队出品!最新《Transformer视觉表征学习全面综述》

  • 润了!大龄码农从北京到荷兰的躺平生活(文末有福利哟!)

  • 如何做好科研?这份《科研阅读、写作与报告》PPT,手把手教你做科研

  • 奖金675万!3位科学家,斩获“中国诺贝尔奖”!

  • 又一名视觉大牛从大厂离开!阿里达摩院 XR 实验室负责人谭平离职

  • 最新 2022「深度学习视觉注意力 」研究概述,包括50种注意力机制和方法!

  • 【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!

  • 2021李宏毅老师最新40节机器学习课程!附课件+视频资料

欢迎大家加入DLer-计算机视觉技术交流群!

大家好,群里会第一时间发布计算机视觉方向的前沿论文解读和交流分享,主要方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)

无需注册,不限次数!北大团队搞出ChatExcel相关推荐

  1. 老罗落泪!北大团队搞出ChatExcel,说人话自动处理表格,免费且不限次使用

    上一篇:30岁硕士拿100万在云南开启"吃利息躺平式养老" 现在年轻人在怎样规划养老? 做Excel表,真就动动嘴就够了! 看,输入想要干的事:给学生成绩排个名吧. 简单敲个回车, ...

  2. 钉钉正式接入阿里“通义千问”大模型;金山办公发布“WPS AI”;北大团队推出ChatExcel丨每日大事件...

    ‍ ‍数据智能产业创新服务媒体 --聚焦数智 · 改变商业 企业动态 黑芝麻智能携武当系列智能汽车跨域计算平台.华山开发者计划参加上海车展 4月18日,黑芝麻智能在上海车展现场举办发布会,首席市场营销 ...

  3. 大模型中的「罗翔老师」!北大兔展联合团队搞出ChatLaw,发布即登顶热榜,可提供法律咨询...

    明敏 发自 凹非寺 量子位 | 公众号 QbitAI 大模型中的"罗翔老师",出现了! 北大团队打造的法律大模型ChatLaw,发布即冲上知乎热搜第一. 它具备大模型能力和充足法律 ...

  4. 北大团队推出“职场神器”ChatExcel!表格用户不再需要记公式---转自百度新闻|北晚在线

    最近,ChatGPT横空出世,吸引了人们对人工智能领域的目光.北京大学深圳研究生院信息工程学院助理教授袁粒及三名硕博生组成的团队日前开发了一款名为ChatExcel的AI办公辅助工具,可以通过文字聊天 ...

  5. 凤舞天骄TB商店修改器V1.0(DELPHI源代码,无需注册)

    经过分析,不仅可以修改原有的商品代码,还可以增加商品!不过得自己在ERSoe_Test.dll中写汇编代码 这里只放出一个针对157种商品DLL的版本,加了个30次试用的限制,大家不要见怪哦~~~ 分 ...

  6. 黄色图标navicat-解压即用-无需注册下载

    黄色图标版navicat,直接解压运行exe即可,无需注册 navicat版本呢11.2.7,window64位软件 文件:590m.com/f/25127180-481123997-dba551 ( ...

  7. 分享| 三款在线临时文件分享工具,无需注册

    今天给各位分享三款在线的工具,主要功能就是无需注册直接上传文件然后做分享,类似服务在国外很流行,但由于带宽成本以及监管问题,这类服务在国内极少. AirPortal 空投 官方网址: https:// ...

  8. VBA批量OCR识别提取身份证照片信息_手机扫描仪:直装就是VIP,不限次数,一秒钟就能提取图片中的文字...

    之前神器妹在神器精选公众号分享过v4.4.5修改版以及更老的版本,本次神器妹分享的是最新v4.6.4修改版(11月16日更新):直装就是VIP,不限次数,一秒钟就能提取图片中的文字. 可扫描识别身份证 ...

  9. 免费顺丰快递鸟单号查询不限次数api接口申请步骤

    随着电商行业的发展壮大,网购已经成为了人们当下一种主流的生活习惯.因而也带动了快递行业的发展壮大.市场上出现的快递公司也越来越多.电商平台及ISV商家对于快递查询接口的需求量也越来越大. 什么是快递查 ...

最新文章

  1. ui设计师要懂哪些B端设计原则?
  2. python HDF5 h5py 的用法
  3. 趋势科技:黑客勒索瞄准智能电视
  4. 一种比较省内存的稀疏矩阵Python存储方案
  5. 简单的mysql热备
  6. 基于pip的安装lxml库报错解决方案
  7. 第三方外部 Saas提供商如何跟使用 SAP 系统的客户进行对接接口集成
  8. php如何解决并发问题,PHP如何解决并发问题
  9. 将字符串转为16进制数_C语言中的进制互转与数值和字符串互转的混搭玩法
  10. C# 通过一个控制台打开另一个控制台
  11. 三分钟学会使用Pytorch.scatter函数
  12. 资料分析——基础知识
  13. 计算机技术应用于测量,在测量绘图中计算机技术应用探析.doc
  14. 计算机科学导论复习提纲,计算机科学导论复习资料整理
  15. 期待只在最美的时光遇见你
  16. 21天攻克PET核心词汇,加油!
  17. SpringBoot使用Nacos作为配置中心服务和服务注册中心
  18. 如何解决Worm.Win32.AutoRun.bqn(文件夹改exe病毒)
  19. 25 - 线程池和指令系统
  20. 2021-07-16芯片-全球半导体产业核心地区的补贴及激励措施

热门文章

  1. 开挂的00后!17岁「天才少女」被8所世界名校录取,最终选择MIT计算机系
  2. 年度最佳Android系统 | 运行在台式机、笔记本手提电脑的安卓Android系统
  3. Win10 电脑无法连接另外一台电脑的共享打印机提示Windows无法连接到打印机,拒绝访问
  4. docker容器扩容
  5. IT行业职位类别介绍
  6. Mac系统如何在圣诞节让电脑屏幕下雪?
  7. 关于 电脑 看电影时 对话声音小 场景声音大 声音忽大忽小 的问题
  8. (一)目标检测-R-CNN模型
  9. uniapp页面高度100%无效问题
  10. 关于本次活动超算平台的vscode远程连接(新人向)