来源:HyperAI超神经本文约3700字,建议阅读7分钟清华的博士矣晓沅分享了一个文本风格自动转换的新方法。

关键词:博士   NLP   IJCAI-SAIA YES

IJCAI-SAIA YES 于 7 月 5-7 日在上海召开,在这场汇集 AI 领域青年学者、学术大咖的盛会上,我们有幸采访到了来自清华的博士矣晓沅。

"轮椅上的清华学子毕业",7 月初,这一话题登上微博热搜榜,主人公正是我们本次专访的嘉宾--矣晓沅。

在本次 IJCAI-SAIA YES 会上,矣晓沅做了题为《基于学习实例隐空间的文本风格转换》的分享,介绍了一个文本风格自动转换的新方法:

利用流 (flow) 模型,基于多个风格实例来构建更强的风格信号,以此增强转换后文本的风格准确性,并在风格以及内容两个指标上取得了更好的平衡。

矣晓沅现场进行主题分享

这一方法适用于半监督训练,使得利用少量平行数据,进一步提升转换效果成为可能。

同时可以有效规避解耦复杂性对实验结果带来的负面影响,也实现了风格转换后,文本的内容保留度和风格准确度的一致性。

不用微博、不想走红,把时间留给科研

矣晓沅 6 岁患类风湿性关节炎,11 岁被下病危通知单、从此与轮椅为伴,21 岁被清华大学计算机系录取为 2012 级本科生,在母亲的陪伴照料下,如今他在清华度过了 9 年求学时光,顺利完成了博士期间的学习。

微清华大学计算机系马少平教授在微博称赞他

凭实力考上清华,未受任何照顾,同样凭实力读的博士

我评审了他的博士论文,工作很赞

矣晓沅博士期间在清华大学 THUNLP Lab 求学,师从孙茂松老师,博士期间主要研究文本自动生成。

即使身体不便,矣晓沅的科研成果也颇为丰盛,在 AAAI、IJCAI、ACL、EMNLP 等顶级 NLP/AI 学术会议,以及 CCL、《中文信息学报》等国内重要期刊会议中,发表论文 10 余篇。

清华校长邱勇为矣晓沅拨穗并颁发证书

但网络的走红似乎并没有对矣晓沅的生活产生影响,在被问到"上微博热搜是什么感觉"时,矣晓沅坦言"我不用微博,没有看"。

实际上这并不是矣晓沅第一次拒绝社交网络的"走红机会",博士期间为了专注科研,他曾多次拒绝文化类或娱乐性节目的邀请。对他而言,把时间留给科研才是最重要的。

师从孙茂松,打造 AI 诗人九歌

人的智能包括诸多方面,如逻辑推理能力、语言智能。前者对应的活动如下围棋,在 AI 领域的应用可见 AlphaGo;语言智能则涉及到人类的创造性,文本生成就是其中的代表行为。

诗词爱好者、本科就经常写诗的矣晓沅,萌生了一个想法,机器能不能像人类一样具有自己的创造力,机器在文本创造性上的极限又是怎样的。这也成为他博士阶段的研究方向。

2017 年,在导师孙茂松教授的指导下,矣晓沅开发了 AI 中文诗歌写作系统"九歌",用户只需输入句子、段落或关键字,即可自动生成绝句、藏头诗、律诗、词等不同体裁的诗歌。

九歌新版 3.0 系统将于 8 月 23 日上线

支持绝句、藏头诗、律诗、词等多种体裁的诗歌写作

访问九歌:

http://jiuge.thunlp.org/jueju.html

九歌采用了当时最新的深度学习技术,结合多个为诗歌生成专门设计的模型,基于 80 余万首古人诗作进行训练。同时九歌也支持多模态输入、多风格多体裁诗歌生成以及人机交互创作等功能。

虽然九歌在创作速度和数量上不受限制,偶尔也会生成一些很惊艳的作品。但在矣晓沅看来,好作品的出现可能是概率问题,九歌尚处于三流业余诗人的水平。绝大部分创作出的诗歌在篇章结构、前后呼应上,与人类创作的作品尚有差距。

矣晓沅认为,AI 与人类应该是相辅相成、共同促进、共同进步的。

输入"人工智能"九歌自动生成的七言绝句

以九歌为例,虽然时下是人类充当老师,用千百年来创作积淀的优秀文学作品,教导机器,但是随着技术进步、算法更新,机器创作的效果也会越来越好。

机器偶尔产生让人眼前一亮的作品,给人类创作者带来启发和灵感,激励人类创作者创作出更多更优秀的作品,这些作品又可用于提升模型性能。这是一个相互促进的关系。

首篇论文 4 投 4 拒,审稿意见最宝贵

与众多博士生的求学路一样,矣晓沅博士期间的研究也并非一帆风顺。

在投稿第一篇论文的时候,曾连续 4 次被拒,直到第 5 次才被收录,这个过程持续了一年多将近两年的时间,矣晓沅坦言当时承受了极大的心理压力。

从小就饱经病痛折磨的矣晓沅,这次同样没有轻易言败,他愈挫愈勇、越是失败越想去再次挑战,最终在导师和实验室同学的协助下,矣晓沅博士期间的第一篇论文最终被 CoNLL 2018 收录。

矣晓沅博士期间首篇论文被 CoNLL 2018 收录

论文地址:https://arxiv.org/abs/1809.04313

事后矣晓沅在反思这件事的时候,坦言"不要怕论文被拒",他觉得如果一篇论文被连拒多次,则表示文章一定有很多明显的不足。这时要广泛反思吸纳审稿人的宝贵意见。

此外还要有自己的判断,如果一篇论文只是为了凑数而投的灌水文,那么不被收录也很正常。

但是如果对自己的工作非常有信心,那么不要因为多次被拒而迟疑灰心,根据审稿人的意见不断完善论文,再投就是了,不管论文能否被收录,都能有所收获。

给学弟学妹:过来人的快问快答

大一入学时,由于基础薄弱矣晓沅的成绩在年级中仅仅排第 69 名,经过坚持不懈的努力,大二时他的成绩升至第 31 名,大三则达到了第 9 名,并在 2015 年获得了清华本科生特等奖学金(每年仅 10 名)。

但读博和本科是非常不一样的状态。本科遇到的问题和需要学习的课程,都有明确的路径。博士阶段则完全靠自己探索,有时候会迷失,有时候会看不到努力的结果。对此矣晓沅给出了一些过来人的"建议"。

Q1:读博之前需要做好哪些准备?

科研并不像理想中那般潇洒和炫酷,现实中的科研过程往往会面临非常多困难,也会非常枯燥。

因此对于想要读博的学弟学妹们,推荐大家本科就去实验室实习,即使打杂也能体验到真实的科研过程。

读博会遇到各种各样的困难,比如想不出研究方向、论证方法,或者实验效果不理想、论文被拒等。要克服这些学术上的困难,就需要你对自己的研究方向保有深刻的热爱和强大的信念。

既然选择了科研,就要做好心理准备,学术回报更多是精神回报和社会认可,不一定是大富大贵。

Q2:如何确定课题?

读尽可能多的论文,随时跟进行业最新技术。在选题时多思考、多和同学及导师沟通,分享自己的思路。

经验丰富的导师对大方向的判断非常敏锐,从思路上就能对你的选择给出比较可靠的判断。

Q3:如何避免撞题?撞题了如何应对?

在选题或做实验之前,确保你要研究的课题符合以下两种情况之一:

1、别人都想不到,只有你能想到。一拍脑袋就有的想法大概率是别人也会想到的。

2、虽然大家都想到了,但是只有你有能力做出来。

万一出现撞题,可以先仔细研读撞题的论文,确认你想到的细节对方有没有想到,对方的研究方法是否有很多不足。如果答案是肯定的,则课题还可以继续提升。

Q4:投稿时如何筛选顶会?

各个顶会都有自己的特点,要尽量根据不同顶会的喜好,灵活调整论文。

比如 ACL 比较注重分析、思路、效果,而 IJCAI 则比较综合,更多看中效果、方法,方法也要炫酷一些。投稿之前要先自行判断,然后再"投其所好"。

Q5:读博最重要的品质是什么?

青年学者最重要的品质就是探索和坚持。

科研的本质是探索,探索就难免会失败,会短期内没成果。因此不要因为失败而气馁。

这也正是科研的乐趣所在:做很多新尝试,尝试很多新方法。不要因为这项研究前无古人,自己又没接触过,就畏惧它,读博一定要多尝试。

坚持对于写论文发论文也非常重要。在动手之前,一定要想清楚自己选择的方向,多多评估这项研究的意义以及实现方法。

即使期间遇到各种各样的困难、实验效果不好,也不要轻言放弃,因为效果不好可能是多方面的原因,要有针对性地逐个击破,最终一定能做出来。

Q6:希望社会、家庭、学校给予青年学者哪些支持?

从社会角度来讲,希望给步入学术圈的年轻人更多的支持和理解。

他们投入了非常多的时间精力,但是一些基础学科如数学、物理,短期内不一定有成果,这个时候应该给他们更多的机会和时间。

从家庭的角度来讲,希望家人对青年学者多一些理解和包容,博士也不要为了做科研整年不回家。青年人和家人之间应该多沟通。

学校则应该在制度和经费上给青年学者更多支持。

Q7:推荐哪些学习资源?

研读论文可以访问 arXiv,关注行业最新的论文和研究动向;Google Scholar 也会根据个人的研究方向和兴趣自动推荐;还可以关注各个顶会的收录论文列表,根据研究方向或摘要筛选和阅读。

书籍阅读则推荐一些基础类书籍,如 Bengio的《DeepLearning》,中科院宗成庆老师的《统计自然语言处理》,邓力老师与清华 THUNLP 实验室刘洋老师合著的《基于深度学习的自然语言处理》等。

三本书都非常侧重基础知识

是夯实学科知识、了解最新研究的推荐书籍

清华园的无障碍推广者

作为特殊群体的一员,矣晓沅一直希望能够把自己的研究兴趣,和无障碍公益结合起来。

读博期间,他在清华校园中组织参与了众多无障碍公益互动。

2016 年清华成立清华大学学生无障碍发展研究社团,矣晓沅是这个社团的创始人兼第二任会长。

2019 年,清华大学无障碍发展研究院联合其他单位

在京举办"一带一路"框架下无障碍论坛

矣晓沅担任会长期间,组织社团在校内做了多项调研、提案、宣传工作,主要从法律法规、相关制度、人的意识理念等方面,邀请同学们坐轮椅、戴眼罩,传播并推广无障碍理念,强化大家的无障碍意识。

社团成立 6 年以来,吸纳的成员也从最初的 3/4 个人,发展到如今的 150 人,矣晓沅和社团同学们的努力,为清华大学的无障碍设施带来了非常显著的改善。

校方针对校内的无障碍设施,做了诸多修缮,目前清华的主要教学楼都配备了无障碍卫生间,很多老教学楼都做了无障碍改造,增设无障碍电梯和无障碍坡道。

教学楼无障碍卫生间(左)和无障碍标识提示(右)

同学们的无障碍意识也得到了增强,极大减少了自行车堵住无障碍坡道现象的发生。

博士毕业的矣晓沅,希望未来能结合自己的所学,做一些科技改善残障群体生活的事情。

在矣晓沅看来,走出清华园,同样需要无障碍设施和观念的推广普及,只有这样,才能共同创造更加包容完善的社会环境。

编辑:于腾凯

校对:林亦霖

轮椅上的博士矣晓沅:9 年求学路,我从清华毕业了相关推荐

  1. 轮椅上的AI博士矣晓沅:9年求学路,我从清华毕业了!

    By 超神经 本文转载自:HyperAI超神经 内容概要:IJCAI-SAIA YES 于 7 月 5-7 日在上海召开,在这场汇集 AI 领域青年学者.学术大咖的盛会上,我们有幸采访到了来自清华的博 ...

  2. 清华大学 计算机 矣晓沅,清华校长为他拨穗并俯身合影,玉溪“轮椅学子”博士毕业啦!...

    还记得矣晓沅吗? 他的故事屡屡让人感动 近日 这位玉溪学子 从清华大学博士毕业啦 邱勇校长为他拨穗并俯身合影 祝贺! 矣晓沅6岁时,因一场高烧患上"不死的癌症".11岁时,双腿失去 ...

  3. 清华计算机系残疾学生,清华研究生矣晓沅:轮椅上的坚韧“跑者”

    新华社北京6月26日电 题:清华研究生矣晓沅:轮椅上的坚韧"跑者" "对于我这样的跑者,最重要的是用双脚实实在在地跑过一个个终点,让自己无怨无悔."这是清华大学 ...

  4. 清华大学 计算机系 尹霞,轮椅上的清华博士毕业了,刷屏的还有她......

    近日 清华大学计算机系 2021年毕业典礼上 一位特殊的母亲 引发网友关注 "她几乎走遍了计算机系大部分教室 也跟所有的老师认识相熟 今天我虽不能授她一个学位 但她却应得到我们全系师生的尊重 ...

  5. 清华大学 计算机系 尹霞,轮椅上的清华博士毕业了,刷屏的还有她

    近日 清华大学计算机系2021年毕业典礼上 一位特殊的母亲 引发网友关注 "她几乎走遍了计算机系大部分教室 也跟所有的老师认识相熟 今天我虽不能授她一个学位 但她却应得到我们全系师生的尊重与 ...

  6. 清华大学计算机学院校友网,轮椅上的清华博士毕业了,刷屏的还有她...

    来源 中国青年报综合清华大学计算机系校友会 清华大学 央视新闻 近日,清华大学计算机系2021年毕业典礼上,一位特殊的母亲,引发网友关注. "她几乎走遍了计算机系大部分教室,也跟所有的老师认 ...

  7. 清华大学 计算机系 尹霞,轮椅上的清华博士毕业了,刷屏的还有她 .

    近日 清华大学计算机系 2021 年毕业典礼上 一位特殊的母亲 引发网友关注 " 她几乎走遍了计算机系大部分教室 也跟所有的老师认识相熟 今天我虽不能授她一个学位 但她却应得到我们全系师生的 ...

  8. 清华大学计算机专业学生埃朗读村,《朗读者~矣晓沅(清华大学计算机研究生  彝族)》...

    矣晓沅(清华大学计算机研究生  彝族) 笔记分享人      幸福娃 这个世界上,可能有些路,并不是靠双脚走出来的. 就像史铁生,在漫长的轮椅生涯中,创造了一座中国的文学高峰. 就像霍金,不能行走,不 ...

  9. 清华计算机系残疾学生,清华学霸矣晓沅:拖拽着残疾的身体,追求生命的完美...

    原标题:清华学霸矣晓沅:拖拽着残疾的身体,追求生命的完美 面对生命的打击,却不限于悲伤与愤懑,转而用永恒的爱愿去抵抗身体上的缺陷,这是史铁生对待残疾的信条. 当不能再奔跑时,他便停在轮椅上思考. 当再 ...

最新文章

  1. 尹伊:我眼中的Datawhale
  2. ubuntu18.04.4 没有声音
  3. VMware Workstation安装64位操作系统遇到的小问题
  4. [BZOJ 1500] [NOI2005] 维修数列
  5. tar 压缩与解压缩打包命令
  6. Python Turtle画分形树理解递归
  7. 致命车祸进展:Uber无人车检测到了行人,但选择了忽略
  8. java quartz 触发_JavaEE进阶知识学习-----定时任务调度Quartz-2-触发器Trigger
  9. 【shell 脚本】删除/var/log 下的日志
  10. 全网首发:解决JDK绘制位图字体的旋转位置错误
  11. TestFlight测试步骤
  12. 输入英文句子,导出英语单词个数和英文字母个数 Python
  13. 【四足机器人那些事】足端轨迹规划(一)
  14. Linux CFS调度算法核心解析
  15. 新生入学了,针对腾讯的产品全民K歌(或QQ空间、腾讯游戏......)做一次推广活动,包括产品功能设计和运营活动推广方案。
  16. Github 上 lux 下载神器的安装及使用教程
  17. All flavors must now belong to a named flavor dimension. Learn more at https://
  18. android手机改车载,到底手机导航还是车载导航好,我选择在车上加装安卓大屏...
  19. 商品促销倒计时效果实现
  20. 君正X1830芯片性能和处理器介绍

热门文章

  1. PIC单片机学习之独立按键
  2. linux 网站架构的演变
  3. Docker实践(6)—CentOS7上部署Kubernetes
  4. 使用Ptrace跟踪进程收到的异常信号(信号SIGTRAP是通过traceme后wait得到的)
  5. DNF登录器显示WIN无法访问指定设备_快速修复无法访问的u盘,不需要工具
  6. stm32cubemx无法生成工程_经验分享 | STM32CubeMX + STM32F1系列开发时遇到的四个问题及解决方案分享...
  7. 30百度人撑起自动驾驶半壁江山
  8. [DM] 都是套路: 从上帝视角看透时间序列和数据挖掘
  9. pandas库scatter_matrix绘图可视化参数详解
  10. RMI远程方法调用讲解教程