2020年3月17日,在超千人同时在线的“智源论坛·论文写作专题报告会”上,三位智源青年科学家分别进行了精彩的在线分享,题目分别为:中国科学院计算技术研究所研究员兰艳艳《论文写作小白的成长之路》、中国人民大学副教授赵鑫《谈如何写一篇合格的国际学术论文》、北京大学研究员施柏鑫《计算机视觉会议论文从投稿到接收》。

他们通过丰富的实战示例,分别从论文写作的润笔和修改技巧、论文写作的常用步骤与方法、论文投稿和审核中的关键注意事项等多种角度,详细解析了如何写好一篇优秀的国际学术论文,收到了直播间观众的热烈反响。我们将他们的演讲整理成文字,陆续发布。

今天,我们首先介绍智源青年科学家、中国科学院计算技术研究所研究员兰艳艳的报告《论文写作小白的成长之路》

兰艳艳,2011年获得中国科学院数学与系统科学研究院概率论与数理统计专业博士学位,长期从事信息检索与机器学习方向的科研工作,在基于机器学习的信息检索算法和理论方面研究方面取得一系列原创性成果,发表CCF A类论文42篇,CCF B类论文12篇,谷歌学术引用超过2500次,h-index=23。获2012年SIGIR最佳学生论文奖和2017年CIKM最佳论文Runner Up奖。

兰艳艳在报告中,结合她个人的成长经历,从论文写作小白的视角出发,针对人工智能领域的顶级会议的论文要求,畅谈了在论文写作中如何进行分层布局、修改润色、英语表达、提升论文高度以及如何与科研互相促进等方面的经验和技巧。

有趣的是,据兰艳艳介绍,她的第一篇发表论文是从一段“黑历史”开始的……相信大家都迫不及待想了解了吧,那就请赶快阅读下面的内容吧。

 整理:智源社区 季葛鹏,赵言,常政

01

追忆“我”的第一篇论文

大多数同学一开始是不知道如何写论文的,甚至写一个论文摘要的时候,看半天都无从下手。其实,科研论文的写作本身就是一件不简单的事情,包括我也是和大家一样,从一个“科研小白"开始,通过不断的科研思维锻炼并加以用心的体会总结,慢慢成长了起来。

首先,分享一段“黑历史”,回顾一下我第一篇论文的写作历程(上图左边是该论文发表后的样子)。当时是2007年3月份,我还是硕士二年级在读,恰遇机器学习领域的顶级会议NIPS(其通常截稿日期是在5月份左右),便一口气洋洋洒洒写了篇有60页之多的投稿论文。就是想到哪说到哪儿,最后的效果和这个彩旗一样杂乱(上图右边),当时我的合作导师是微软亚研院的刘铁岩老师,在提交给他之前,我甚至还稍作修改并缩减到46页。其实当时自我感觉非常良好,认为每个地方写的非常清楚。我想当时刘老师看完这篇文章后的状态一定是这样子的(如下图)。

刘老师的这个状态也是现在我在指导学生论文时候的状态,也就是一种生无可恋的感觉。包括我的很多毕业生,当他们进入了工业界或者学术界,在给他们的学生修改第一篇论文的时候,就说跟我说:‘老师,我现在是真的深刻体会到了你当初的那种感觉’。其实,学术论文写作并没有大家想象的那么困难,我相信通过一定的逻辑思维训练并掌握一定的写作技巧,就可以迅速脱离“论文写作小白”的现状”。(兰老师给咱们做心理建设,是不是超级暖心)

02

论文的层次结构——分块

其实我在写第一篇论文的时候,根本不清楚应该写成一个什么样子的文章,甚至不清楚文章格式是什么样子、每个部分应该囊括什么内容。我相信大家的起点比当初的我要高很多的,很多同学可能经过了一些专业的培训,看了很多学术论文,也有了一定的论文意识。这个意识也就是论文的分块。我们通常将学术论文分成了七个板块(如下图所示):首先会有一个摘要(Abstract)、引言(Introduction)以及相关工作(Related Work)的介绍,然后介绍你文章的主体内容(理论、模型或算法),接下来会用很多的实验(Experiments)去验证你所表述的核心内容,最后可能会有一些讨论(Discussion)和结论(Conclusion)。可是,对于大多数同学来说,就算熟悉了论文的分块结构,也不知道怎么下笔,加上拖延症晚期的患病史,很多同学会卡在摘要部分的写作上面并为之抓狂一整天。(哇,兰老师,我们在您眼里是透明的吗?)其实这个现象只是一个小小的缩影,因为写一个摘要等同于写整篇文章,那么我们该如何避免呢?

03

论文写作的灵魂——逻辑

在我看来,学术论文写作本身是一个非常严谨的科学问题,其灵魂也就是“逻辑”:整个论文结构的块与块之间需要逻辑,每一块中段落与段落之间需要逻辑,甚至每一段中句子与句子之间也需要逻辑。那么我们如何把论文的“逻辑”很好的展示给审稿人或者读者?我自己用的是一种叫“3W2H”的写作方法(如上图所示):

  • Why?

对应论文的动机(Motivation),即:为什么要做这个工作,有什么新颖的发现,以往的工作有什么缺陷,总之让审稿人觉得这篇工作是必要的。

  • What?

对应论文的贡献(Contribution),包括:本文的主要工作,对于社区的帮助,值得展示给大家的内容。

  • How?

对应论文的方法介绍(Theorem& Model & Algorithm),包括:这个部分需要强调你的”招数“厉害在哪里,是如何实现的。

  • How much?

对应论文的实验(Experiments& Discussion),即:展示你方法的效果有多好,写下你的观察并给出你的讨论。

  • What then?

对应论文的结论(Conclusion),包括:这项工作接下来的发展,对社区未来所产生的推动作用。

在完成这个“逻辑树”后,我们便建立起论文的整体逻辑架构。“3W2H”中的每一个元素都不是相互独立的,而是可以相互促进的,你可以在不断思考的过程中,发现其中某个点的不足之处,并加以提升。其实,论文能不能被录取,靠的就是“3W”,所以在平日的写作当中,最重要的是在整理三个W的思路。我相信,只要你把三个W梳理清楚了,就可以把握文章的块与块之间的逻辑关系,就可以很清晰的判断这篇文章到底是不是一篇合格的科研论文。

那么,我们如何建立起3W思想呢?建议同学们平日里的每一个工作,就尝试去写一个包含“3W2H”这五个部分的草稿(Draft)。在构建这个Draft的时候,需要确认你要做什么(What),为什么要做这个工作(Why),我这个工作会产生什么样的影响(Whatthen)。这个Draft需要清楚地包含以下几个部分:记录时间,我为什么要做这个工作,现在的理解是什么。在后期的工作中不断的修改与完善这个Draft,总结来说就是我们要不断的站在一个全局的角度去看待你的核心问题,而不是钻入其中一个点无法绕出来,最终导致局部最优。

最后,不得不提的就是很多同学在写作时最容易忽略的东西:段落与段落之间、句子与句子之间的逻辑关系。大家是否都有这种习惯:"Obviously,..."或者"Apparently, ...",很多你认为很显然的推导,其实在审稿人那里都不那么显然了。在审稿人或者读者在阅读文章过程中,当遇到其中某一小步无法跨过去的时候,就会产生了疑惑,而当这些小步积累到一定程度的时候,就会对整个文章理解产生很大的偏差。(小朋友,你是否有很多问号?)所以我们在平常的写作之中,如果把握好每一个句子间的逻辑关系,那么整体的逻辑关系一定很明晰,就不会让你的导师出现“生无可恋”的感觉了。

04

论文写作中的“小而美”——润色

但论文光有逻辑肯定是不够的,它只能说是一篇合格的论文,并不能表示你已经写出一篇很好的论文了。什么意思呢?大家可能很会喜欢《奇葩说》这个节目,因为节目中讲的道理很接地气,能用一些例子等来激发你内心的一些思考。我们写论文也一样,需要加进一些小而美的技巧,让你的文章显得内容很丰富、很有内涵,也容易读者理解和引起共鸣。

下面,我介绍几个技巧。

①善用名言——科学也有科学之美

首先,是论文润色的技巧“善用名言”。比如来自UCLA的朱松纯教授通常会在论文的开头使用名家名句,在这里借用名言有时候是作为论证研究的问题的重要性,有时候是作为引子(即:引出问题和引发思考)。当然,如果想用一两句话,试图成功论证一个庞大的知识体系,那我觉得这可能不是科学,而是神学。就如同对衣服的修修补补需要穿针引线,对于行文思路的描述也需要一个很好的启发式思维,打开你的视角的同时,也启发了读者的兴趣世界。(想要我们推送更多名言的话,比如“上帝不掷骰子——爱因斯坦”,但是左上角却可以关注公众号哦!)

②举例子、做类比——科学来源于生活,立足于实践

第二个技巧是“举例子”,它也非常重要。以我们在AAAI2016发表的文章——“Text Matching as Image Recognition”为例,我们在文章里引入了一种文本匹配的新视角,并建立了一个层次化模型,虽然从文字上表达不是一个很复杂的逻辑概念,但读者却并不容易容易理解什么是“多层次数学模型”,也可能会产生歧义。这时,如果从一个例子入手,详细地解释模型对于整句式如何拆分、判别的,再导出计算方面所对应的数学映射关系,这将是更容易理解的。例如,我们通过使用下图中的三个颜色框来表征论文所提出的“多层次”模型,分别对应单词完全一致的情况,短语的相近匹配(顺序和与语义的打乱),和句子语义的匹配三个层次。

如果说举例子是使自己算法具象化的一种表现,那么作对比分析或者相近的类比分析将会是更有效、更有说服力的方法,并且使你的文章更加特点鲜明。如下图所示,将较为难理解的文本匹配任务与机器视觉中的基础任务(图像识别)进行相似性的类比,以一种互补理解的形式将文本层次和图像层次的抽象关系直接展现在读者面前,这也是大家常用的写作技巧之一。

另外,在论述所研究问题时,不妨立根求源,科学技术来源于生活,解决问题是为了使我们的生活更加美好。所以当写作遇到瓶颈的时候,不妨“行有不得,反求诸己”,只不过这个“己”可能不仅仅是个人意识到的问题,也可能是自然界抛给我们的橄榄枝。

③善用图表——生动形象

第三个技巧就是“善用图表”。图表对于数据的论证和可视化都有着非常重要的作用,在科技论文中,图表肯定是不可或缺的。但如何让图表自成体系地论述清楚文章的研究思路,这就是一个相当富有挑战性的任务了。以来自UC Berkeley的Trevor教授的一篇文章为例(如上图),图中首先以启发式问题引入,然后提出推断模型的反证法,然后根据数据反推,直到得出最后的结论,仅仅一个图就能清晰的突出文章的主要贡献,直观而又生动。这样的话,摘要的文字性综述再加上图表的生动“翻译”,基本在短时间内就可以让读者,建立起对一篇新文章的深刻影响,这将是一个加分项,也非常有利于学术交流。("人类获取的信息83%来自视觉"——心理学家赤瑞特拉。我也要善用名言,现学现用!)

说到这里,我想告诉大家的是,前面讲的这些技巧通常不是分离的,在论文的每一个部分都可以综合使用。比如下面一段话来自我写的一篇文章,它获得了2012年SIGIR最佳学生论文奖。这段话属于论文的motivation部分,用来表达我们想做的研究很重要,综合运用了举例解释、对比、名言和数据支撑等来论证工作的重要性,最后用提问的方式来得出一个结论。通过综合应用这些技巧,给人的印象就会显得比较深入、有层次、有说服力等。

④承前启后——Smooth

承前启后,非常的关键。在较长的论述和算法推导过程中,借用连词以及一些逻辑词,将是文章行文思路的点睛之笔。具体的可以借鉴一些简单的四六级写作的连词,这里简单罗列几个:First,Second,Third,Finally,As a result,Consequently...

我最初写理论文章的时候,对于承前启后的意义也不是太理解,觉得自己把理论表达清楚了就行了,后来才明白它们可以使得读者们即使看不懂你说的理论,也可以大致判断出你写的是哪一方面,接下来将要讲什么。这样他读你的文章就会感觉比较顺,并且愿意顺着继续读下去。

当然更高级一点的话,就是要让读者觉得你每一句话都是水到渠成的,思路一直被你拽着往前走,不做过多的联想,觉得你说的就是他想的,以至于读起来感觉酣畅淋漓。

05

思想、逻辑和文化的融合——语言

除了润色之外,论文写作中的英文语言表达能力也是一个加分项。我们中国人由于并非英文的native speaker,需要考虑到和国外的文化差异。中国人在写作时,特别喜欢用用which、what等等一些修饰语、定语从句等,这要么可能是好显得自己好像很有文化,要么可能就是水平有限、不这样写就写不好。但如果我们仔细去读国外学者的文章,会发现他们的表达风格非常直接,特别善于用一些简单的例子来讲清楚大道理,很少用一些高大上的词汇。我觉得这是需要我们特别注意的,不要刻意追求说一些高深的大道理,而是用真诚、接地气的方式,用小的、局部的例子讲明白你要表达的内容。

06

文章的全局高度如何提升——高屋建瓴,点状突围

到这里,你可能会说我的文章已经很有逻辑、思想,也很润色了,但就是觉得高度不够。那很多人就会想到,是不是可以通过写成一个Framework(框架)来显得很高大上一些?我觉得一个工作能成为一个Framework当然是有高度有创新的,但是不能为了Framework而Framework。正如同读博士的意义。上图描述了从本科到博士的过程,等到了博士阶段,便需要在自己的领域的特定研究方向能有一个突围,突出现有研究的局限,但同时又不能忽略了领域已经有的研究所形成框架,也就是说要将自己所进行的工作与现有的领域和研究更加深刻的连结在一起,能够作为一个突出贡献点,对扩宽领域的知识面做出巨大贡献,这将是文章高度的体现。研究工作也是这样的,真正要挖掘自己的工作的价值。举个最简单例子,比如你提出了一个创新,如果能将其他人的工作成果作为其中一个special case,那你确实产生Framework了;或者说你的成果和别人作类比的话,发现相当于步入了另外一个新的发展阶段,那你的工作就高大上了。所以我们不应该为了Framework而Framework,而是首先要努力探索你工作的边界在哪里,随后去发现你可以往哪个角度去推进整个研究工作。

(什么?这么多具体而针对性的干货还不够干?我已经快被你们榨干了啊,委屈巴巴,好吧……祭出压箱底的法宝,请看兰老师接下来的“大招”!)

07

把经验转化成能力——复盘

复盘,至少对我来说是分享给大家的最大一招了。它能真的帮你把经验转化成能力。记得当初在微软的时候,刘铁岩老师带我们做了这样一个活动。我们在论文投稿的过程中,基本都会从一篇论文的初稿开始,改很多版本,最终版本和初稿相比基本已经面目全非。那么在论文投稿结束呢?这就是你反思成长的时刻了。我们将最新的版本到最早的版本重新串了一遍,标注出哪些地方改了、为什么这么改,改之前和改之后的差别有多少等,从读者的角度考虑,从自身的角度,也从导师的身上学习,这样就形成了一个累积的笔记。在这个过程中,我感觉非常的受益。

最后,我将一句名言送给大家:“像一个行动者一样去思考,像一个思考者去行动”,知行一定是合一的,在写论文或者研究工作的时候,如果能不断地把思考和行动放在一起,我相信你们一定都会成为写论文的高手。

08

回顾总结——提纲挈领,融会贯通

现在,相信大家在读完兰艳艳的经验分享之后,会对如何写好一篇高质量的学术论文产生一些新的启示。这里不妨总结回顾一下前面的内容:有了“3W2H”的论文灵魂审问逻辑,有文章润色的四个经验技巧,有“融合文化和逻辑”的语言表达,有“从面到点”的突破和拔高,有“不断复盘、追问”式的能力增长等。需要提醒大家注意的是,这些经验或技巧,均不是互相割裂的,它们应该在被提纲挈领理解的基础上,彼此融合在一起,渗透进一篇论文写作的各个部分之中。

Q&A

Q: Abstract、Introduction、Related Work和Conclusion四个部分容易混淆,如何区别?

A: 容易混淆Abstract、Introduction、Related Work和Conclusion这些部分,其实是没有抓住各个部分的侧重点,这里不妨,再对科技类文章的组织架构,进行重新解读,做一些简单的“训诂”,以更好地帮助你理解各个部分的突出要点是什么,与其他部分的区别在哪里。

Abstract

Introduction

Related  Work

Conclusion

包含内容

全文总结

全文总结、文章组织(可选)

领域内相关工作

结论和未来展望

侧重点

高度凝练

全文的精华,一个完整的故事,尤其要清晰强调3W的内容

相关工作的内容本身以及和本文的关系

文章得到的结论和成果对未来的启发

Q: 我的算法改动很微小,如何体现所做工作的创新性等问题?

A:我们的固有印象总是将创新点作为学术研究的卓越贡献,方法上的创新固然会被考虑,但是比起为了“创新”而“创新”,更重要的是你所提出的解决办法,有没有解决原先存在的问题。只要是解决了现有问题并有贡献的,哪怕是很微小的一步,很简单的一步,也是值得称赞的。另外,我们再换一个角度来思考,自然界的规律都是大道至简的,作为深刻影响经典力学的牛顿第二定律,从形式上来说,也是F=ma的线性逻辑。所以用最简单的方法解决最复杂的问题。(在这里,小编推荐大家一句话:"Make everything as simple as possible, but not simpler." - by Albert Einstein。)

Q:论文被拒稿之后怎么办?

A:当论文在一次审稿“杯具”之后,首先要做的是仔细阅读审稿人的意见,看是否对论文的进一步修改有帮助。其次,不要害怕文章被别人看到,更应该反其道而行之,找一些师兄师姐和导师,让他们给你提意见,若他们是此领域的,会给出一些更有针对性的建议,若他们不太了解你的研究领域所做的工作,那么重新组织你的思路,能够给其他学科的人解释清楚自己的工作,这将是自己的条理的完整性的提升一个很好的促进方式。

另外:可以参考本系列第二场直播,以及总结稿件。北京大学施柏鑫老师站在审稿人的立场上,会给出一些审稿人的思考角度,如何与审稿人Rebuttal,这也是一门学问。

Q:如何评价自己的研究工作是有价值的?

A:这方面其实就是我前面“3W2H”中讲的why和what,首先,它们一定是建立在你大量的调研和基础上,比如你肯定需要读很多文章、参加很多分享或讲座,这样才能使得你比较清楚自己研究领域的问题是什么,你已经研究到了什么程度。第二个方面,你还可以通过去请教你的导师、领域专家或者其他比你更senior的一些人,请他们来指导你去形成一些评判。

智源论坛,AI技术前沿精粹尽览

独家经验分享,顶尖学者零距离

探讨前沿技术,亦分享职业经验

助你成为更好的研究者、工程师

敬请期待“智源论坛·论文写作专题报告会”下期:

赵鑫 《如何以初学者的身份写好一篇国际学术论文》

施柏鑫 《计算机视觉会议论文从投稿到接收》

顶会最佳论文得主经验谈:论文写作的灵魂、技巧与高度提升相关推荐

  1. 如何去选取第一批要阅读的论文?_顶会最佳论文奖得主:初入科研领域,如何正确做科研?...

    文字整理:智源社区 常政.贾伟.王炜强 每个人都拥有着相似的才智,为什么有些人能顺利地完成学生到学者的过渡,能在学术生涯早期早早地做出突破性工作:而有些人,虽有雄心壮志,却始终不得其法,不能进入科研之 ...

  2. 顶会最佳论文奖得主:初入科研领域,如何正确做科研?

    每个人都拥有着相似的才智,为什么有些人能顺利地完成学生到学者的过渡,能在学术生涯早期早早地做出突破性工作:而有些人,虽有雄心壮志,却始终不得其法,不能进入科研之门? 初入科研领域,如何才能正确地做科研 ...

  3. CV顶会最佳论文得主分享:好论文是怎么炼成的?

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 作者:胡瀚 |  已授权转载(源:知乎)编辑:CVer https://zhuanlan.zhihu.com ...

  4. 国内唯一ACL最佳论文得主冯洋:冲击最佳论文需要知道的事情

    整理:Mr Bear 转载自:AI科技评论 在10月30日CCL2020的学生研讨会中,来自中科院计算所的冯洋研究员进行了<冲击最佳论文需要知道的事情>的报告. 在本次演讲中,冯洋老师分别 ...

  5. 国内首次!3位清华姚班00后学霸斩获计算机理论顶会最佳学生论文奖

    作者丨Joey 好困 来源丨新智元 [导读]2022年计算机理论顶会STOC正式开幕,来自清华姚班的三位00后学霸斩获最佳学生论文奖. 近日,理论计算机科学领域顶级国际会议第54届ACM计算理论年会( ...

  6. 华为代码规范_53年国内唯三,华为MindSpore论文获顶会最佳论文提名

    晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI "研究芯片光砸钱不行,要砸数学家.物理学家." 任正非今年5月在接受<科技日报>专访时如是说.据任正非透露, ...

  7. 史上最全!计算机科学领域顶会最佳论文大合集:微软研究院最多,清华排24...

    ↑ 点击上方[计算机视觉联盟]关注我们 最近,计算机科学领域的一份硬核资源更新了,收罗了自1996年以来这一领域的顶级学术会议最佳论文,堪称史上最全. 整理这份资源的,是布朗大学计算机科学助理教授Je ...

  8. 清华博士 计算机 论文,[转载]访FOCS最佳论文得主清华大学博士生陈汐

    在专注和交流中捕捉灵感,访FOCS最佳论文得主清华大学博士生陈汐 陈汐,计算机系博士生.从2005年12月至今,先后有3篇论文被理论计算机科学界最重要的两大会议--STOC和FOCS录用,一篇论文入选 ...

  9. 中国芯片研究再获国际顶会最佳论文提名!清华魏少军、刘雷波团队出品

    允中 发自 凹非寺  量子位 报道 | 公众号 QbitAI 这是亚洲团队在52年MICRO发展史上的第二次. 荣耀属于清华大学魏少军.刘雷波团队. MICRO:the International S ...

最新文章

  1. 自定义ViewGroup 实现拖动跟快速滚动的效果
  2. 前端学习(2618):vue插槽--默认插槽
  3. C++ 拆分字符串-copy()
  4. Cannot convert value of type 'com.sun.proxy.$Proxy10 implementing com.shuai.
  5. Linux权限z代表什么,linux用户与权限使用方法
  6. oracle外部结合,浅谈Oracle外部文件
  7. python bp神经网络进行预测_python实现BP神经网络回归预测模型
  8. Mac端Java开发分析工具JProfiler 13.0.1
  9. k8s-calico
  10. DiskFileUpload类和fileitem类
  11. html全屏banner轮播代码,jquery自动全屏轮播图banner代码
  12. 51单片机自学笔记(一)——keil软件的使用
  13. 图片 title 和 alt区别:
  14. 阿里云商标注册查询系统入口链接(支持图片搜索)
  15. 目标检测基础:好文推荐
  16. 了解黑客经常使用哪些工具
  17. 学生动漫网页设计模板下载 火影忍者(7页)大学生HTML网页制作作品 简单漫画网页设计成品 dreamweaver学生网站模板...
  18. 开源自动化测试工具EFT
  19. Python批量处理大量excel数据(含完整代码)
  20. 基于Element Plus 表格导入和导出excle文件

热门文章

  1. 阮一峰react入门笔记
  2. 通用权限管理系统组件 (GPM - General Permissions Manager) 在跨国直销企业电子商务项目中的成功应用...
  3. PAT甲级 1003 Emergency 单源Dijkstra最短路
  4. Shell教程--Shell 函数
  5. Snap, AppImage和 Flatpak之间差异
  6. CXF在项目中的真实运用--WS访问客户端编写[java、.net]
  7. ArcGIS10.2详细安装教程(附安装包获取方式)
  8. 逻辑斯蒂回归 - 多项式回归
  9. 计算机程序的构造和解释(第二版)笔记
  10. Elasticsearch单机版安装(基于CentOS7)