[转帖]怎样做研究(刘挺)
查看文章
|
怎样做研究(一)
http://ir.hit.edu.cn/~tliu/blog
几年前,我写了一套胶片,题目是《怎样做研究》,多次在实验室内部给学生们做报告,也曾对外讲过一次,听众反应良好。也有网友读过这套胶片,给我来信称有所收获。然而,胶片中的文字毕竟只是提纲携领,无法充分阐述我的想法,为此,借周末一点闲暇,把《怎样做研究》写成一篇文章,与师友切磋。 什么是科学 基础研究 应用研究 科学技术的力量
怎样做研究(二)
http://ir.hit.edu.cn/~tliu/blog
研究的层次 研究是分层次的,很多大科学家在晚年登上了最高层,比如钱学森在80年代倡导思维科学,他对整个科学技术体系进行了重新分类。在中国的大学里,分为一级学科,二级学科等,我就处在计算机科学技术一级学科下面的计算机应用技术二级学科下。二级学科的带头人称为学科带头人,二级学科下面一个研究方向的带头人称为学术带头人,我就被指定为学术带头人。 我的研究方向是信息检索,信息检索下面又有子方向,比如文本检索、文本挖掘、跨语言检索、跨媒体检索等,子方向下面设立具体的科研课题,比如文本挖掘中的多文档自动文摘课题,针对一项课题又有不同的解决办法,基于事件抽取与集成的多文档文摘就是利用一种具体的解决问题的方法。 总结来说,就是6个层级: A. 一级学科 B. 二级学科 C. 研究方向 D. 子方向 E. 课题 F. 基于某种方法对课题进行的具体研究 君子思不出其位,我是学术带头人,因此主要在思考C类的问题,也就是和信息检索相关的问题。一个学院的院长通常会思考A类的课题,学科带头人或者说是一个博士点的点长是要考虑B类问题的。一个人对相关的方向或学科有所了解,对自己的研究工作是很有好处的,只有看清了整体的学科面貌,才能知道自己处在那个位置上,自己未来的方向在哪里。我在读博士以及在微软做副研究员的时候,只看到E类问题,想到最多的是F类问题,因此你让我提一个新方向,让我对一项技术进行预测,我茫然无知。后来担任院长助理,负责学院的成果转化,需要了解学院里各个方向的发展状态,使我的视野开阔了一些。尽管我凡事不求甚解,但是喜欢总结归纳,因此对信息检索与其它学科的关系有了更多地认识,这对后来的选题很有帮助,特别是在应用研究方面,心里比较有底。 学科好比一棵大树的树根,研究方向如同树干,具体的课题就是枝叶了。和学科中各个方向都相关的研究课题是最基础的研究课题,比如在人工智能中,各类机器学习算法是图像识别、语音识别和语言理解等各个方向都离不开的,机器学习技术提高一步,好比树根抬高了一寸,各项应用技术也都跟着进步,因此越是基础的研究,越会对业界产生较大较深远的影响力。不过,基础研究的突破比较难,而在某个应用课题上不考虑一般情况,只考虑具体需要,成功的可能性大。枝叶上的课题做多了,经过合并同类项,就会发现比较共性的基础课题,比如我们在做问答系统、多文档文摘、例句检索等课题时发现复述(paraphrasing)是一个共性的问题,于是把复述单拿出来展开专门的研究,如此,可以越做越深。 学者的层次
怎样做研究(三)
http://ir.hit.edu.cn/~tliu/blog
怎样选题 前文曾提到科学研究的层次,并分了6个层级。此处所说的选题指的是从C到E三个层次上的选择问题,即:C. 研究方向、D. 子方向、E. 课题。选择研究方向是实验室(Lab)主任们需要重点思考的事情,选择子方向是研究小组(Group)的组长们需要重点思考的事情,选择课题是研究生们需要重点思考的事情。 选择太多,很容易让人困惑,要想理出一个头绪来,需要一些基本的原则。微软的许峰雄来访时谈到了他选择课题的三个标准:有足够的兴趣,能成为世界第一,能赚钱。(!)兴趣,这个原则是非常重要的,我赞同,获得国家最高科技奖的“黄土之父”刘东生院士是搞地球环境科学的,经常在野外作业,按常人推断,这该是多么枯燥艰苦的工作啊,但他说:“枯燥?不!因为经常有新发现,其中的乐趣难以形容”。我坚信任何一个成功的科学家的直接工作动源都是兴趣,而不是意志。(2)成为世界第一,不容易,但是应该作为一种判断标准,如果某个领域已经非常成熟,很难有什么创新了,或者大牛云集,已经打破头了,则应该有所回避。(3)赚钱,许峰雄是在工业研究院中工作,比较注重实用,因此他强调了“赚钱”,我是在工科大学里工作,也比较偏重应用,因此是赞同“能赚钱”这个标准的。不过,“能赚钱”不等于立即赚钱,5年、10年,20年后能够赚钱的研究课题都是值得关注的。 谈谈我选择课题的一些体会: 1、 要有实际需求 一个课题必须有实际需求,可能是现实的需求,也可能是潜在的需求;可能是直接的需求,也可能是间接的需求,总之是的的确确被人们所需要的。据个反例,比如自动文摘,自动文摘是我的博士论文课题,但是实际应用需求始终不清楚,自动文摘的结果用于编辑出版,质量肯定无法保证,用于帮助人们快速浏览资料吧,Google提供的包含查询词的简单的Snippet就起到了这个作用,因此,至今基于全文分析的单文档自动文摘到底用到哪里,仍然不清楚,这方面的研究已经有50多年的历史了,仍然是不死不活,总是找不到应用就无法得到政府和企业界的持续性支持,以往的付出成为鸡肋。我觉得单自动文摘不是一个好课题,目前阶段多文档文摘,或者说对某个题目的自动综述分析是非常好的题目。 2、 有较大的未知空间 以手写体汉字识别为例,市场上已经大面积应用了,在研究上就不宜再展开。 3、 与自己以往的工作有关联 如果你觉得自己的研究领域太窄,或者竞争对手太多,或者自己缺乏兴趣,则可以适当扩展研究方向,但最好是相关性地扩展,比如从自然语言处理(NLP)扩展到信息检索(IR),IR要用到NLP的技术,这种扩展是从底层技术到应用系统的扩展,很自然。再比如从图片检索扩展到视频检索,只是处理对象有变化,很多原有的技术优势仍然能够发挥。如果跳跃性太大,比如搞NLP,忽然发现做数据挖掘有前途,于是单纯地转向数据库中数据挖掘,和文本处理完全脱节,这种做法一方面无法发挥既有的技术积累,另一方面也让同行感觉你不够专注,不容易得到认可。最要命的是有的人根本就没有自己的方向,什么课题都敢接,这样的人可以一时间让人觉得风风火火,经费也很充足,但过不了多久就会摔落下去,因为缺乏积累,学术形象不清,公鸡下蛋,干了自己不擅长的事情,在学术圈还怎么混? 4、 有可能得到国家的支持 对于资深学者,他选定一个课题后,可以写出立项建议,去说服政府或军方支持他的工作,从而填补国家空白,成为国内这个方向的先驱。哈工大的杨孝宗老师借鉴CMU在wearable computing方面的研究成果,在国内率先提出穿戴计算机的概念,坚持多年,就获得了军方的认可。对于刚出道的年轻人,无力直接影响政府,那只有自己预先判定一个几年后可能成为热点的方向,先走一步,做出一些成绩来,等到大气候适宜的时候,由于他已经取得了一定的成果,也有可能被认可为这个领域的先行者,得到国家的支持。 课题的类型
怎样做研究(四)
http://ir.hit.edu.cn/~tliu/blog
在一个具体的题目上作研究,应该遵从怎样的程序呢?我觉得可以概括为“螺旋式深入”,也就是在“阅读”,“思考”,“实验”,“写作”,再阅读。。。这四个阶段的时间分配可以根据实际情况灵活调整,刚进入课题的研究生阅读调研花费的时间要多一些,而在一个课题上已经开展了一两年工作的人则可能增量式地阅读资料,阅读时间自然比起步时少一些。专门用于思考、设计、推演的时间可能并不多,但思考是渗透在其它三个阶段中不断进行的,因此总的思考时间并不少。实验中编程的时间应该尽可能短,用更多的时间进行实验数据的分析。写作是常常被中国的研究生忽略的环节,写作的时间要足够长。收集资料,了解别人的工作,找出问题所在,针对性地提出自己的创意,用实验验证自己创意的正确性,总结归纳,撰写论文,发现新的问题,再收集资料,如此反复,这是研究活动的大致流程。 |
怎样做研究(五)
http://ir.hit.edu.cn/~tliu/blog
怎样思考 创新这件事没有固定的套路,如果有,就好像炒股票有了确定的获利方式一样,大家就都能赚钱,都能创新了。我很喜欢岳飞的一句话:“运用之妙,存乎一心”。史书记载:岳飞英勇善战,受到宗泽的赏识和器重。一次宗泽召见岳飞,说:“尔智勇才艺,世良将不能过,然好野战,非万全计。”因向飞传授作战阵图。飞说:“阵而后战,兵法之常,运用之妙,存乎一心。”宗泽听了以后,深为赞赏。搞研究象打战一样,固定的阵法战法也有,但真的想取胜需要“奇兵”,所谓“以正合以奇胜”。怎么出奇,完全靠指挥员的心思一转。
怎样做研究(六)
http://ir.hit.edu.cn/~tliu/blog
怎样做实验 怎样写论文
怎样做研究(七)
http://ir.hit.edu.cn/~tliu/blog 在事业上每10年就是一代人,我们这一代(70年前后出生)是承前启后的一代。我们读书的年代没有互联网,与国际的交往也非常少,听说过ACL/Coling就不错了,都没想过去参加。在这种相对封闭的条件下成长起来的人,要想在一个点上做出国际领先的成果,是非常困难的。博士毕业后,多数人都承接前辈,成为课题组的青年掌门,作为掌门,要管理团队,要跑项目,事务性的工作太多,在点上的钻研不够。台湾苏克毅对于大陆青年学者过多地陷入管理事务深表惋惜,但是国情如此,一时不容易改变。我想我们这一代的使命应该是在老一辈的基础上把国家的科研工作体系进一步完善起来,在“面”上把握住研究方向,带领80年前后出生的一代人走上国际舞台,在他们中间发现优秀的学术人才,为他们创造一切可能的条件,支持他们在“点”上真正做出世界水平的发明创造,成为世界级的优秀学者。 怎样成为优秀的学者 1、 基本功 无论干哪个行当,基本功都是至关重要的,任何令人眼花缭乱的高级技巧都无非是一些基本招式的组合及变型。基本功不扎实,就会常常感到捉襟见肘,按下葫芦起了瓢;相反,如果基本功扎实,则可以左右逢源,不受牵绊,日有所进。做研究的基本功包括数学基础、编程能力、专业基本知识、英文阅读、创新能力、写作能力、英文口头交流能力、组织能力和社会活动能力。我一口气列出了9项能力,而且基本上是按照一个学者成长过程在不同阶段能力需求的先后次序开列的。 刚入门时,有的同学由于是从外专业转到计算机专业来的,因此可以接着课程学习的时间补一补离散数学、概率论、线性代数等方面的数学基础。否则一旦进入了课题,发现有的公式看不懂,再回头看数学书,由于心情急迫,就直接翻到相关章节阅读,又看不懂,发现需要前导知识,于是下决心啃整本数学书,啃了头两张,又觉得进度太慢,心里发慌,如此反复,数学基础就越补越夹生了。因此,一定要在课程学习阶段把相关的数学基础打牢,并不需要记住每个公式,但是基本的概念和原理要非常清楚,进入课题后,如果遇到看不懂的公式,能够很快地查书解决即可。 编程能力必须尽快过关,否则影响科研速度。编程不能抱着一本编程的书,死学其中的样例,而应该积极地从老师或师兄那里领到很小的编程任务,比如文本的预处理,或者一个演示的界面等,有了实际任务,也就有了压力和动力,同时也便于融入研究小组,得到老师和师兄的指点,这样进步会很快。 导师会帮助你选一些对课题有帮助的研究生专业课,这些课程务必要认真学习。由于很多选修课没有考试的压力,我发现学生们学得不够认真,基础没有打牢,进入课题后很多概念不清楚,还需要再学习,耽误了时间。什么是功底,那就是对专业知识的一点一滴的积累,将来进入学术界,别的学者提到一些基本概念如果你都不知道,或者模模糊糊,就贻笑大方了。人生每个阶段应该完成的事尽量要在那个阶段完成,如果欠了账,将来想补,则要偿还三倍、五倍的利息,也未必能够补回来。人到中年,猛回头,发现自己的基础如同蜂窝,到处都是漏洞,这样的材料就注定无法做栋梁了,那时悔之晚矣。 每个人都有一定的英语阅读能力,但是阅读能力的强弱差别很大。阅读能力弱的人读英文好似雾里看花,总觉得隔了一层,似懂非懂,读得很慢,却仍然抓不住重点,读完了,一周不看就忘了,仿佛是没有读过的新文章。阅读能力弱的原因有两个,一个是语言问题,另一个是专业基础知识不足的问题,因此除了多读之外,专业知识的积累对阅读的深入和速度也会有帮助。 创新能力、写作能力,我在前面说的较多,不再赘述。在此谈谈英语口头交际能力。这个能力是在参加国际会议时才会深切地感到它的重要性的。在国际会议上,各个国家的学者操着不同的英语相互交流,你的听说能力更不上就成了一个聋哑人,异常尴尬。和“说”相比,更困难的是“听”,常常出现一个亚裔学生作完报告后听不懂听众提问的情况,我自己也是如此,印度英语、日本英语、爱尔兰英语,我的天,你必须竖起耳朵,运用你全部的语音信号处理能力和背景知识加推理能力才能够懂个大概。开国际会议,中国人常常聚堆,这更障碍了你提供英语能力的机会,应该主动找外国人攀谈,不要估计自己的面子,要不断地挑战自己,走向国际舞台,而不要退缩在一个角落里。现在的研究生比我们那时候得到了更好的英语训练,只要拿出自信来,即使第一次出国,不少学生就已经具备了和外国人直接交流的能力。实际上,外国人和你说上一两句,就能够判断你的英语水平,他们也会根据你的水平调整他的用词和语速,再加上你们的谈话一般限定在特定的技术话题,因此交流的难度已经大大降低了。更深层次的交流是能够了解外国人的文化,进而使谈话范围突破学术,和外国人交上朋友。 有了上面的能力,你可以成为一个合格的“学术单兵”。个人能力强,先做好一个单兵很重要,但随着经验的增长,你开始指导一些本科生或低年级的研究生开展工作了,两三个人就是一个团队,组织能力强的人可以把自己的团队带的生龙活虎,“嗷嗷叫”,反之则团队内产生摩擦,反而降低效率。高年级的研究生毕竟不是老师,没有老师的权威,也不能总通过“打小报告”对自己的“小弟”构成威慑,他应该通过自己的为人、才华吸引低年级的同学,首先得到他们发自内心的尊重,让他们意识到跟随自己能够学到知识,然后再用憧憬、鼓励、恳谈、告诫等管理方法激发他们的热情,带动他们跟随自己一道工作。根据他们的能力和时间合理地安排任务,随时给予指导,并从生活上对他们进行关心,和他们成为朋友。 要成为大学者,必须在学术界,以及相关的企业界、政界建立自己的人脉,从而有机会整合更大的资源,做出更大的事业,因此社会活动能力对于大学者是必不可少的。综合型的人才跨国个人学术原始积累阶段后,会成为学术组织者,此时他们的社交才能会得到充分的发挥。 2、 学术诚信 我个人是很赞成学术打假的,今天的学术界越来越受到商业的影响,虚的东西太多,需要有“方舟子”这样的人,震慑那些造假蒙事的所谓学者。 作为研究生,要严格避免做犯以下错误:抄袭(包括在文章中混淆自己和他人的工作);一稿多投(包括一篇文章略加修改就另投他刊);编数据,刻意裁减数据,或改数据。我的邻居原是一个学院的副院长,他在编教材时被指整页抄袭了别人的书,受到原著者的追究和学校领导的批评,书生心窄,很快得了肺癌去世了。还有一位同学,把一篇英文论文的主要内容翻译过来,作为其论文的部分内容投往了国内一家重要期刊,结果被该刊物认为是剽窃,申辩无效,她受到学校的通报批评。在治学问题上,不能存在丝毫的侥幸心理,否则后果非常严重,不但个人学术前程被阻断,也使导师和你所在的研究机构蒙羞。 也不要做自吹自擂,比如:在文章中说自己“第一个提出了某某方法”;不要打击同行,对同行的工作要客观而委婉地评价,绝不能不负责任地随意针砭;不要没参与工作,随便挂名。 3、学术勇气与耐力 年轻人一定要有学术勇气,敢想敢干,绝不能墨守成规,绝不能迷信权威。权威往往受到已有成见的束缚,他们忙于社会活动,不在研究第一线,他们的观点未必正确。因此,如果你得到了与权威不同的结论,并确信是正确的,要敢于坚持,当仁不让于师。 学术界有很强的马太效应,喜欢锦上添花,不喜欢雪中送炭。在你没有被业内认可以前,你的能力和成绩很可能会超过你获得的回报,在怀才不遇之际,个别学者会踏上脱离学术圈开展独立研究的道路,窃以为不可,要做大事,需要耐住寂寞,脚踏实地地工作,学会与人合作和交往,迟早破壳而出。 4、进入科学共同体 在你具备了一定的基础后,可以通过发表论文,参加会议的方式进入学术界(科学共同体),这叫做入行了,出道了。在会议上宣读论文,听完别人的报告后当众提问或提出建议,在会间休息时主动结识知名学者,多多结交同龄的研究生和青年学者等等,都是进入“圈子”的途径。在公众场合,既要虚心地向成了名的“剑客”“侠客”们请教,又不必卑躬屈膝,令人生厌。“弱国无外交”,提高自身的研究水平是本,学术交往是末,你自己的工作做得出色,别人也乐于和你交往,反之,自己的工作稀松平常,得不到专家们的认可,只知交往,适得其反。 5、满怀研究乐趣 世界上有一种职业,别人花钱让你做你喜欢的事情,那就是“研究”。经常有激动人心的发现,充分表现自我,其中的乐趣“如人饮水,冷暖自知”。 科学家静心从事研究工作时发出阿尔法脑电波,据说和僧人入静时发出的脑电波是一样的,对人的身心健康很有好处,因此很多学者非常长寿,中文信息学会的创始人钱伟长先生今年97岁,用他的名字设立的首届“钱伟长奖”颁给了92岁的“亚伟速录机”的发明人唐亚伟先生。 如果你喜欢旅游,那么更要从事科学研究了,学术会议常常在风景如画的地方举行,阳光沙滩海浪,学者们在阳伞下轻松交谈,没有政界的险恶,没有商场的喧嚣,何等惬意。学者自然不如企业家富有,失去一些财富,换来的是自由。 今天是初九了,我的春节假日彻底结束,啰里啰唆,匆匆忙忙地了这许多文字,能够读到此处的读者一定很辛苦了,希望其中的一两个观点能够对您有所帮助。 (完) |
[转帖]怎样做研究(刘挺)相关推荐
- 怎样做研究(转载哈工大刘挺教授博客内容)
几年前,我写了一套胶片,题目是<怎样做研究>,多次在实验室内部给学生们做报告,也曾对外讲过一次,听众反应良好.也有网友读过这套胶片,给我来信称有所收获.然而,胶片中的文字毕竟只是提纲携领, ...
- 怎样做研究(一) 刘挺
几年前,我写了一套胶片,题目是<怎样做研究>,多次在实验室内部给学生们做报告,也曾对外讲过一次,听众反应良好.也有网友读过这套胶片,给我来信称有所收获.然而,胶片中的文字毕竟只是提纲携领, ...
- 怎样做研究(五) 刘挺
怎样思考 1.把问题定义清楚 有的同学做了很长时间的课题,还没有把问题定义清楚.以自动文摘问题,好像就是把一篇文章中的核心内容提取出来吗,还怎么定义,其实不然.文章是什么样的文章?议论文.记叙文.还是 ...
- 怎样做研究(七) 刘挺
在事业上每10年就是一代人,我们这一代(70年前后出生)是承前启后的一代.我们读书的年代没有互联网,与国际的交往也非常少,听说过ACL/Coling就不错了,都没想过去参加.在这种相对封闭的条件下成长 ...
- 建校百年,哈工大计算机学部成立!NLP专家刘挺挑大梁
新智元报道 来源:哈尔滨工业大学 编辑:梦佳.永上 [新智元导读]近日,哈尔滨工业大学响应国家新基建的号召成立计算学部,将大力发展计算机学科群.2019QS世界大学计算机H指数排名,哈尔滨工业 ...
- MLNLP顶会论文发表总榜:谷歌最狂,清北入前十,周明、张岳、刘挺华人前三...
中美差距何止一丁点! 作者 | 丛末.蒋宝尚 编辑 | 贾伟 伦敦帝国理工学院机器学习和自然语言处理著名学者Marek Rei 教授从2016年起,每年都会对ML&NLP相关的会议论文进行统计 ...
- 在计算机领域做研究的一些想法-- 转载
本文关于米国CS计算机的介绍实在是太可爱了,不得不收藏,感谢 Xi Tan # 前言 # 1. 讨论一下计算机领域的牛圈和'带头大哥': 2. 讨论一下科研方法: 3. 讨论一下计算机领域的学术论文( ...
- 刘挺 | 从知识图谱到事理图谱
本文转载自 AI科技评论. 在"知识图谱预见社交媒体"的技术分论坛上,哈尔滨工业大学刘挺教授做了题为"从知识图谱到事理图谱"的精彩报告.会后AI科技评论征得刘挺 ...
- 在计算机领域做研究的一些想法
come from:http://blog.csdn.net/chl033/article/details/4795649 本文关于米国CS计算机的介绍实在是太可爱了,不得不收藏,感谢 Xi Tan ...
最新文章
- mysql更新数据 update格式和alter对比
- 【性能优化】 之 10053 事件
- Gradle学习目录
- 时任上海来伊份互联网事业群总裁王戈钧 :传统企业(线上+线下)移动互联网改造...
- poj2942(双联通分量,交叉染色判二分图)
- php 几个比较实用的函数
- JSP提交中文乱码的解决
- select学习小demo--实现网页换肤
- 如何正确预防网页中的5种“隐形杀手”
- 软件项目开发文档 模板
- iptable 帮助
- 阿里巴巴矢量图引入步骤
- 计算机无纸化考试官网,我校《计算机与互联网》课程无纸化考试取得圆满成功...
- 1144C C. Two Shuffled Sequences(优先队列和set的应用)
- 删除文件夹出现0x80070091错误提示目录不是空的
- Gitee代码提交 自用
- 如何让图片保持原比例,占满整个盒子
- win10升级win11操作
- 管理规划:目标是什么?
- Android 学习论坛博客及网站推荐
热门文章
- Java第五章课堂总结
- java连接informix数据库
- 日本咖啡馆推出AR体验,在三次元邂逅初音未来
- Norton PartitionMagic 8.0 Resizing Boot Partition
- 网址导航类的网站为什么会没落
- 红外玩法 GPRS手机拨号上网DIY
- 问题:关于信贷催收业绩指标之一:递延率flow through%的计算,考虑回冲金额后的修正公式
- 使用统计学分析《鱿鱼游戏》中“玻璃垫脚石”的生存概率
- c语言平均绩点_C语言 - ACM题目:平均绩点
- matlab旋转机械转子故障信号仿真,二叉树支持向量机的旋转机械故障诊断