研究人员的圣经(上)

作者︰Alan Bundy,Ben du Bulay,Jim Howe和Gordon Plotkin

版本︰1993年10月11日

译者︰柳泉波  北京师范大学讯息学院2000级博士生

 摘要

获得硕士或者博士学位[1]是很难的工作,本文档对此给出了全方位的建议。第一节描述了问题──什么是论文?第二部分陈述了毕业论文获得透过的正式要求。三、四节描述了在此过程中学生可能遇到的种种障碍。五、六节对选题和项目实施给出了建议。七、八和九节关注的是阅读和写作。十节描述了学问的评审过程,并就如何应对给出了参考意见。最后,十一节给出了接收人工智能方面投稿的期刊列表。

 1  什么是毕业论文?

 要获得博士或者硕士学位,你必须完成一篇毕业论文并透过口头答辩(人工智能系的研究生无需笔试[2])。在口头答辩中,一般问及的都是要求对论文中的某些问题进行澄清,所以最主要的评价依据就是毕业论文。

合格毕业论文(至少是Edinburgh大学认为合格的)的定义,可参看校历中有关研究生学习的部分︰3.2.6和3.2.7。摘录如下︰

博士论文  博士学位的基础要求是︰

i. 博士申请人必须透过论文的表达以及在答辩中的表现证明他可以从事所在领域的原始创新研究,能够将特定的研究项目与本领域的知识体系结合起来,能够一种严谨而学术的模式表达自己的研究结果。

ii. 毕业论文必须包括原始创新的工作,这些工作对本研究领域的知识以及理解作出了明显的贡献,毕业论文包含值得出版的材料;论文显示出作者对本领域知识以及相关文献充分地掌握;论文显示出作者能对自己的工作和本领域其它学人的工作进行严谨的判断;论文体现出来的工作能够在三年的研究生学习和研究期间完成;文字表达合格,参考文献充分而适当,具备可理解的内在架构,本领域的其它学人可以明白论文中提出的目的、背景、方法和结论。

iii. 毕业论文的篇幅原则上不能超过100,000单词。但如果由导师建议,委员会认定篇幅的扩展确实属于处理论文主题所必须的,篇幅可适当扩大。

[1] 译者注︰在英国,硕士学位包括以下几种。

MA︰Master of

Arts,文科硕士,如果您学习语言、商业等专业一般获得的硕士学位都是MA; 

Msc︰Master of Science, 理科硕士,如果您学习的是理科专业,一般获得的都是Msc;

PgDip︰Postgraduate Diploma, 研究生学习阶段叫做Postgraduate,它包括硕士阶段和博士阶段两个阶段,与之相对应的是Undergraduate(本科阶段),PgDip可以等同于国内的硕士研究生毕业(但没有硕士学位),您也可以理解为硕士预科; 

MPhil︰Master of Philosophy,研究式硕士学位(也可以叫做哲学硕士),它更多的侧重点是为了学生日后攻读博士学位,理论性更强;

PH.D: Doctorate of Philosophy,哲学博士。不论您攻读何种专业的博士学位,一般获得的都是该学位。

本文中的硕士和博士分别指的是M.Phil和Ph.D.。

[2] 译者注︰在国外的某些大学,研究生要毕业,除了完成一到两篇毕业论文外,还必须透过口头答辩和一项笔试。

硕士论文  硕士论文的基本要求是︰

i. 申请人透过论文的表达和书面/口头的答辩,表明自己已经获得并理解了本领域的先进知识,能够将对特定论题的知识与更广范围的研究联系起来,能够用严谨而学术的模式表达知识。

ii. 论文必须是申请人所从事研究的合格记录组成的原始工作或者对本领域知识的合格而严谨的调查研究。论文显示出申请人有能力运用合适的研究方法,具备足够的领域知识。论文所采用的方法或者陈述是独立完成的。文献陈述是合格的,包括适当的引用。

iii. 论文的篇幅不能超过60,000单词,6.1部分说明的情况例外,或者由导师建议,委员会认定篇幅的扩展确实属于处理论文主题所必须的,篇幅可适当扩大。

博士研究的创新性和意义需要有多大?“所包含材料都是值得表达的”就是一种简单的判断规则。将论文的精华提取出来,就是一篇可在期刊上发表的论文。当然,并没有一定的标准,最后的决定取决于答辩委员会的成员。

硕士论文的定义所包含的有用讯息更少。在人工智能系,我们并不需要笔试。很多硕士论文是研究的记录而不是严谨的调查,当然,后者也可以。同样,将硕士论文的精华提取出来,也应该是一篇短论文。但是不应该要求可发表在期刊上,系里的Working

Paper就可以了。

如果你还不了解期刊论文或者Working

paper的标准──赶快读一些﹗同时还要读一些毕业论文。不要被美国大学的毕业论文吓倒,他们的学生要花五到六年的时间学习,而我们英国一般是三到四年。

2  研究阶段学习的程序

在爱丁堡大学,全日制博士生至少要学习33个月,非全日制学生至少要45个月,对于硕士,全日制学生最少要21个月,非全日制学生至少要33个月。在此期间,学生一般要住在爱丁堡。一般要求三年完成博士学业,两年完成硕士学业。学生资格只在此期间有效。博士的最长学习期限是五年,硕士是四年。

过去,人工智能专业的研究生很少能在规定期限内提交自己的论文。为了减少所花费的时间,每个学生的研究工作将按照系里通知16号所描述的模式组织,通知里列出了每一阶段研究生应该达到的要求。这些要求不时地会有一些细微的调整,因此本文没有将之包含在内。

3  研究生的常见问题

 对于第一次做研究的人来说,研究过程中充满了陷阱。了解这些,有助于避开这些陷阱。

 3.1  解决大问题

 很多学生的选题太大了,特别是人工智能专业的学生。要知道很多对人类来说是很容易的东西,对模型来说却是太难了。很显然,帮助你选择合适论文题目的责任落在你的导师肩上。此外,你还要阅读文献,跟同行们交流,弄明白最新进展是什么。论文的“进一步的工作”部分是产生思路的绝佳来源。阅读文献要严谨。重新完成原先不成功的工作,也是选题的一个来源。

 3.2  天上掉馅饼

 选好题后,下一步做什么?在屋子里正襟危坐,手持笔和纸,期待好的思路从天而降,这显然是不现实的。你应该做的是︰

a) 阅读文献,而且要带着问题读,例如,里面是不是包含着错误,我应如何利用这篇文献,等等。

b) 多跟其它人交谈,别一个人闷头傻做。不要觉得自己的思路太丢人了,别人也聪明不到哪儿去。

c) 先尝试所选题目的简化问题。

d) 以工作论文的形式写下自己的思路。想象自己正在向别人解释自己的思想。你会惊奇地发现原先不甚清楚的思路成型了,缺陷也显露出来了。

e) 向一个小组报告你的思路,效果同上。

  3.3  整日沈溺于计算器中

 计算器是非常吸引人的。一个计算器痴能花数年的时间去调试程序,调整输入/输出例程。当BUG被清除或者输出很漂亮时,计算器痴人们会有一种成就感。这是虚幻的﹗作为一名研究者,你的程序必须在比代码更高的级别上具备解释性,这样才能为领域知识作出真正的贡献。在上机实现之前,先从理论上规划好程序。如果有些部分必须经过上机验证,验证完了后要迅速离开计算器,并继续从理论上进行设计。如果你觉得这样太难了,尝试向其它朋友,以论文的模式或者在研讨会上描述其工作原理。如果人们没办法明白,那就是你的问题──要加油啊。

 3.4  自创一门语言

 另外一种“沈溺于计算器中”的表现是想自己写一门计算器程序设计语言。不错,现有的语言肯定不能完全满足你的要求,但这并不成为自创一门语言的理由。你总是能找到合适的替代品,恰好满足你的要求。要编写有用的新语言,不仅需要对AI具有百科全书式的了解,还要有系统程序设计的经验。没有人会使用你写的语言──甚至你也不会﹗你的全部精力将花在语言的设计上,自己的项目倒忘得一干二净了。如果你确实觉得现有的语言不能满足要求,就此写一篇论文,详细阐述该语言的缺陷。如果你的意见确实有道理,对现有语言的增强一夜之间就会出现。

 3.5  空想主义

收集实验数据的过程充满乐趣,有可能出现各种现象。要确保自己知道想根据实验得到什么样的结果。

a) 向别人解释你认为试验将会表现出什么结果。

b) 假设试验已经做完,数据就绪了,你想用它来做什么?

c) 不仅要先在一两个人身上做试验,而且要分析。别梦想试验自动会呈现出什么东西。

  3.6  象牙塔

 独立思考是好事,但如果完全与他人封闭就是错误的。只有保持联系才能了解本领域的最新进展。跟别人聊聊他们的研究。有选择地参加讨论会和报告会。每周花些时间来读评论、摘要和选出的论文。

3.7  无人理解的天才

很容易以为别人不理解你的研究的原因是因为你是个天才,别人都是草包。实际上还有其它的可能:偏爱行话。人工智能领域充斥着很多行话︰尝试用普通英文将自己的思路表达出来;尝试用别人的行话重新表达你的思路。试试看,效果是不是不一样了? 如果我能做,那肯定是微不足道的。一旦找到了问题的解决方案,就会觉得微不足道。然后想︰这太容易了,我再试试别的吧。这可是没完没了的﹗你的解决方法对别人而言可不是微不足道(可能是错误的或者过于复杂了),并可以作为进一步工作的基础。座右铭︰先做容易的,然后逐渐加大难度。 喜欢玩复杂。写个复杂的程序并不是什么美德,相反挺让人烦的。用最简单的模式做事情。Occam原则在这里是完全适用的。

3.8  迷失在抽象中

为了体现价值,你的研究工作必须是为了理解智能的某些属性,例如,搜索的控制,知识表示和学习。但是要想取得成功,就必须在具体的情境下抓住抽象的属性,也就是说你必须构建程序来尝试搜索的控制,知识的表示以及学习到的知识。想在抽象中把握问题,只会一事无成,最终失败。

3.9  目标过高,一事无成

对最终结果有很高的标准是很正确的,但如果一开始就设置高目标就不大现实,很有可能根本开始不了。先做简单的事情,然后再应用你的高标准,使之逐渐精炼为有价值的成果。

3.10  方法学并不成为一篇论文

由于人工智能是相对比较年轻的学科,因此从某种意义上讲,其本质上属于交叉学科。人工智能还没有一个普遍接受的研究框架,或者是定义良好的方法学。作为一名人工智能专业的学生,你所面临的的一个困难就是如何形成适合于所研究问题的研究方法。在形成合适的方法学之前,会遇到很多其它的方法学或者哲学观点,其中很多是令人难以容忍的或者容易引起误导的。然而,你会发现这些观点的支持者大有人在,或许就坐在你的邻桌。因此,方法学的形成往往都是在与同行的激烈交锋中形成的。在这种斗争中,你逐渐形成了对人工智能以及相关哲学问题的世界观,体现下你阅读文献,参加研讨会以及其它工作中。在以后的岁月中,这将成为你所信奉的准则,只是偶有些微的改变。但是,当你开始写毕业论文时,或许会感到需要对自己的生活哲学进行扩展。要克制自己──答辩委员会的委员们可不一定全跟你志同道合。对自己所持方法论的假设作简要的总结,对于适当的论点或者框架应给与引用,将自己方法论观点的表达限制在确实有助于理解论文的主旨的范围之内。如果你的观点过于激进,你就可能需要五十页的篇幅来进行阐述,而且总是不那么令人信服。

3.11  发现的过程并不成为理由

在项目实施的过程中,会逐渐对技术问题形成某些看法,有些是新奇的,大多数则是已有概念的复述(或者新的理解)。在论文的描述中,要牢记︰支持某个观点、技术的理由,与你是如何相信该观点的过程是不同。读者或答辩委员会的成员很少对后者感兴趣──他们感兴趣的是支持观点的一般论证。如果你开始信服某个观点,很容易认为自己发现的过程就是最好的理由。此时需要你冷静下来,然后对论点给出合理的阐述,特别当你的观点与他人的信仰冲突的时候。

4  心理障碍

如同创作小说、编写戏剧或者绘画这样的创造性劳动一样,从事研究也会碰到心理问题。

 

4.1  心态

 

一名研究人员所需要的技能之一就是正确地对待自己的工作。保持心态的一个重要原素是对所做工作的信念。要有一点自豪感﹗相信自己探讨的问题是重要的,你对问题的解决作出了显著的贡献。否则的话,怎么会有动力伴随你度过漫漫研究之路?获得自信的第一步是选择自己相信的研究题目(详见小节5)。当然,也不能因此目空一切,听不进去任何批评。要做好一旦发现自己的思路有错立马改正的准备。

 

4.2  研究中的萎靡不振[1]

 

缺乏研究上的成功,会让研究者觉得萎靡不振,其实这完全是自我暗示的结果。对自身能力的怀疑,会将自己置身于危险的境地︰取得研究成果所需的投入和热情消失得无影无踪。摆脱这种境况的方法是认识到研究能力并非依靠某种神秘的存在,它是可以后天习得的技能。按照这本小册子所说的去做,你也可以做原始创新的研究。

 

4.3  应对批评

 

接受批评总是很难的,但这不等于就要对批评置之不理。如果想在研究上取得进步,就必须学会征求批评并认真思考,必须学会区分有用和无用的批评。如果自己实在区分不出来,请朋友帮忙出出主意。如果批评是不合理的,或许是由于误解了你的解释,你能对此作出改进吗?

你必须学会承受某些打击︰投给期刊的论文被拒绝;被怀疑时的痛苦。此时,要学会微笑面对,不要轻言放弃──君不见,多少著名科学家曾经忍受过难以承受的指责和批评。实际上,有些时候批评和指责的出现完全是因为个人之间的矛盾──每一位科学家都想胜过别人一头。你要把这当作对你的全面考验。

 

4.4  清晨──冷静地开始

[1] 原文本小段涉及较多与性生活的模拟,考虑到中国国情,进行了改写,并力求不失原意。

 

几乎所有的人都发现,很难沉下心来开始每天的工作。但一旦开始了,一切就正常了。解决的方法有两个︰

1. 坚持有规律的工作时间,不一定是朝九晚五,但每天必须有一个固定的开工时间。否则,你会发现自己被没完没了的家务琐事缠身。

2. 先做一些吸引人的工作。例如,别一上来就写比较难的部分,可先处理对你来说是小菜的事情或者画个图表什么的。

 

4.5  定理癖

 

如果所选择的领域尚无好的研究方法学,你肯定渴望自己创建一个。对于数学家来说,这种渴望就是要证明定理──定理癖。对于工程师来说,就是不停地试来试去。小心﹗只有那些确实与你的研究相关的定理才是需要证明的。例如,证明某个过程的结果,如果该过程对所做的研究有帮助就是相关的,否则就是不相关的──没什么必要去证明。

 

4.6  惧怕曝光

 

有了很好的想法后,需要透过定理证明,编写程序或者解释给朋友听等方法来检验它。但是,有时候不知为什么你停滞不前了,你发现很难开始着手相应的工作。想想看,是不是由于潜意识中对自己的想法可能毫无价值的恐惧所致。艰苦的经验告诉你,问题的解决方法总是在午夜不期而至,黎明时分又消失得无影无踪。拿出点勇气来﹗研究就是这个样子,向前了十步,又后退了九步。越早地用实验检验自己的想法,就能更早地发现其中的不足和问题。

 

5  选择研究项目

 

所选择研究项目必须满足如下的标准︰

1) 渴望做。

2) 待解决的问题够博士研究水平。

3) 必须是最新的,也就是说三年内都可做。

4) 系里有人愿意指导你。

 

其中第一条的重要性无论怎么估计都不过分。你需要倾尽自己所有的热情,以便在艰难、孤独且不规范的研究过程中保持动力。选择那些你认为最重要的问题进行研究,选择那些可利用你所擅长的技能的领域,例如,对于数学家来说,具备数学推理的能力,对于语言学家来说,对自然语言的了解。选择那些全新的领域时要小心,很快你就发现自己亟需去学习最基础的东西。

选择好感兴趣的领域或问题后,接下来必须寻找有关的项目。这就是需要导师发挥作用的地方了。在系里从事本领域研究的老师中找一位做导师。他或许可以提供一些项目供你参考,还可以从价值和可行性两方面对你的设想给出意见。总的来说,刚从事研究研究的学生总是低估项目的价值,高估项目的可行性──即使看起来相当成熟的项目实施起来也是困难多多。所以要认真听取导师的意见,不要选题过大。

请导师建议一些阅读材料。你可以从论文和毕业论文的“进一步的工作”部分找到合适的项目。继续研究别人遗留下的问题是一种很好的研究方法,找一些你觉得做的差劲之极的工作,按照自己认为正确的思路重做一遍。或许你可以简化对方的程序,跟别人的工作联系起来,或者自己开发一个更强大的程序。

要有很多欲待蓬勃而出的想法,并构建研究目标的层次架构。这不仅形成了工作的框架架构,而且在发现(不可避免地)已经有人尝试过更深层次的问题时,可以充当保护网[1]。

项目必须避免下列可能导致“坏的”研究的各种情况︰研究解决的问题无关轻重,研究没有建立在前人工作的基础上。

 

6  研究方法论

 

你必须从众多的研究方法中选一个。很多人开始时会尝试不同的方法,但最终会集成为一种。例如,你或许会首先分析人类绩效的某些方面,然后用他人理论来说明;或许你会理智地重建他人的理论,并寻找出其中的优缺点。“理智的重建”方法总是富有成效的,这也是由于一种令人遗憾的情况经常存在︰在发表的论文中,往往对工作是如何实现的以及性能怎么样涉及较多,而对假设和原则的描述则寥寥无几。但是,不管怎么样,首先要寻找一种理论。

下面是方法论的一个例子(由AB提供)。

 

6.1  阶段1

 

想象下面这种情形──用所设计程序的输出表明该程序具备建模能力,又如在数学推理中的证明,自然语言中的实例对话以及在视觉领域中的情景识别等。

 

6.2  阶段2

 

什么样的理论假设有助于处理上述情形,将该理论假设可能包括的过程和数据架构大体描述出来。要尽量一般性的考虑问题。将所遇到的问题视为一般问题的特例。若非确实与要解决的问题相关,不要使用特殊的处理方法,如果可能,要尽量使用已有的人工智能方法。证明某个问题可用已有的方法解决也是科研成就。

 

6.3  阶段3

 

考虑进一步的情况,看看自己规划的解决程序能否处理上述假设,根据假设对解决程序进行约束,泛化,扩展以及调试。

 

6.4  阶段4

 

如果觉得自己的解决程序已经足够可靠了,选择一门合适的程序设计语言实现该程序,并根据阶段1-3进行调试。

 

6.5  阶段5

 

在一些以前没有考虑到的实例上营运程序。修改自己的程序直到它已经足够健壮──也就是说程序可在很多实例上营运,并且每次有新的输入时并不会可耻的崩溃。

[1] 译者注︰依我的体会,这段话的意思,只有形成自己的整体思路,才能更好的完成研究。而且,在你的部分工作与他人的工作相似,甚至远远不如时,亦可以用自己的研究思路来进行解释。

 

6.6  阶段6

 

透过营运于某些实例上,对你的程序进行评价。对成功/失败的次数进行统计,并分析每一次失败的原因,并将所有的发现下论文中描述出来。

 

6.7  阶段7

 

用与特定实现无关的语言描述你的程序。尝试是否能够引出什么新技术,并与本领域以前的技术进行比较。如果时间允许的话,还应该将你的新技术应用于其它领域。

注意︰阶段4和5所花费时间远超出你的想象──以年计──所以要保留足够的时间。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,736评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,167评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,442评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,902评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,302评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,573评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,847评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,562评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,260评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,531评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,021评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,367评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,016评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,068评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,827评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,610评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,514评论 2 269

推荐阅读更多精彩内容