三遍阅读法,高效研读学术论文

怎么读学术论文是一个老话题。

每一位硕士研究生和博士研究生,其实都无法绕着这个门槛:如何快速高效地阅读学术论文?

事实上,有许许多多的鸡汤、指南、和学界大咖,都分享过林林种种不同的秘籍、策略和办法。

不过,这篇十七年前发表在《计算机通信评论》(ACM SIGCOMM Computer Communication Review)上的论文《如何阅读一篇学术论文》(How to Read a Paper)堪称经典。

这篇文章的作者是S. Keshav 来自加拿大滑铁卢大学(University of Waterloo)David R. Cheriton计算机科学学院(David R. Cheriton School of Computer Science)。

在这篇文章中,S. Keshav 提出了“三遍阅读法”(The Three Passes Approach)。

S. Keshav 建议,我们应该分最多三次阅读完一篇论文,而不是从头到尾连续读完。

而三遍阅读,每一遍阅读都有特定的目的,并在之前的阅读基础上进一步深入:

第一遍阅读,让我们对论文有个大致的认识;

第二遍阅读,让我们掌握论文的主要内容,但不深入细节;

第三遍阅读,则帮我们深入理解论文的深层内容。

斑胸草雀  Photo by Margaret Strickland

第一遍阅读:快速概览

通常需要五到十分钟,主要包括以下几个步骤:

1. 仔细阅读标题、摘要和引言部分

2. 浏览章节和小节的标题,但暂时忽略正文内容

3. 阅读结论部分

4. 浏览参考文献,标记已经阅读过的部分

在完成第一遍阅读(the first pass)之后,你应能够解答5个C问题:

1. 类型(Category):这篇论文属于哪种类型?是测量研究、现有系统分析,还是研究原型的描述?

2. 背景(Context):这篇论文与哪些论文相关联?用哪些理论基础来分析问题?

3. 正确性(Correctness):论文的假设是否合理?

4. 贡献(Contributions):这篇论文的主要贡献到底有哪些?

5. 清晰度(Clarity):这篇论文是否写得清晰明了通顺易懂?

第二遍阅读:再度领会

有些文章,第一遍读完,读者就放弃了,就不会再读第二遍了。

对于一般读者是这样,对于审稿员来说,也是如此。

作为学术人员,一篇学术论文,如果在第一遍之后,依旧值得我们再花时间去读,应该是比较切近我们的兴趣和研究课题了。

为此,S. Keshav建议,在第二遍阅读的时候,我们可以在第一遍阅读的基础上,更细致地研究这篇论文,一边阅读一边记录重点,甚至在页边作注释。

1、仔细审视论文中的图表、示意图和其他插图。特别是图形,要检查它们是否标注清晰。坐标轴是否标记得当?结果是否附有误差范围,以确保结论的统计意义?这些常见的错误会帮你区分仓促的工作和真正优秀的研究。

2、记得标记那些还没读过的相关参考文献,以便深入了解论文的背景知识。

S. Keshav建议,第二遍阅读大约需要一个小时。

在第二遍阅读完成之后,我们应该能够理解这篇论文的整体内容,并能够向他人简要介绍这篇论文的主旨和支撑证据。

在第二遍阅读之后,我们可能依旧无法很好地理解这篇论文,为此,作者建议我们可以采取三种策略:

1. 把这篇论文放在一边,希望在职业生涯中不必理解它就能成功;

2. 稍后再读,可能是在我们阅读了一些背景资料之后;或者

3. 坚持下去,继续进行第三遍阅读。

第三遍阅读:深度剖析

要彻底理解一篇论文,尤其是作为审稿人,就需要进行第三遍阅读。

这一遍的核心是尝试几乎从头再实现论文的内容:即,基于作者的假设,重新构建他们的工作(virtually reimplement)。

这也就是我通常所说的“换位思考”,“把我们的脚放到作者的鞋子里”。

通过这样的重构与原论文的对比,我们不仅能够较为轻松地识别出这篇论文的创新之处,还能发现其潜在的缺陷和假设。

S. Keshav认为,对于初学者来说,这第三遍阅读可能需要四到五个小时,而对于经验丰富的读者来说,大约只需一个小时。

在这篇文章的最后,S. Keshav还给出了运用“三遍阅读法”研读学术论文的建议。他主张:

首先,利用 Google Scholar 或 CiteSeer 这样的学术搜索引擎,并结合一些恰当的关键词,寻找该领域中的三到五篇最新(recent)论文。

对每篇论文进行快速概览,以把握其主要内容,然后,细读它们的“相关工作”部分。在这里,你可以找到近期工作的简要总结,如果幸运的话,甚至可能发现最新综述论文的线索。

如果找到了这样的综述,那么恭喜你,任务已完成。

其次,如果没有找到综述,那么,第二步就是在这些论文的参考文献中寻找共同引用的文献和重复出现的作者名字。

它们是该领域内的核心文献,这些作者也是这个领域的核心研究人员。

下载这些核心文献,并且关注这些主要研究者的网站,看看他们最近发表在哪些地方。

这有助于我们识别该领域的顶尖会议,因为顶尖的研究者通常会在这些会议上发表他们的成果。

第三步是访问这些顶级会议的网站,浏览它们最近的会议记录。

通过快速浏览,我们通常可以找到近期的高质量相关研究。这些论文,加上之前我们挑选的论文,共同构成了我们的调研初稿。

对这些论文进行再次细读。如果发现它们都引用了一篇我们此前未曾发现的核心文献,那么,获取并阅读这篇论文,必要时再重复这一个过程。

其实,S. Keshav 的三遍阅读法,对于我们而言,可能是我们很多人都自觉不自觉地使用的方法。

一篇学术论文,我们未必读完三遍。

第一遍读完,也许觉得借鉴意义不大,我们可能就不再去读了。

而第二遍阅读之后,也许就放弃了。

读完三遍的学术论文,基本上应该是我们的核心文献了。

http://ccr.sigcomm.org/online/files/p83-keshavA.pdf

一组参考文献:
[1] T. Roscoe, Writing Reviews for Systems Conferences,http://people.inf.ethz.ch/troscoe/pubs/review-writing.pdf. 

[2] H. Schulzrinne,  Writing Technical Articles,http://www.cs.columbia.edu/hgs/etc/writing-style.html. 

[3] G.M. Whitesides, Whitesides’ Group: Writing a Paper,http://www.che.iitm.ac.in/misc/dd/writepaper.pdf. 

[4] ACM SIGCOMM Computer Communication Review Online,http://www.sigcomm.org/ccr/drupal/.