计算机科学论文写作2-搜寻、阅读和引用文献
本教程来自于《Scientific Writing for Computer Science Students》。
一、参考文献的需求
在科学写作中,我们会使用大量的引用!
所有的文字必须被证明,不论是基于之前的研究还是你自己的结果。
必须要明白是基于什么信息上的!(个人:也就是常见的“基于xxx的”,这里的xxx需要搞清楚,搞明白,就是论文的基石)。
通常来说,整个的硕士论文是基于现有的文献的综合性研究。论文中包含的信息可以从一个新的观点上进行分析和组织得到。
科学写作的来源必须具有科学性!
二、来源类型
文献的来源可以被划分成三组:
1、主要来源:会议和期刊中的文章
这是最初的来源;而且已经发表在期刊/会议上的论文可信(即,审稿人已经检查过其中的正确性!)
还有技术报告和学业论文
2、次要来源:教科书、百科全书、术语表
有时候它们是包含着有用的分析或者解释,不过不是最初的来源
你可以在硕士论文中使用它们,不过只能作为补充材料;通常包含着有用的文献索引(通常在“”bibliographical notes“的下面)
3、参考书目
它可以支持信息的索引;也是文章和参考文献的列表;可以用搜索引擎来搜寻在线的参考书目
ps:你信任你在维基上找到的信息吗?为什么?为什么维基不能作为科学文献中的参考来源?
三、收集文献
起始点:你的主要的观点,即 目标;中心概念、原理和主题。
1、如何继续?
从相似的笔记、教科书开始;询问你的上级;从有用的论文和书本中寻找参考;在科学书目中或者电子图书馆中使用关键字搜索(比如:ACM、IEEE、Elsevier、Springer);如果你在网上询问,应该首先使用google学术,检查那些已经发表的论文;记下这些参考信息-它们在后期可能会很难被找到(特别记得存储这些bibtex文件)。
任务(作业);
1、实际使用这些最重要的计算机科学的数字图书馆:ACM、IEEE、Springer。从每个图书馆中至少找到一篇有关贝叶斯网络的文章。
2、假如你只知道作者和文章的名字,但是没有任何其他出版的信息,你怎么找到这篇文章?
3、试着找到下面的文章并写出他们的完整的参考条目(作者,标题,页数,出版地,出版者,年份):
– Cover and Van Campenhout: On the possible orderings in the measurement selection problem.
– ”T. Winters and T. Payne: What do students know? An outcomesbased assessment system.
– Dash and Cooper: Model Averaging for Prediction with Discrete Bayesian Networks.
– Aggarwal et al.: On the surprising behavior of distance metrics in high dimensional space, LNCS 1973.
– A.K. Dey and G.D. Abowd: Towards a better understanding of context and context-awareness.
– B. du Boulay: Can We Learn from ITSs?
四、阅读
你不需要通读所有的东西!只需要读那些你需要的就够了:1、识别这个文章的有用程度;2、得到有用的信息。
通常会有一个迭代的过程:重要的文章需要多读好几遍!
1、标题和摘要;2、扫描引言和结论/总结;3、检查参考文献:新的好的参考文献;4、重要的或者有用的章节极其子章节(整篇文章的组织结构通常和izai引言中给出);5、开始的时候不要陷入于细节之中,不要去检查独立的单词或者他的参考来源:相信文中所说的;6、如果这篇文章很重要,那么就试着正确的理解他,并检查其引用的来源
通常你需要问你自己:文章的中心思想是什么?;文章的贡献是什么(新的还是有趣的东西)?;你觉得对你而言重要的是什么?在文中的什么地方展现出来了?
如果你不理解这篇文章:试着自己发明一些例子或者模仿其中的解决过程;询问你的同辈,上级,专家等;对你自己或者其他人询问的时候使用具体的问题:这个式子来自哪里?这些算法之间的关系是什么?你能为这个定义举个例子吗?等等。通常理解性的时刻(就是:哦,我懂了,这种时候)发生在处理文章背景的时候!
五、参考文献
1、文本中的参考文献位置
参考文献的位置通常是在引用的原理,算法,作者等后面,是紧贴着的。
”According to Dijkstra [Dij68] goto statement should be avoided…”
”Bloom filters [Ref03] solve this problem…”
如果你引用整个句子或者一个段落,那么就把引用的位置放在最后面(如果只指前面的句子,就放在句号前面,否则放在句号后面)
”Goto statement should be avoided [Dij68].” Notice the difference: now you agree with Dijkstra!
有时候没有一个“最原始”的来源,但是一个新的概念或者理论被一点一点的发展。在这种情况下,你可以给出一些例子参考文献让读者去找到他们更多需要的信息。
”Context-aware computing (see e.g. [DeA99,CaK00]) is a new approach…”
其他的例子:
”Minsky and Papert [MiP69] showed that…”
”Version spaces were introduced by Mitchell [Mit77].”
”Nonparametric methods are described by Randles and Wolfe [RaW79].”
”The principles of CART were first described in Breiman et al. [BrF84].” or
”The principles of CART were first described in [BrF84].”
”Prolog was primarly used for writing compilers [VRo90] and parsing natural language [PeW80].”
”The general procedure for skolemization is given by Skolem [Sko28].”
”Other methods are summarized in e.g. [Bro92,Woo96].”
”The problem is NP-complete [Coo00].
2、参考文献注释(这个在外文中常见,国内不常见)
a、一个通常的形式是:作者名字的三个字母+年份的最后两个数字,例如【Ham06】;
b、 有时候只有数字;
c、更人性化的是:全名加上年份 例如【hamalainen,2006】
notes:a、如果你引用一本书,记得给出章节或者页数!
b、如果你只是用了一本书的一节,你可以在参考文献列表中给出章节的数字和标题。如果你使用了好几个章节,在参考文献中给出章节的数字:【WMB94,chapter 2】
c、页数通常以这样的形式给出:“[Bro92,pp.3-7]”
d、如果在一个地方你有好几个参考文献,把他们列在一起:[Bro92,Woo96]
3、参考文献列表
在论文的最后的章节就是被称为参考文献的部分,对于每个条目来说,需要给出:
作者:全名和第一个名字的首字母,如果你有大于等于3个的作者,就给出第一个作者,并用“et al”来代替剩下的,例如”Mitchell, T.M. et al“
标题:
出版者,(地方)和年份
页数,如果来源是一篇论文或者是由好几个人合写的合集中的一个章节。
合集的标题和编者,如果论文出现在一个合集中(例如会议文章)。
卷(总是需要的)和期号,如果来源是一个期刊论文的话,就放在在逗号的后面或者圆括号中。
系列号,如果书本有着好几个版本。(如Lecture Notes in Computer Science + number)
期刊或者会议文章
大多数你的参考条目应该按照下面的几种类别写:
1、期刊文章:
<作者>:<标题>.
<期刊名>,<卷>(<期号>):<页数>,<年份>.
2、会议文章:
<作者>:<标题>.In
<书名>,<页数>,<年份>.
例子:
期刊文章:
Cheng, V., Li, C.H., Kwok, J.T. and Li, C.-K.: Dissimilarity learning for nominal data. Pattern Recognition, 37(7):1471–1477, 2004.
会议文章:
Salazar-Afanador, A., Gosalbez-Castillo, J., Bosch-Roig, I., Miralles-Ricos, R. and Vergara-Dominguez, L.: A case study of knowledge discovery on academic achievement, student desertion and student retention. In Proceedings of the 2nd International Conference
on Information Technology: Research and Education (ITRE 2004), pages 150–154, 2004.
note1:前面,你应该将后面的作者用<第一作者>et al来替换;
note2:有时候用逗号或者一个双引号对来替换冒号“:”。
书:
1. 一本书:
<Authors>: < Title>. < Publisher>, < year>.
2. 合集中的一篇文章:
<Authors>: < Title>. In <Editors>, editors, <Book title>.< Publisher>, < year>.
3. 书中的一个章节 (这本书只有一个作者):
<Authors>: < Title>, <Book title>, chapter < chapter number>.< Publisher>, < year>.
例子:
Lord, F.M.: Applications of item response theory to practical testing problems. Lawrence Erlbaum Associates, 1980.
D.W. Scott and S.R Sain: Multi-dimensional density estimation. In C.R.
Rao and E.J. Wegman, editors, Handbook of Statistics—Vol 23: Data Mining and Computational Statistics. Elsevier, Amsterdam, 2004.
Smyth, P.: Data mining at the interface of computer science and statistics,volume 2 of Massive Computing, chapter 3. Kluwer Academic Publishers,Norwell,
MA, USA, 2001
技术报告和学业论文
使用技术报告和硕士论文只是意外而已,他们没有被审阅(或者至少不和真正的出版物一样)!博士论文通常会有仔细的审阅。
1. 技术报告
<Authors>: < Title>. <Report series> <report number>, <Institution>, <year>.
2. 硕士论文:
<Author>: < Title>. Master’s thesis, <Department>, <University or institution>, <year>.
例子:
Dey, A.K. and Abowd, G.D.: Towards a better understanding of context and context-awareness. GVU Technical Report GIT-GVU-99-22, College of Computing,
Georgia Institute of Technology, 1999.
Norris, A.: Multivariate analysis and reverse engineering of signal transduction pathways. Master’s thesis, Department of Mathematics, Institute of Applied Mathematics, University of British Columbia, 2002.
引用互联网的文章:
默认情况下,所有的来源应该都是公开的!,只有当他们被公开在一个互联网期刊上才能进行引用互联网文章!其他的文章可以被引用只有一个好理由,即这个信息在其他地方找不到。(个人:也就是迫不得已不要引用互联网上的文章)。
如果你引用了一篇文章,这个文章在互联网上但是也有文章的形式被发表,那么就用文章的正式引用的版本,url地址不是一定要的,但是却有助于读者找到这篇文章。
如果这篇文章只有在互联网期刊上被公布,那么就像一个普通的期刊文章一样进行引用,不过将页数替换成url地址。
如果文章之存在于互联网而没有被发表,给出索引的日期和在引用的最后给出url地址。例如:Retrieved March 3, 2006, from http:www.kissastan.edu/bnetworks/bnarticle.html.
如果引用互联网上的教科书,那么就像一个普通的书籍信息一样(作者,书名,出版者,年份)。有时候互联网书籍同样也有和公司、机构一样的出版者。如果没有任何的出版年份,那么就给出当你接触到这本书的日期,不过还要记得给出url地址。
例子:
未发表的互联网来源:
Fox, E.: Details of clustering algorithms (lecture notes). http://maya.cs.depaul.edu/ classes/ds575/clustering/CL-alg-details.html, 1995-1996.
一个互联网教科书 (a special case, no author is mentioned, only the company – Xycoon – which has produced the book.)
Xycoon: Linear Regression Techniques (Online Econometrics Textbook), chapter II. Office for Research Development and Education, 2000-2006.
对软件的引用:
标准的软件工具和程序语言例如latex,matlab,java就不需要任何的引用了。
如果你使用的是特别的工具或者程序,没有很高知名度的,那么还是建议给出引用,例如:
BCAT [A Bayesian network tool]. Retrieved March 3, 2006, from http:www.kissastan.edu/bcat-tool/bcat3.0.html.
如果你知道哪个组织做了这些工作,将它放在出版者的位置上(在索引信息的前面)。如果某人对该软件有版权,记得将他/她作为作者。
例子:
Bourne, S. The UNIX System. International Computer Science Series, Addison-Wesley, 1982. (一本书)
Gannon, D. et al. Programming environments for parallel algorithms. In Parallel & Distributed Algorithms, ed. M. Cosnard et al. North-Holland,
1989. 101-108. (合集中的一篇文章)
Grahne, G., Nyk¨anen, M., Ukkonen, E. Reasoning about strings in databases.Journal of Computer and System Sciences 59, 1 (1999), 116-162. (期刊中的一篇文章)
在练习中有更多的例子;注意到期刊和书目是以大写首字母的。
4、在latex中的引用
latex可以自动的生成注释!
你可以通过设置bibliography环境来设置类型参数来选择不同的类型
对每个来源使用唯一的标签字符串,你可以通过命令(\cite)来使用这个引用,例如: \cite{whamalai},或者你想要引用页数3, \cite[3]{whamalai}
在引用中,定义标签的指定
如果你有很多的来源,你勀有通过bibtex来自动的管理他们(在后面会介绍)
六、引用(上面说的是参考文献的引用,这里说的是引用的内容)
在计算机科学中一般是不会直接引用的。如果你使用了他们,需要清楚的知道谁该为什么进行负责。
如果你使用你自己的话来表达某人的观点,那么记得将参考文献的引用放在这个观点后面。
如果你用作者自己的话来表达他的观点,那么这就是一个引用(citation)
如果双引号“…”没了,这就叫做剽窃
作为一个拇指规则:如果你借了超过7个单词,那么就使用双引号。
如果引用是翻译过来的,那么记得将译者放在参考文献中。
如果你增加或者删减单词,使用[]或者 …来表示
如果你想强调某个单词,记得提到它。
例子:
Nyk¨anen [Nyk03] remarks that unreferred citation is plagiarism (translation and emphasis by the author): ”If you borrow more than seven
words … from a text it [borrowing] is called literary theft.”
七、你的观点?
默认情况下:是没有观点的,任何事情都必须基于事实的基础上!
如果你需要表达你自己的观点,那么
原则上来说,任何没有参考的事情都是你自己的推论。
然而,记得搞清楚什么是你借来的观点(即引用的),什么是你自己的观点。
通常来说需要清晰的独立写一个章节叫做“Discussion”。