寫論文時copy自己發表過的研究內容,算是「自我抄襲」嗎?

寫論文時copy自己發表過的研究內容,算是「自我抄襲」嗎?
Photo Credit: shutterstock.com / 達志影像

我們想讓你知道的是

筆者建議將自我抄襲分開為兩個影響程度及發生率不同的類型:「重複發表」涉及論文創新核心內容,「文字再使用」則不涉及論文創新核心部分。

文:孫以瀚(中央研究院分子生物研究所特聘研究)

自我抄襲(self plagiarism),是近年出現的學術倫理議題。但在概念不明確的狀況下,引發很多困惑,如學生的學位論文與期刊論文、計畫與計畫,或是計畫與期刊論文。不過,怎樣才算自我抄襲呢?

在此提出筆者的個人觀點,希望能夠澄清一些觀念。當中主要是從實驗科學的角度出發,人文社會科學領域可能有所不同。提出這些觀點,一方面希望科技部能夠將相關法規修改得更明確,一方面也希望學術社群對這議題的判斷準則有多一些討論,以達成共識。

科技部對自我抄襲的定義與規範

根據〈科技部對研究人員學術倫理規範〉(ref. 1)第七點「自我抄襲的制約」提到:

研究計畫或論文均不應抄襲自己已發表之著作、研究計畫中不應將已發表之成果當作將要進行之研究,以及論文中不應隱瞞自己曾發表之相似研究成果,而誤導審查人對其貢獻與創見之判斷。而自我抄襲是否嚴重,應視抄襲內容是否為著作中創新核心部分,即是否有誤導誇大創新貢獻之嫌而定,對此,亦有以下兩點補充:

  1. 某些著作應視為同一件(例如研討會論文或計畫成果報告於日後在期刊發表),不應視為抄襲。計畫、成果報告通常不被視為正式發表,亦無自我引註之需要。研討會報告如於該領域不被視為正式發表,亦無自我引註之必要。
  2. 同一研究成果以不同語文發表,依領域特性或可解釋為針對不同讀者群而寫,但後發表之論文應註明前文。如未註明前文,且均列於著作目錄,即顯易誤導為兩篇獨立之研究成果,使研究成果重複計算,應予避免,但此應屬學術自律範圍。」

此外,〈科技部學術倫理案件處理及審議要點〉(ref. 2)在「研究人員違反學術倫理之行為類型」中亦分別列出「自我抄襲」與「重複發表」的定義;前者為「研究計畫或論文未適當引註自己已發表之著作」,後者則是「重複發表而未經註明」。

自我抄襲的樣態

有人認為「自我抄襲」是個矛盾詞,因為抄襲意指竊取,但人不能偷竊自己的創作。所以近年開始有人提倡以「重複發表」及「文字再使用」來代替這個詞。然而這兩種的發生率與影響很不相同,所以應該分開看待。

有人認為,自我抄襲可分為四種樣態(ref. 3):

  1. 重複發表(dual or redundant publication):將已發表之相同或大部分相同的內容發表為新的論文
  2. 擴增發表(augmented publication):將已發表的結果擴增(如增加樣本數,增加新數據)發表,但未清楚說明其中部分數據已發表,讓人以為全部都是新的結果
  3. 分段發表(segmented or salami publication):將同一研究所得結果分段發表
  4. 文字再使用(text recycling):最常見的樣態,因為文字的抄襲很容易用軟體比對偵測

其中,分段發表即是將一篇完整的大論文分成小片段發表,是一種發表的策略,難謂對錯,也難以認定。會被納入自我抄襲的樣態,主要是因為幾篇小論文常有大段內容重複。所以前兩種(重複發表和擴增發表)的問題都屬於重複發表,只是篇幅的差異。後兩種(分段發表和文字再使用)則都屬於文字再使用。

「重複發表」的關鍵在於,其重複的是著作中創新核心部分,而「文字再使用」則非核心。國際出版倫理委員會(Committee on Publication Ethics, COPE)將「重複發表」與「文字再使用」分開討論(ref. 4, 5, 6, 7),且認為「重複發表」是較嚴重的問題。「文字再使用」也應該不限於文字,該包含用作背景介紹的圖表和公式。

2019有一項研究(ref. 8),以抄襲檢測軟體Turnitin分析了4個學術領域(生化與分子生物、經濟、歷史和心理)、共922篇荷蘭的大學學者自2010以來發表的論文,發現平均有6.1%的論文有「文字再使用」。但不同領域的差別甚大(歷史0.5%、生化與分子生物3.3%、心理4.7%、經濟14.0%)。「重複發表」盛行率則未見系統化分析,相信應該遠低於「文字再使用」。

綜上,筆者建議將自我抄襲分開為兩個影響程度及發生率不同的類型:「重複發表」涉及論文創新核心內容,「文字再使用」則不涉及論文創新核心部分。

國際上的普遍作法然而,美國聯邦研究誠信辦公室(Office of Research Integrity, ORI)並不將自我抄襲列為不當的研究行為(research misconduct),他們的說法是:「通常不追訴有限度地使用相同或幾乎相同的詞組,以描述常用方法或先前的研究。因為ORI不認為這樣的使用,會實質誤導讀者或具有重要意義。」(ref. 9)

至於未公開發表之著作(如研究計畫、計畫成果或進度報告、獎項申請文件、研討會壁報、研討會摘要、網路檔案如bioRxiv等),包含國際期刊論文寫作倫理規範龍頭COPE在內的組織,一般也未納入自我抄襲的範疇。

自我抄襲錯在哪裡?

抄襲別人著作可能觸犯著作權,但這是作者與出版社的事,非屬學術倫理。抄襲的錯主要在於,將別人的研究成果當作自己的貢獻,亦即不當獲得研究成績。

而自我抄襲最大的問題,是將相同研究成果重複發表,卻未適當引註。其中的關鍵不在於內容(文字、圖表)的重複,而在於是否會使人以為這是未發表的研究成果,以致重複獲取研究成績(credit)。

〈科技部對研究人員學術倫理規範〉第七點也指明,「自我抄襲是否嚴重,應視抄襲內容是否為著作中創新核心部分,亦即是否有誤導誇大創新貢獻之嫌而定。」由此可見,自我抄襲的認定,不只是內容重複,還必須是著作中創新核心部分,而有誤導誇大創新貢獻之嫌。

此外,〈科技部學術倫理案件處理及審議要點〉加上的條件是「未適當引註」,亦即只要適當引註,就可不算自我抄襲。至於如何才是適當引註,就要看該領域的慣例。

重複發表的另一個錯,是在統合分析(meta analysis)上,如對藥物療效的統合分析,會造成錯誤的結論,因為相同的研究結果會被重複計算。

對於「文字再使用」的看法則很分歧。一項針對300多份學術期刊的主編及86個英文學術期刊(含括理工、社會科學、人文和藝術等16個領域)編委的調查(ref. 10)發現,83.6%的人認為「文字再使用」在某些狀況下,是可以容許的,至於是什麼狀況卻沒共識。贊成者認為,既然花了很多心力精雕細琢描述一個方法、事件或觀念的句子,沒有必要每次都重寫,因此「文字再使用」是為了效率與精確。(ref. 11)

對於「文字再使用」的許多論述都只是個人意見,經過討論而能代表學術組織的立場的唯有COPE針對期刊主編公布的〈文字再使用規範〉(Text Recycling Guideline)。該規範認為,在背景介紹及研究方法部分,某種程度的文字再使用可能是無法避免(unavoidable)、較不重要或甚至是可取的(desirable)。亦提醒期刊編輯判定的準則,是作者是否說明該方法已被發表過並引註前文。

研究結果通常不允許有已發表過的數據,但如將先前的研究延伸擴充,應明確說明部分數據來自先前發表的論文。

綜上所述,「重複發表」卻未適當引註,會重複獲取研究成績,也可能造成統合分析的錯誤,所以是不當的。「文字再使用」則充其量是偷懶,但在某些狀況下是可以容許的,甚至有益於效率與精確,因此這兩種樣態該分開看待與處理。


減少自我抄襲的誘因

自我抄襲的主要問題在於「重複發表」,最主要的理由可能是為了衝高著作數量,因為很多考評制度中仍然看重著作篇數。科技部及中研院都強調重質不重量,科技部研究計畫申請書中「近五年內之研究成果」要求只列出最具代表性研究成果論文,以5篇為限,中研院的學組聘審會報告中甚至不可列出發表篇數。以這些措施減少衝高著作篇數的誘因,能從而減少各種重複發表的「需要」。

近年由於抄襲比對軟體的出現,讓文字的比對很容易,也開始有期刊、學校、出資單位要求作者在送審前先自行比對,以避免引起學倫問題的麻煩。避免麻煩,可以是一個重要的誘因,預期未來的「文字再利用」將大幅減少。

由於這還不是一個全面性的作法,面對案例仍需要睿智的判斷,至少不能單純的由比對數值(百分比)做判斷,希望能以本文所提出的觀點作為判斷的依據。

結語

綜上所述,筆者的主要結論與建議如下:

第一,「重複發表」涉及論文創新核心部分,以致重複獲取研究成績,屬於不當的研究行為,亦即違反學術倫理。建議科技部將「重複發表」定義為「將相同研究成果重複發表,卻未適當引註,以致有重複獲取研究成績之虞,且情節重大者」,將重複發表的重點放在「研究成果」,且加上是否有「重複獲取研究成績之虞」及「情節重大」兩項條件。如此,可將範圍侷限在我們真正在意的問題,減少波及。

其二,「文字再使用」不涉及論文創新核心部分,學界意見分歧,但大多數人都認為在某些狀況下是可以容許的。建議科技部將「自我抄襲」改為「文字再使用」且定義為「論文重複使用自己已公開發表之著作之非創新核心內容,未適當引註,情節重大者」,加入「已公開發表之著作」、「非創新核心內容」及「情節重大」三項條件,且排除研究計畫。

(感謝邱子珍、阮麗蓉、陳瑞華、李超煌、程淮榮、陳俊安、余淑美、蔡明璋、李尚凡的珍貴意見)

參考資料

1.〈科技部研究人員學術倫理規範〉,科技部,2017年11月13日。
2.〈科技部學術倫理案件處理及審議要點〉,科技部,2020年2月15日。
3.D. Juyal, V. Thawani, and S. Thaledi, Plagiarism:An Egregious Form of Misconduct, North American Journal of Medical Sciences, Vol.7(2), p.77–80, 2015.
4.COPE flowchart for suspected redundant publication in a published article, Committee on Publication Ethics, 2008.
5.COPE flowchart for suspected redundant publication in a submitted manuscript,Committee on Publication Ethics, 2008.
6.BioMed Central/COPE, Text recycling guidelines.
7.S. Harriman and J. Patel, Text recycling:acceptable or misconduct?, BMC Medicine,2014.
8.S. Horbach and W. Halffman, The extent and causes of academic text recycling or‘self-plagiarism’, Research Policy, Vol.48(2), p.492-502, 2019.
9.ORI Policy on Plagiarism, ORI Newsletter,Vol. 3, No. 1,1994
10.S. Hall, C. Moskovitz, and M. Pemberton,Attitudes toward text recycling in academic writing across disciplines, Accountability in Research, 2018.
11.C. Anson et al., Reuse in STEM research w r i t ing : R hetor i ca l and p ra c t i ca l considerations and challenges, AILA Review,Vol. 33, p.120–135, 2020.
12.Netherland Code of Conduct for Research Integrity, 2018.

本文經科學月刊授權刊登,原文刊載於此

責任編輯:朱家儀
核稿編輯:翁世航