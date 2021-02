文:孫以瀚(中央研究院分子生物研究所特聘研究)

自我抄襲(self plagiarism),是近年出現的學術倫理議題。但在概念不明確的狀況下,引發很多困惑,如學生的學位論文與期刊論文、計畫與計畫,或是計畫與期刊論文。不過,怎樣才算自我抄襲呢?

在此提出筆者的個人觀點,希望能夠澄清一些觀念。當中主要是從實驗科學的角度出發,人文社會科學領域可能有所不同。提出這些觀點,一方面希望科技部能夠將相關法規修改得更明確,一方面也希望學術社群對這議題的判斷準則有多一些討論,以達成共識。

科技部對自我抄襲的定義與規範

根據〈科技部對研究人員學術倫理規範〉(ref. 1)第七點「自我抄襲的制約」提到:

研究計畫或論文均不應抄襲自己已發表之著作、研究計畫中不應將已發表之成果當作將要進行之研究,以及論文中不應隱瞞自己曾發表之相似研究成果,而誤導審查人對其貢獻與創見之判斷。而自我抄襲是否嚴重,應視抄襲內容是否為著作中創新核心部分,即是否有誤導誇大創新貢獻之嫌而定,對此,亦有以下兩點補充: 某些著作應視為同一件(例如研討會論文或計畫成果報告於日後在期刊發表),不應視為抄襲。計畫、成果報告通常不被視為正式發表,亦無自我引註之需要。研討會報告如於該領域不被視為正式發表,亦無自我引註之必要。 同一研究成果以不同語文發表,依領域特性或可解釋為針對不同讀者群而寫,但後發表之論文應註明前文。如未註明前文,且均列於著作目錄,即顯易誤導為兩篇獨立之研究成果,使研究成果重複計算,應予避免,但此應屬學術自律範圍。」

此外,〈科技部學術倫理案件處理及審議要點〉(ref. 2)在「研究人員違反學術倫理之行為類型」中亦分別列出「自我抄襲」與「重複發表」的定義;前者為「研究計畫或論文未適當引註自己已發表之著作」,後者則是「重複發表而未經註明」。

自我抄襲的樣態

有人認為「自我抄襲」是個矛盾詞,因為抄襲意指竊取,但人不能偷竊自己的創作。所以近年開始有人提倡以「重複發表」及「文字再使用」來代替這個詞。然而這兩種的發生率與影響很不相同,所以應該分開看待。

有人認為,自我抄襲可分為四種樣態(ref. 3):

重複發表(dual or redundant publication):將已發表之相同或大部分相同的內容發表為新的論文 擴增發表(augmented publication):將已發表的結果擴增(如增加樣本數,增加新數據)發表,但未清楚說明其中部分數據已發表,讓人以為全部都是新的結果 分段發表(segmented or salami publication):將同一研究所得結果分段發表 文字再使用(text recycling):最常見的樣態,因為文字的抄襲很容易用軟體比對偵測

其中,分段發表即是將一篇完整的大論文分成小片段發表,是一種發表的策略,難謂對錯,也難以認定。會被納入自我抄襲的樣態,主要是因為幾篇小論文常有大段內容重複。所以前兩種(重複發表和擴增發表)的問題都屬於重複發表,只是篇幅的差異。後兩種(分段發表和文字再使用)則都屬於文字再使用。

「重複發表」的關鍵在於,其重複的是著作中創新核心部分,而「文字再使用」則非核心。國際出版倫理委員會(Committee on Publication Ethics, COPE)將「重複發表」與「文字再使用」分開討論(ref. 4, 5, 6, 7),且認為「重複發表」是較嚴重的問題。「文字再使用」也應該不限於文字,該包含用作背景介紹的圖表和公式。

2019有一項研究(ref. 8),以抄襲檢測軟體Turnitin分析了4個學術領域(生化與分子生物、經濟、歷史和心理)、共922篇荷蘭的大學學者自2010以來發表的論文,發現平均有6.1%的論文有「文字再使用」。但不同領域的差別甚大(歷史0.5%、生化與分子生物3.3%、心理4.7%、經濟14.0%)。「重複發表」盛行率則未見系統化分析,相信應該遠低於「文字再使用」。

綜上,筆者建議將自我抄襲分開為兩個影響程度及發生率不同的類型:「重複發表」涉及論文創新核心內容,「文字再使用」則不涉及論文創新核心部分。

國際上的普遍作法然而,美國聯邦研究誠信辦公室(Office of Research Integrity, ORI)並不將自我抄襲列為不當的研究行為(research misconduct),他們的說法是:「通常不追訴有限度地使用相同或幾乎相同的詞組,以描述常用方法或先前的研究。因為ORI不認為這樣的使用,會實質誤導讀者或具有重要意義。」(ref. 9)

至於未公開發表之著作(如研究計畫、計畫成果或進度報告、獎項申請文件、研討會壁報、研討會摘要、網路檔案如bioRxiv等),包含國際期刊論文寫作倫理規範龍頭COPE在內的組織,一般也未納入自我抄襲的範疇。

自我抄襲錯在哪裡?

抄襲別人著作可能觸犯著作權,但這是作者與出版社的事,非屬學術倫理。抄襲的錯主要在於,將別人的研究成果當作自己的貢獻,亦即不當獲得研究成績。

而自我抄襲最大的問題,是將相同研究成果重複發表,卻未適當引註。其中的關鍵不在於內容(文字、圖表)的重複,而在於是否會使人以為這是未發表的研究成果,以致重複獲取研究成績(credit)。

〈科技部對研究人員學術倫理規範〉第七點也指明,「自我抄襲是否嚴重,應視抄襲內容是否為著作中創新核心部分,亦即是否有誤導誇大創新貢獻之嫌而定。」由此可見,自我抄襲的認定,不只是內容重複,還必須是著作中創新核心部分,而有誤導誇大創新貢獻之嫌。

此外,〈科技部學術倫理案件處理及審議要點〉加上的條件是「未適當引註」,亦即只要適當引註,就可不算自我抄襲。至於如何才是適當引註,就要看該領域的慣例。

重複發表的另一個錯,是在統合分析(meta analysis)上,如對藥物療效的統合分析,會造成錯誤的結論,因為相同的研究結果會被重複計算。

對於「文字再使用」的看法則很分歧。一項針對300多份學術期刊的主編及86個英文學術期刊(含括理工、社會科學、人文和藝術等16個領域)編委的調查(ref. 10)發現,83.6%的人認為「文字再使用」在某些狀況下,是可以容許的,至於是什麼狀況卻沒共識。贊成者認為,既然花了很多心力精雕細琢描述一個方法、事件或觀念的句子,沒有必要每次都重寫,因此「文字再使用」是為了效率與精確。(ref. 11)

對於「文字再使用」的許多論述都只是個人意見,經過討論而能代表學術組織的立場的唯有COPE針對期刊主編公布的〈文字再使用規範〉(Text Recycling Guideline)。該規範認為,在背景介紹及研究方法部分,某種程度的文字再使用可能是無法避免(unavoidable)、較不重要或甚至是可取的(desirable)。亦提醒期刊編輯判定的準則,是作者是否說明該方法已被發表過並引註前文。

研究結果通常不允許有已發表過的數據,但如將先前的研究延伸擴充,應明確說明部分數據來自先前發表的論文。

綜上所述,「重複發表」卻未適當引註,會重複獲取研究成績,也可能造成統合分析的錯誤,所以是不當的。「文字再使用」則充其量是偷懶,但在某些狀況下是可以容許的,甚至有益於效率與精確,因此這兩種樣態該分開看待與處理。

減少自我抄襲的誘因

自我抄襲的主要問題在於「重複發表」,最主要的理由可能是為了衝高著作數量,因為很多考評制度中仍然看重著作篇數。科技部及中研院都強調重質不重量,科技部研究計畫申請書中「近五年內之研究成果」要求只列出最具代表性研究成果論文,以5篇為限,中研院的學組聘審會報告中甚至不可列出發表篇數。以這些措施減少衝高著作篇數的誘因,能從而減少各種重複發表的「需要」。

近年由於抄襲比對軟體的出現,讓文字的比對很容易,也開始有期刊、學校、出資單位要求作者在送審前先自行比對,以避免引起學倫問題的麻煩。避免麻煩,可以是一個重要的誘因,預期未來的「文字再利用」將大幅減少。

由於這還不是一個全面性的作法,面對案例仍需要睿智的判斷,至少不能單純的由比對數值(百分比)做判斷,希望能以本文所提出的觀點作為判斷的依據。

結語

綜上所述,筆者的主要結論與建議如下:

第一,「重複發表」涉及論文創新核心部分,以致重複獲取研究成績,屬於不當的研究行為,亦即違反學術倫理。建議科技部將「重複發表」定義為「將相同研究成果重複發表,卻未適當引註,以致有重複獲取研究成績之虞,且情節重大者」,將重複發表的重點放在「研究成果」,且加上是否有「重複獲取研究成績之虞」及「情節重大」兩項條件。如此,可將範圍侷限在我們真正在意的問題,減少波及。

其二,「文字再使用」不涉及論文創新核心部分,學界意見分歧,但大多數人都認為在某些狀況下是可以容許的。建議科技部將「自我抄襲」改為「文字再使用」且定義為「論文重複使用自己已公開發表之著作之非創新核心內容,未適當引註,情節重大者」,加入「已公開發表之著作」、「非創新核心內容」及「情節重大」三項條件,且排除研究計畫。

(感謝邱子珍、阮麗蓉、陳瑞華、李超煌、程淮榮、陳俊安、余淑美、蔡明璋、李尚凡的珍貴意見)

