<object id="chinn"></object>

<th id="chinn"></th>
<nav id="chinn"><video id="chinn"><span id="chinn"></span></video></nav>

    1. <th id="chinn"><video id="chinn"><span id="chinn"></span></video></th>
      品牌升級,查看新版
      4000-058-056
      品牌全面升級,論文檢測進入“PaperRight”時代!

      學術不端文獻檢測系統研究綜述


      2014年02月15日 | 作者: paperrater | 分類: 行業動態 | 來源:PaperRater論文檢測系統

      作為學術審稿的“第三只眼”,學術不端文獻檢測系統自2008年研制試用到2010年系統升級,已引起了學術界的高度關注,截至2012年作者付梓之際,CNKI數據庫中以“學術不端檢測系統”“AMLC”“SMLC”“TMLC”為主題的研究文獻共計41篇。從這些已發表的文獻來看,在具體啟用、操作、接受學術不端文獻檢測系統的過程中,人們從初始的盲目使用到隨后的理性認知,逐步采取了審慎、科學、客觀的態度,從而形成了對檢測系統多層面、深層次地理解與把握。

      一、有效性的認同

      在已發表的論文中,研究者無一例外首肯了學術不端文獻檢測系統的使用,有效地防止了一批抄襲、剽竊、偽造、篡改、不當署名、一稿多投文章的發表;與以往檢測文章方法相較,其方便、快捷、高效的優點是顯而易見的。陳欣編輯在應用了AMLC后的體會是:(1)上傳文件后,編輯能夠很快得到檢測結果,不僅顯示文字復制比,而且列出了相似文獻,給編輯初審稿件提供了方便。(2)有利于選擇審稿專家。通過AMLC列出相似文獻,顯示被相似文獻的相關作者信息,從而尋找出專業對口專家。(3)有利于判斷稿件的修改情況。史成娣編輯更是佐以2008年和2009年的實例論證了該系統使用前和使用后的檢測成效,使陳欣編輯的成效分析更具說服力。作為少數研究學位論文不端行為的作者,于曉舟發表了自己的看法,他認為:TMLC系統的運用,使中國地質大學從導師到博士生都高度關注TMLC檢測結果,增強了師生質量意識,撰寫和修改論文也更加嚴肅認真。其次,強化了論文撰寫規范。最后,明確了質量保證重點。趙國惠編輯在詳細介紹學術不端文獻檢測系統所具有的檢測、對比分析、管理和自動生成四個主要功能的基礎上,重點分析了系統對學術道德建設產生的積極影響,即:預防和打擊學術不端行為;提高編輯的工作效率;提升期刊的學術影響力。此文與其他文章相較,其對系統功能的總結更為明晰、全面。

      上述研究者的研究標明,學術不端文獻檢測系統在很大程度上實現了其最基本的功能和研制者開發的初衷,即:主要實現論文內容的學術誠信檢查功能,檢測論文是否存在抄襲、一稿多投學術不端行為;并按照各種不端行為的嚴重程度給出一個權值進行度量;秒級響應速度,實時檢測反饋。

      二、局限性的挖掘

      隨著對學術不端文獻檢測系統的大量使用,研究者在實踐中遇到了不少問題,甚至讓一些學者擔心“學術不端”會成為“學術不公”。孔琪穎、蔡斐、張利平、徐曉在2009年5月,也就是系推廣使用不到半年的時間內,發現了檢測文章的文字復制比與抄襲率非呈正相關性的幾種情況,提醒使用者正確看待系統檢測結果,要具體問題具體分析。這篇文章的發表對進一步研究、認知學術不端文獻檢測系統起到了拋磚引玉的作用。隨后,研究者在公開發表的論文中,結合實際檢測案例,紛紛指出系統存在的不足,諸如《學術不端文獻檢測系統使用體會》《學術不端行為以及對AMLC系統運用的思考》等等,而《醫學科技期刊應用<科技期刊學術不端文獻檢測系統>判斷抄襲時應慎重對待的幾種情況》《學術不端文獻檢測系統存在的問題及使用的建議》《使用學術不端文獻檢測系統如何把握好合理使用的“度”》《科技期刊學術不端文獻檢測系統使用的建議》則是專文對這一問題進行研討。研究者對系統局限性的挖掘,歸納起來大致有三個方面:

      (一)檢測盲區的存在

      靖華在實際使用中,發現AMLC系統存在以下問題:第一,語言上的限制。大量的外文資料、論文并沒有被收錄,因此對“跨國抄襲”的作品無法準確檢測。第二,時間上的滯后。待審、待發表的未公開文章以及剛發表還沒被AMLC系統收錄的文章,這些稿件由于時間差而逃過了AMLC的檢查。第三,數據庫的有限性。AMLC并沒有收錄全部的中文數據庫,諸如網絡文獻,我國的法律、法規、條例等。至于比對數據不全面的原因,大部分研究者語焉不詳,大概是認為因素過于顯性,無外乎是人力、技術支持不夠,因此不予深究,而唯一一篇涉及揭示比對數據疏漏形成的文章則道出了另一個重要原因,“由于現在CNKI和萬方爭相采取和各個編輯部簽訂獨家合作的協議,如果某一編輯部簽訂這一協議后,就勢必造成另一數據庫該刊物的原始數據文獻缺失,也就造成了現今國內沒有一家數據庫是完整收錄所有刊物文獻數據的。”

      針對AMLC存在的不足,研究者多從以下方面提出了建議:英文文獻收錄的增加、更新速度的加快、中文論文數據庫收錄的保證。這些建議雖為方向性的,不具有具體的實際操作性,但為學術不端文獻檢測系統的進一步改進提供了參照指導,因此,還是具有一定積極意義的。

      (二)檢測效果不理想

      孔琪穎、蔡斐、張利平、徐曉在初審稿件時無意中發現,同一篇文章用不同的格式檢測,文字復制比分別為46%和26%,相差20個百分點。通過對多次檢測結果的考察,他們總結出:文章格式,文中的數字、公式、圖表、符號及字母均會程度不同地影響檢測結果的真實性。

      這一點筆者也深有同感,根據反復實踐,筆者發現學術不端文獻檢測系統對文件的doc格式檢測效果最佳,因此,建議作者投稿、編輯審稿時最好將文章改為doc格式。至于公式、圖表的抄襲,更多的研究者則是把解決之方希冀于研制者對圖表、公式、數據抄襲和篡改等行為檢測功能的開發上來。目前,我認為不妨我們借鑒一下孔琪穎編輯根據工作實踐總結出的經驗:他建議只要文章的復制比大于5%,那么就要特別留意公式引導段落和表題、圖題,通過比對數據庫從而識別該文是否存在抄襲。這一方法不失為眼下較可行的解決問題之徑。

      (三)無法甄別合理引用

      對被檢測文章的引用部分與抄襲部分,學術不端文獻檢測系統不能確切區分;而不加標注的合理引用與不當引用,檢測系統也不能有效識別,二者均顯示為高重合率。

      石鶴等人指出,像退稿重投、同一作者撰寫的有延續性的研究成果、綜述類文章文字重合度均易較高。此外,不同作者研究同一組資料,對這些資料的描述;研究性論文在討論部分不引用他文不足以說明問題;統計軟件統計方法的一般描述都難免出現高文字重合度,而對于學術不端文獻檢測系統來說便亮起了“紅燈”。石鶴是從總的方面來談檢測數字高但不屬于抄襲的情況,吉家友和劉海清則就具體學科指出了檢測系統存在的問題。吉家友指出:諸如關于時事和政治方面的文章,像基本概念、基本內涵、基礎理論、領導人的講話,特別是關于某一方面定性的論述的引用是不好用自己的語言對其進行描述的,是必須準確的,否則就有可能成為曲解。而像歷史學方面的文章,最重視的就是史料,對有限史料的復述、引證,論文的重復率亦會很高。劉海清等人針對醫學科研的現狀及寫作特點,指出:用他人的方法重復自己的實驗這是醫學科研的現狀,加之醫學論文的遣詞造句比較簡單和通用,因此,在引言、臨床資料、方法、結果、討論的固定書寫部分中容易出現文字重復的現象。

      學術不端文獻檢測系統的智能程度不高,像上述列舉的情況,系統往往會提示涉嫌抄襲,而事實上,很多時候這些紅色字體是屬于合理引用。綜上,我們可以看到,系統在查全率(第一個問題“檢測盲區的存在”)和查準率(第二、第三個問題“檢測效果不理想”“無法甄別合理引用”)方面還有待提高。研究者對這些問題的發現,為我們進一步正確使用系統、客觀審稿敲響了警鐘,也為系統的制定者、改進者提供了相當有益的借鑒,使得系統的研發更加完善,從而促使制定者、使用者、研究者之間的信息暢通有了良性的循環。

      三、參考性的認知

      局限性的發現使研究者清醒地認識到,學術不端文獻檢測系統只是編輯審稿的一個參考工具,而非權威依據,它提供的數據只是一個參照權值,“使用AMLC可快速、準確檢測學術不端論文,它可作為編輯審稿時的一個輔助性工具;但在實際使用中應認識到,稿件的情況比較復雜,要認真對待每一篇稿件,正確利用AMLC的檢測結果。要知道,它只是一部機器,所產生的報告只能用作參考,而不能取代專家、主編和編輯在審稿過程中的主觀能動性。”其實,這是使用者和研究者初始就應該注意到的,畢竟,學術不端文獻檢測系統只將可疑文字稱為“重合率”而沒有稱為“抄襲率”。趙蔚在《學術不斷檢測結果的修正標準初探》一文中對“文字復制比”與“文字抄襲率”進行了明確地區分,認為二者的性質是截然不同的。

      因此,重合率不等于抄襲率的認識使研究者提出了人機一體、多種網絡檢索工具并舉的審稿措施。于海、王巍針對不同問題,采用了不同的解決方式:(1)對于系統檢測出現學術不端空白的稿件,編輯除了通過Google等搜索引擎進行補充搜索外,還要借助審稿專家豐富的知識、才學將稿件與所掌握的資料、文獻進行比對。(2)對于檢測出有文字復制比的稿件,編輯不能單純依賴紅色雷同部分的多少來決定稿件的取舍,這是缺乏科學性的。編輯應認真閱讀相似文獻,仔細區分稿件中的重合部分是合理引用還是不當引用。作者不僅詳細地提出了應對之策,而且就如何區分什么是合理引用、什么是不當引用作了較為具體的解釋,使讀者一目了然。

      張放則進一步補充道:“檢測次數至少兩遍為宜,有些文章初次檢測時系統顯示為合格,但1個月后檢測相似度極高”。故而他建議除在初審對投稿進行檢測外,發表前應再做一次檢測,多次檢測可防止因上傳間隔時間長而帶來的一稿多投、提前發表的學術不端行為。

      四、標準性的討論及界定

      目前,由于沒有相關部門對論文重復率為多少是抄襲的定性,因此,學界就論文抄襲標準的界定形成了兩種觀點:

      (一)對稿件重復率有較嚴格的客觀界定,并希望官方出臺評判標準。

      這個標準的界定一般為:重復率達到40%或50%視為抄襲。如《上海電機學院學報》編輯部對重復率達到40%的稿件實行無條件退稿。對重復率占到40%以下的稿件,又具體劃分為三個等級:30%—40%要求作者修改,降低重復率;25%—30%送一審并要求作者降低重復率;25%以下的可直接送學術專家一審。《科技期刊學術不端檢測系統在期刊出版中的應用分析》一文也持相同觀點,《內蒙古電力技術》編輯部將文字復制比達50%的文章視為抄襲,直接退稿,并將其列為本刊來稿審查制度內容之一。

      對“編輯部應制定統一標準,以便各個編輯按照相同的標準處理來稿”“建議相關部門盡快出臺一個明確、統一的抄襲剽竊的判別標準”的做法和呼聲我是表示理解的,希望編輯在使用系統審稿時有章可循,避免出現爭議和混亂,這本身并沒有錯,但是單以百分比作為抄襲標準的界定有時也會失之公允。且不說本文前面指出的重復率不等于抄襲率的幾種情況,單說社科期刊中的書評,自會引用被評對象(即書)中的很多內容,其百分比不止50%;科技期刊中,《護理學報》列舉了一篇重復率為67%的文章,該文雖大量引用其學位論文中的實驗資料、方法等,但討論角度不同,并更深入地分析了其應用價值,鑒于此,學報發表了這篇文章。故而,我還是比較同意下面這種觀點。

      (二)對稿件重復率沒有明確界定,依現有法律、法規視具體情況做具體分析。

      江霞等人根據AMLC提供的文字復制比判斷抄襲行為時就遇到了幾種特殊情況,因而她提醒編輯人員應慎重判斷抄襲行為、具體情況具體分析,不宜簡單、機械地將重復句子、段落判斷為抄襲。趙茜對稿件重復率數字的界定看得更為“模糊”、“寬泛”,而對抄襲的界定則更為客觀、全面。她既不對高文字復制比的稿件輕易下抄襲的定論,甚至認為“文字復制比在40%以下的稿件并非都存在問題,有些重合的文字還是屬于合理使用的范圍”;也不貿然斷定低重復率的文章就不存在嚴重的學術不端行為,她舉例西南交通大學黃某,其論文文字重復率雖為7%,但所引文字為該論文的理論核心部分,因此屬于學術不端行為。趙茜以《著作權法》為依據,從重復的目的、內容、形式、數量幾方面綜合衡量、客觀判斷。

      筆者認為,上述方法是可行的。已有的法律、法規明確了哪些行為屬于抄襲,如果再出臺細化、量化標準,只能使編輯在總思想指導下的視具體情況具體分析成為了在量化的條條框框中生搬硬套、一概論之。重復率究竟多少比例是合理的、標準的,我認為,研究者不必過于糾結于此,“處理學術問題更多還是要遵循學術規律,采取學術辦法”。所以,對文章重復段落是“抄襲”還是“合理引用”,需要編輯將分析前的比例與分析后的比例綜合考察,最根本的是要找到抄襲的事實。

      此外,值得一提的是,現在編輯部收到不少研究生投來的學位論文的拆分研究成果,其整篇文章因提前被學位論文數據庫收錄,因此檢測文字復制比通常在80%以上,對于這部分高文字復制比的拆分文章,編輯部處理意見不一。金鐵成副編審通過長時間地思考,為我們提供了較為合理的處理辦法。他認為《中國優秀碩士學位論文全文數據庫》、《中國博士學位論文全文數據庫》具有CN號和ISSN號,屬于正式的學術電子期刊,所以作者再發表論文中的部分內容就屬于重復發表。因此,他建議作者將論文拆分先發表,然后授權CNKI收錄其學位論文整體,這既不違背著作權法中有關匯編作品的相關規定,也符合論文數據庫收錄稿件的第二條投稿須知。

      五、保密性的呼吁

      對于已經確認存在抄襲的投稿,研究者所持的態度基本一致,即“對期刊來稿進行學術不端檢測,其結果應及時反饋給作者本人,提醒和警示作者改正,但不宜公之于眾或隨意泄密。”這樣做出于兩方面的考慮:第一,尚未公開發表的學術論文學術不端行為所引發的不良影響較已經公開發表的論文要小,而且可以通過退稿意見或修改意見消除不良影響。第二,保護作者聲譽、尊重作者人格,這也是編輯服務作者的體現。

      胡朝明副研究員在2012年4月,于《學術不端文獻檢測系統的使用與建議》一文中提出了疑問:“檢測報告是否對參檢人員本人公布?公布程度如何?只公布數值,還是整個報告全部公布?這些問題都應該深入研究并解決,不然在具體工作中很容易引起糾紛。”其實,關于這一點早在2011年杜新征編輯就明確指出:“對期刊來稿進行學術不端檢測,其結果應及時反饋給作者本人”,文中用“結果”而沒有用“內容”二字,也就是說只能告訴作者文章存在抄襲,至于抄襲范圍與抄襲率不宜也不應該告訴作者。根據筆者的工作經驗,如果為作者提供了抄襲范圍,作者僅會對文中指出的地方做字句的改動,這種只作語序調整篡改他人觀點為己用的做法依然是抄襲行為,但卻能很輕易地避開系統的檢測,成為系統、編輯及專家未能及時發現的隱性抄襲。

      使用學術不端文獻檢測系統堅持保密原則除上述方面外,還有另一層意思,即系統使用僅限于各合作單位內部,像AMLC和SMLC,是需要各編輯部簽訂相關保密協議,通過建立賬號和密碼才能使用的。

      六、其他

      除了上述幾點外,研究文章還或多或少地涉及到另外兩個和學術不端文獻檢測系統有關的問題:

      一個是反檢測手段和系統的生成。學術不端檢測系統引入的初衷是為了推進“反學術不端行為”,但讓人始料未及的是,它同時又成為學術不端的“升級”因素。為了通過系統的檢測,很多作者玩起了文字功夫,將他人文章中的句子、段落進行語序調整或支離分解,或者用網上免費在線翻譯工具將論文進行兩次雙向翻譯,更有甚者,將他人論文中的文字轉換成圖片作為己用(當然是少量的用)。對此,熊偉一針見血地指出了其實質———“一種升級版的造假”,其后果只會使人把學術研究的重點放在形式上、表面上的創新,而忽視內容、方法的創新,這種本末倒置的做法嚴重阻礙了學術的發展。而這僅僅是被檢測者的一些做法,如今社會上更是出現了一些支持被檢測者實施學術不端行為的“幫兇”,CNKI在《關于“學術不端文獻檢測系統”使用的聲明》中談到:一些用戶通過淘寶等網絡交易平臺向作者收費,幫其排查論文。無怪乎就高校引入學術不端文獻檢測系統問題對網民進行調查時,有77.01%的網民對系統的推廣持不樂觀態度。

      對于以上反檢測手段和系統,除了CNKI聲明的暫停賬號或依法追究責任外,研究者都給出了比較行之有效的解決辦法,像論文中存在的雙向翻譯、英譯漢的抄襲行為,陳靜建議可使用中科院董振東等人研發的HowNet(是一部比較詳盡的語義知識詞典);對于句子、段落語序的改動,李明建議利用各種網絡數據庫比對同篇名和同作者名的文章。

      盡管就反檢測手段和系統的論題僅占發表論文的很小一部分,但足以讓使用者和研發者對系統帶來的雙面影響(特別是負面影響)引起高度重視,它也應成為我們下一步研討的重點及難點問題。

      另一個是對學術不端行為發生根源的探析和方法的解決。黃杰揭示出:考評機制,社會的急功近利心理,制度執行力度不夠、法治觀念薄弱是出現學術不端的原因。就此,史書俠提出應對措施,如加強學術道德、完善相應法規建設、設立獨立的專門鑒定機構、編輯部門把關、應用學術不端文獻檢測系統檢查等等。然而,由于學術不端文獻檢測系統的研究者基本為學報編輯部的編輯人員,使其研究視角不夠開闊,缺乏多樣化。應該說此類研究仍處在起步階段,尤其是社科期刊學術不端文獻檢測系統、學位論文學術不端行為檢測系統、大學生論文抄襲檢測系統等均存在很大的研究空間。

      caoporn超碰97免费人妻