職稱論文檢測報告的技術(shù)修正
職稱論文檢測報告的技術(shù)修正
小編為你整理了職稱論文檢測報告的技術(shù)修正,希望能幫到你。
一、職稱論文檢測系統(tǒng)的檢測原理
將待評審的職稱論文進行學術(shù)不端檢測是cnki學術(shù)不端檢測系統(tǒng)的一大新應(yīng)用,其檢測原理是和未發(fā)論文檢測系統(tǒng)的原理相同,只是檢測手段稍有不同。
(一)檢測原理———“文字比對”20世紀90年代后,隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,信息內(nèi)容迅速增多,復(fù)制粘貼變得越來越容易與普遍。文本復(fù)制(抄襲)是學術(shù)不端文獻的重要特征。隨著內(nèi)容管理與版權(quán)保護的需要,文本復(fù)制的檢測研究也得到進一步發(fā)展,陸續(xù)提出數(shù)字指紋、VSM等檢測方法。[3]筆者通過對檢測原理的深入研究發(fā)現(xiàn),目前國內(nèi)外的學術(shù)不端檢測系統(tǒng)都是以“文字比對”———提供文字復(fù)制比率為基本原理,也就是說出現(xiàn)了初級的文本復(fù)制類型的抄襲,系統(tǒng)可以輕易地識別。以這種“文字比對”為識別基礎(chǔ)的學術(shù)不端檢測系統(tǒng)采用的是“外形”對比以及針對文字、字母與數(shù)字的排列組合進行形式上的比對,如果被比對的兩段文字的句式、用詞、排列順序相同,就可以被檢測出來。但如果是意義抄襲就比較隱蔽,系統(tǒng)基本無法檢測出來。
(二)檢測手段的改進將一篇待檢測的職稱論文放在未發(fā)論文檢測系統(tǒng)中會發(fā)現(xiàn)全篇皆紅,系統(tǒng)會提示這篇論文和該作者的已發(fā)表的論文重復(fù)率為100%,也就是說未發(fā)論文檢測系統(tǒng)是沒有辦法對已經(jīng)發(fā)表的論文進行檢測的,主要是因為該系統(tǒng)缺少一個時間模塊判定功能,即自動刪除該文章發(fā)表時間以及以后的“相似”論文?;诖耍寻l(fā)論文檢測系統(tǒng)特別設(shè)置了論文發(fā)表時間功能,并要求委托人提供論文的發(fā)表時間。據(jù)此時間,去除了發(fā)表時間在所測論文發(fā)表時間之后(含發(fā)表時間在同一天)的“相似”論文,最終獲得由系統(tǒng)自動生成的“文字復(fù)制比”結(jié)論。這個結(jié)論雖然不包含所測論文發(fā)表時間之后(含發(fā)表時間在同一天)的抄襲結(jié)果判定報告,但是對該文章發(fā)表之前,它是否存在抄襲的現(xiàn)象是可以檢測的,這部分的功能和未發(fā)論文檢測系統(tǒng)是一致的,所以我們可以適當借用未發(fā)論文檢測系統(tǒng)部分適用的研究成果來探討對檢測結(jié)果的判斷。
二、抄襲判斷的量化指標
三、影響職稱論文檢測結(jié)果的因素
(一)提供的待檢測文檔的類型及出處Cnki期刊學術(shù)不端文獻檢測系統(tǒng)目前以“中國學術(shù)期刊網(wǎng)絡(luò)出版總庫”為全文比對數(shù)據(jù)庫,當前,可對DOC、 TXT、CAJ、KDH、NH、PDF等多種格式的文件進行比對,從詞、句子到段落等方面,可檢測抄襲、偽造、一稿多投、篡改、不正當署名、一個成果多篇發(fā)表等多種學術(shù)不端行為。[6]同時,職稱評審文件中規(guī)定:優(yōu)先從圖書館“中國知網(wǎng)CNKI數(shù)據(jù)庫”中下載CAJ或PDF格式電子版論文(專著、譯著、教材及外文刊物上發(fā)表的論文除外)。如未在該數(shù)據(jù)庫中檢索到提交論文,可以從圖書館其他數(shù)據(jù)庫中繼續(xù)查找并下載PDF格式電子版論文,如仍然沒有,方可提供 WORD文檔。提交論文原件和完整論文的電子版(須PDF格式,著作、教材除外)。[7]經(jīng)過筆者的了解,在實際操作中,也是按照這個文件的規(guī)定做的,待檢測文獻的電子文檔,并沒有一定要求使用PDF格式,只要提供的電子文檔能夠正常地從中復(fù)制出文本來,PDF、DOC、CAJ(及其系列文檔類型)、 RTF及DOCX都可以。首先是從cnki學術(shù)網(wǎng)絡(luò)中下載,可是受技術(shù)水平的限制,很多早期的文章是以PDF照片———圖片的形式存在的,不能復(fù)制文本,還有部分編輯部提供的原稿采用了密碼或版權(quán)保護也不能復(fù)制,另外一種情況是由于編輯部新發(fā)論文上網(wǎng)需要一定周期,新發(fā)論文也沒有原始文檔,只能向送檢人索要編輯部的修改文檔,當然,非cnki下載所得的文檔,所有的文檔類型要在檢測匯總表中予以說明。由以上的復(fù)雜情況來看,不同類型、不同情況下提供的電子文檔,在檢測中會出現(xiàn)檢測比例的不同。如一位研究者反映,他在《航空學報》個人比對庫中的一篇文章(.doc格式,為作者提交的錄用定稿)已經(jīng)在中國期刊網(wǎng)上發(fā)布(具體采用的比對文件格式未知),新提交的一篇稿件被檢測出與這2篇文章有文字重合的問題,但檢測結(jié)果中該稿與個人對比庫中的稿件間的文字復(fù)制比為46%,而與同一篇文章在中國期刊網(wǎng)中的版本的文字復(fù)制比為26%,不同的格式竟然造成檢測結(jié)果間20個百分點的差別。[8]可見不同的文檔形式會對檢測結(jié)果產(chǎn)生較大的影響,這種現(xiàn)象需被重視。
(二)第三方檢測模式毋庸置疑,檢測系統(tǒng)在程序上是非常容易操作的,但任何一種程序設(shè)計都會存在一些設(shè)計沒有考慮周全的部分和現(xiàn)有的技術(shù)水平和使用條件無法達到的要求。檢測方式是圖書館的第三方檢測,由于學科的限制,檢測者對文章水平?jīng)]有直觀感受只能信賴軟件,以系統(tǒng)檢測結(jié)果出一份報告。一般來說,檢測者不會對檢測結(jié)果的百分比多少做一個結(jié)論,只是提交結(jié)果,評價者是由職稱管理部門和專家來確定的。當然學術(shù)不端檢測系統(tǒng)是一個初步的檢測,后期還有專家評議一個環(huán)節(jié)來判斷文章的優(yōu)劣。但是對于一些處于臨界值的稿件,如果只是看到其檢測結(jié)果超標就進行清退對被檢測者是不公平的,因為它已經(jīng)沒有資格進入下一道環(huán)節(jié)了。第三方檢測者只是在出具匯總報告時添加的一個說明文字,提示一些具體情況,筆者認為可以使用一些可以共通的原則,對檢測結(jié)果要出具更具體的修正報告,包括剔除系統(tǒng)誤判的部分和系統(tǒng)未發(fā)現(xiàn)問題的部分,為參評者提供公正的服務(wù)。
四、對職稱論文檢測報告的修正
要制定可以通用再研判的標準,首先要搞清楚“文字復(fù)制比”與“文字抄襲率”的關(guān)系,我們通??吹降膶W術(shù)不端檢測系統(tǒng)提供的是“文字復(fù)制比”,但它絕對不等于“文字抄襲率”。“文字復(fù)制比”是系統(tǒng)提供的有抄襲嫌疑的地方,“文字抄襲率”是我們已經(jīng)定性的抄襲的文章的比例,兩者性質(zhì)是截然不同的。[9] 基于此,筆者認為真正的文章抄襲率應(yīng)該如下修正:文章抄襲率=文字復(fù)制比—系統(tǒng)誤判+系統(tǒng)漏判這里,“文字復(fù)制比”是系統(tǒng)提供的百分比,“系統(tǒng)誤判”是指雖然被系統(tǒng)檢測出來有抄襲的嫌疑,但并不能算作抄襲的部分,“系統(tǒng)漏判”是指雖然系統(tǒng)沒有檢測出來,但是存在隱性抄襲的部分。
(一)減掉系統(tǒng)誤判的抄襲率
2.作者誤引了抄襲文字,必要時通知作者申訴。對這點,職稱檢測政策中規(guī)定了“論文中有明確注明為引自其他論文中的內(nèi)容,不計入”。雖然注意到了這種情況,但統(tǒng)統(tǒng)減掉還會有漏網(wǎng)之魚的嫌疑,在后面會具體討論。
畢業(yè)論文中相似的,不計入。博士、碩士論文雖然被收錄到了cnki文獻庫中,但是并不屬于印刷及公開發(fā)表的文章,對這個原因?qū)е碌南嗨票葢?yīng)剔除。(3)與本人論文發(fā)表后,他人引用本人論文中的內(nèi)容,不計入。(4)論文中有明確注明為引自其他論文中的內(nèi)容,不計入。(5)送檢論文中的同一段文字內(nèi)容,和其他多篇文章相似的,則該段文字造成的相似比,按一次計入,不重復(fù)累加。以上幾種條款起到了保駕護航的作用都應(yīng)該在檢測報告中適當刪減,但也有一些情況雖然沒有被系統(tǒng)檢測出,但一旦被查到是要嚴厲指出的。
(二)增補系統(tǒng)漏判的抄襲率:設(shè)定各種抄襲情況的權(quán)重系數(shù)有的文章雖然檢測的抄襲率很低,但是文章若存在以下一些狀況,應(yīng)適當建議增補權(quán)重系數(shù)一項,具體為:
1.有對句義、觀點、主題抄襲現(xiàn)象,無個人觀點,及對外文文獻套改翻譯抄襲等。這種抄襲手段隱蔽,比較難發(fā)現(xiàn),性質(zhì)也比較惡劣,對此,可以增加公示環(huán)節(jié),以增強被檢測者間互相監(jiān)督,更有利于發(fā)現(xiàn)比較隱蔽的抄襲,一旦發(fā)現(xiàn)并查實,在所出具的報告中應(yīng)明確指出:對檢測結(jié)果乘以適度的權(quán)重系數(shù),以增加其抄襲率。
3.論文中有明確注明為引自其他論文中的內(nèi)容,不計入,在實際的檢測過程中會發(fā)現(xiàn)有的作者明明沒有引用,也亂標參考文獻引用以顯示所看論文數(shù)量較多,對這種情況,發(fā)現(xiàn)了一定要在檢測報告中明確指出。
4.文章的后部重合度(ER)項較高,即在文章中的“解決問題”部分和文章的核心句子部分抄襲率較高,但全文抄襲率較低。這種情況應(yīng)視情況加一個權(quán)重系數(shù),拉高全文的抄襲率,因為文章核心部分的抄襲性質(zhì)比較嚴重。這一定要在出具的檢測報告中明確指出。Cnki檢測系統(tǒng)是智能很強的系統(tǒng),能幫助檢測者高效檢測稿件,但是,稿件的情況非常復(fù)雜,應(yīng)該具體情況具體分析,對檢測所出具的報告一定要慎重,準確判斷報告中哪些是依據(jù)原則要減掉的系統(tǒng)誤判百分比,哪些是要增加或建議加重權(quán)重的抄襲率,建議有關(guān)部門盡快做出統(tǒng)一的標準供檢測者操作。另外對檢測結(jié)果要實行公示制度和作者申辯制度,有利于發(fā)現(xiàn)比較隱蔽的抄襲,以做到對檢測結(jié)果的完全的公正和客觀。
職稱論文相關(guān)文章: