Copyright ?2013-2017 中國(guó)知網(wǎng)論文查重檢測(cè)系統(tǒng)入口 All Rights Reserved. 網(wǎng)站備案號(hào):黔ICP備19012782號(hào)-3.
知網(wǎng)查重目前采用的最先進(jìn)的模糊算法,是以句子為最小單位的,每一句話中連續(xù)13個(gè)字符重復(fù)并且滿足重復(fù)字?jǐn)?shù)達(dá)到該段落的5%時(shí)就會(huì)被記為論文重復(fù)或者抄襲,知網(wǎng)查重算法中有個(gè)靈敏度也就是閥值,一般設(shè)置為5%。 在論文格式正確的前提下,知網(wǎng)查重是能自動(dòng)識(shí)別論文封面、目錄、參考文獻(xiàn)、引用等內(nèi)容的。
目前大多數(shù)學(xué)校用的都是知網(wǎng)的查重軟件來(lái)進(jìn)行定稿,同時(shí)知網(wǎng)的數(shù)據(jù)庫(kù)更新也是最快的,它的算法也是最新的。 首先,它會(huì)將上傳的論文進(jìn)行格式分段檢測(cè),以句子作為最小單位來(lái)進(jìn)行檢測(cè), 一個(gè)句子里面如果有13個(gè)字符重復(fù)的時(shí)候,該句子就會(huì)被標(biāo)紅 。
知網(wǎng)和維普查重準(zhǔn)確率較高,兩次均處于前三名。 由此可見(jiàn)即使是同一個(gè)數(shù)據(jù)庫(kù),不同的文章查重準(zhǔn)確率方面也會(huì)存在波動(dòng)。 究其原因,最關(guān)鍵的還是每個(gè)查重軟件所包含的數(shù)據(jù)庫(kù)不一樣。 接下來(lái),我們就來(lái)看看不同查重軟件的數(shù)據(jù)庫(kù)情況。 再講數(shù)據(jù)庫(kù)之前我們先來(lái)簡(jiǎn)單介紹一下查重軟件之所以能夠檢測(cè)重復(fù)率的基本原理。 每個(gè)查重軟件都會(huì)有自己的對(duì)比庫(kù),上傳進(jìn)行檢測(cè)的論文都會(huì)與對(duì)比庫(kù)中的資料進(jìn)行對(duì)比,來(lái)檢測(cè)論文內(nèi)容是否重復(fù)。 不同查重軟件有不同的對(duì)比庫(kù)數(shù)據(jù)庫(kù),且不同的查重軟件所能調(diào)用的數(shù)據(jù)庫(kù)數(shù)量不同。