无论是期刊论文还是毕业论文,重复率达标都是最基本的要求,不同期刊重复率要求不一样,但是必须要达标。所以论文写完之后都会涉及到查重的问题。
现在的查重平台很多,比如主流的知网、万方、维普,还有比如大雅、PaperPass等一些平台,但是问题就出现在不同平台的查重结果往往不一致,而且差异还不小。
造成不同的差异,有以下几点
1. 数据对比库的差异
论文查重无非就是将要查重的论文和数据库中的已有论文进行对比,从而检测论文重复情况,所以数据库中的论文数量对查重结果起着关键性作用,数据库越全,相应的查重结果也就越可靠。而要获取数据的使用权限,都是需要向各大数据库付费的,所以不同查重平台所用的对比数据库都是不太齐全的,这就是导致差异的原因之一。目前国内普遍比较认可的是知网数据库,知网的对比库有知网学术期刊网络出版总库、大学生论文联合对比库等大小十多个数据对比库,因而数据库比较大,这也是为什么知网查重耗时长的原因。而其他查重平台的对比库数量相比于知网来说不太齐全,比如维普、万方等软件系统的数据对比库相对会少一些。
2. 数据库更新速度的差异
同样一篇论文,三年前和三年后的查重率八成都是会有差异的,这是因为各大对比数据库都在不断的更新,有更多的论文数据被录入到数据库中了,因而会影响论文的查重率,所以数据库更新速度也是会影响论文的查重率的。通常来说,数据库更新的越快,查重出来的准确度就越高。假如一篇论文抄袭了的是近两个月的论文数据,那么检测系统是检测不出来的。知网在一众查重软件当中,更新速度是比较快的。一年会更新两次,而其他网站,可能两年甚至三年才会更新一次数据库,那么这类软件查重出来的结果就不够准确了。
3. 检测算法的差异
除了对比数据库的影响,还有一个很关键的影响因素就是重复率的检测算法,就是一段内容和已有数据库的论文内容相似,但又不完全相同时,重复率应该如何计算。知网系统检测标准是内容中有12个字连续与对比库中的数据重复,那么这段文字就会被判定为抄袭内容。维普、万方等也是基本是以字符数来计算的,只是标准有所差异。但是一些其他平台可能采用的是不同的检测算法,如PaperPass是根据相似度来判定内容是否为抄袭,比如当论文一句话与对比库中内容相似度达到40%的时候,系统就会判定这句话被抄袭了,对比来看会比知网等平台的检测算法严格一些,这也就是为什么PaperPass的查重结果往往会高出其他主流平台很多的原因。
以上就是关于不同平台查重重复率差异的原因分享。其实每个平台所出的查重报告都是有依据的,没有绝对的好坏之分,主要是看自己论文最终的检测标准。
我们建议,鉴于不同平台的查重存在差异,各位需要检测论文重复率的话,还是尽量用最终检测标准的平台去做检测,以避免平台差异导致一些不必要的麻烦。比如发表期刊被哪一个数据库收录,尽量就用哪一个数据库来检测。如果还没有确定发表具体期刊的时候,那么在发表之前尽量用知网检测平台做一下重复率检测。