1.系统到底怎么查重?「不允许连续13字相同」是真的吗?
经常有人问我,知网是按连续多少字相同来查重?不允许连续13字相同是真的吗?
这是一条最流行、最古老的传言,实际上这是假的。
就这么说吧,按最严格的标准来,就算你每隔7个字就插入-个字,语询不通不说,降重效果也微乎其微。
知网查重系统开发一二十年,每年更新个几次,算法若是真的如此小儿科,那也不会有人苦恼降重的问题了,每句多几个字谁不会。
2.那知网到底怎么查重?
知网采用模糊算法,分段进行查重(识别出章节就按章节分段)。
统计每个段落文字/关键词并与论文库里的文献进行对比,达到-定比率,就把连续重复多的地方标红。
3论文格式影响查重吗?
说实话,会影响。
如果是交学校前最后一次查重,建议排版好再查,确保和提交学校的版本是一致的。
当然这里的格式不是指字体、颜色、行间距等等,驻要是三点:
首先,目录要自动生成,参考文献格式正确,才坏会被标红;
其次,各章节标题是否为标题格式,会改变系统分段,有时对结果影响很大,有同学自己查重合格,重新排版后交到学校查,复轩高了10% ;
最后,关于word和pdf查重,一定要按学校要求来 ,因为结果可能差异很大。
如果两个都允许,首选用word查。因为pdf会查页眉、页脚(脚注),考文献标红的概率大,以及可能出现各种各样的问题。
当整篇文章在字数、结构、内容上有所变化时,系统又可能再次检测出新的抄袭。
即使这个句子或段落自始至终没有改动过,但在修改过程中,它周围的段落或整篇文章有所变化,其所在环境发生变化,最终导致这个段落也被系统识别了。
举个很形象的例子。
举个很实际的例子,一篇文章重复 了3000字,把红字都删掉再检测,大概率不会是0%。
有人又问了,那会不会越改重复率越高,不得改到地久天荒?
不会的。
通常新查出来的标红内容,都是那种本身就是抄的,只是第一次没查出来而已。
把这些都改掉了,复率肯定能降低。
同时也提醒大家,修改后建议都再检测一下,保证和提交学校的是同一版本,才能确保结果一致哦(学校有自建库的话,结果可能会有差异)。