豆丁重复文档实在太多了,
有些文档的页数和大小是完全一致的
系统何不利用md5值来鉴定那些完全相同的文档?
很简单的一个功能,可以解决部分重复的文档
虽然不是什么好主意
无法辨认经过一定修改的文档
但还是有点可行性的。
好象举报功能比较有用,一举报相关文档就不在搜索首页出现了。
我上传的三个文档---“孩子,把你的手给我”“爱弥儿”“窗边的小豆豆”,有两个问题请教(1)“孩子,把你的手给我”---我上传的是pdf格式,现有word格式4篇,txt格式3篇,是重复吗?(2)如果是“爱弥儿”文档既有pdf格式也有txt格式和word格式。(3)“窗边的小豆豆”我上传的是pdf格式与(1)情况相同,请查证。谢谢。
验证码: 看不清楚? 换个图片 请输入“?”代表的数字