标题:豆丁重复文档实在太多了,系统何不利用md5值来鉴定那些完全相同的文档?

 3071951

1#发表于:2010-05-03 08:21:00  - IP:58.255.*.*

豆丁重复文档实在太多了,系统何不利用md5值来鉴定那些完全相同的文档?

豆丁重复文档实在太多了,

有些文档的页数和大小是完全一致的

系统何不利用md5值来鉴定那些完全相同的文档?

很简单的一个功能,可以解决部分重复的文档

虽然不是什么好主意

无法辨认经过一定修改的文档

但还是有点可行性的。

本主题由 徐明星 于 2010-05-11 11:39:52 移动
 chen604

 

12#发表于:2010-10-13 09:51:38 - IP:124.67.*.*

RE:豆丁重复文档实在太多了,系统何不利用md5值来鉴定那些完全相同的文档?

有同感
 空空道人

 

13#发表于:2010-10-13 16:17:21 - IP:121.76.*.*

RE:豆丁重复文档实在太多了,系统何不利用md5值来鉴定那些完全相同的文档?

好象举报功能比较有用,一举报相关文档就不在搜索首页出现了。  

 docxstone

 

14#发表于:2010-10-14 08:27:29 - IP:220.181.*.*

RE:豆丁重复文档实在太多了,系统何不利用md5值来鉴定那些完全相同的文档?

对于重复的文档建议:
(1)首发者优先
(2)格式不同,内容一样的,如PDF或DOC、PPT内容一样都应该保留,优先保留doc。
(3)设举报功能,对举报者奖励积分或收益。
 大笑浆糊

 

15#发表于:2010-10-22 10:56:23 - IP:116.235.*.*

RE:RE:豆丁重复文档实在太多了,系统何不利用md5值来鉴定那些完全相同的文档?

好象举报功能比较有用,一举报相关文档就不在搜索首页出现了。  

请慎用举报功能。以免报复。
 淘宝

 

16#发表于:2010-10-23 14:19:12 - IP:114.92.*.*

RE:豆丁重复文档实在太多了,系统何不利用md5值来鉴定那些完全相同的文档?

MD5功能到底是什么?
好奇中。。。。
 项目经理4507

 

17#发表于:2010-10-24 08:14:42 - IP:218.18.*.*

RE:豆丁重复文档实在太多了,系统何不利用md5值来鉴定那些完全相同的文档?

大家主意真多啊,佩服佩服一个
 三天打鱼的圣圣

 

18#发表于:2010-10-24 18:05:01 - IP:116.16.*.*

RE:豆丁重复文档实在太多了,系统何不利用md5值来鉴定那些完全相同的文档?

我觉得豆丁能查大小一样,内容一样的.我看过文档名称完全不同的也被查出来了(人做不到的)
 敏感词

 

19#发表于:2010-10-26 16:39:57 - IP:210.83.*.*

RE:RE:豆丁重复文档实在太多了,系统何不利用md5值来鉴定那些完全相同的文档?

我上传的三个文档---“孩子,把你的手给我”“爱弥儿”“窗边的小豆豆”,有两个问题请教(1)“孩子,把你的手给我”---我上传的是pdf格式,现有word格式4篇,txt格式3篇,是重复吗?(2)如果是“爱弥儿”文档既有pdf格式也有txt格式和word格式。(3)“窗边的小豆豆”我上传的是pdf格式与(1)情况相同,请查证。谢谢。

我刚咨询了.算重复.
 yandm

 

20#发表于:2010-10-26 21:47:43 - IP:220.189.*.*

RE:豆丁重复文档实在太多了,系统何不利用md5值来鉴定那些完全相同的文档?

看看,学习
展开帖子列表