给每个文件生成一个MD5值,来对文件进行加密,是常用的文件校验方法,但是MD5的缺陷就是不能防止碰撞,
所以不同文件生成的MD5可能是相同的,因此就需要进行去重操作。
为方便演示,我用txt文件代替文件夹,用txt文件中的字符串代替文件夹中文件来生成MD5值并进行去重操作。
每个txt文件中有字符串,用于生成MD5值:
然后用代码生成MD5值并输出为文件,打印了一下字符串的数量和MD5的数量,两者是相同的:
生成的MD5文件内容就是128位的MD5值,每个值一行:
接下来对这些MD5进行去重操作,运行程序,会自动生成一个txt文件并将去重后的MD5写入。
到此这篇关于如何利用python生成MD5并去重的文章就介绍到这了,更多相关python生成MD5并去重内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!