python如何判断文件夹内的重复图片
python如何判断文件夹内的重复图片
步骤
1、首先将所有的图片按照图片大小(byte)进行分类,然后再进行分类比较。
2、重复图片很有可能连续出现(因为重复图片大小相同)
如果要判断文件夹中是否有相同的图片,则需要对文件夹中的所有图片进行分类,并逐一判断两张图片是否相同。
如果文件夹中有1000张图片,则第一张图片需要与剩余的999张图片进行比较,第二张图片需要与剩余的998张图片进行比较,第三张图片需要与剩余的997张图片进行比较,以此类推。
实例
if__name__=='__main__':
load_path='E:\\测试图片集(未去重)'#要去重的文件夹
save_path='E:\\测试图片集(重复照片)'#空文件夹,用于存储检测到的重复的照片
os.makedirs(save_path,exist_ok=True)
#获取图片列表file_map,字典{文件路径filename:文件大小image_size}
file_map={}
image_size=0
#遍历filePath下的文件、文件夹(包括子目录)
forparent,dirnames,filenamesinos.walk(load_path):
#fordirnameindirnames:
#print('parentis%s,dirnameis%s'%(parent,dirname))
forfilenameinfilenames:
#print('parentis%s,filenameis%s'%(parent,filename))
#print('thefullnameofthefileis%s'%os.path.join(parent,filename))
image_size=os.path.getsize(os.path.join(parent,filename))
file_map.setdefault(os.path.join(parent,filename),image_size)
#获取的图片列表按文件大小image_size排序
file_map=sorted(file_map.items(),key=lambdad:d[1],reverse=False)
file_list=[]
forfilename,image_sizeinfile_map:
file_list.append(filename)
#取出重复的图片
file_repeat=[]
forcurrIndex,filenameinenumerate(file_list):
dir_image1=file_list[currIndex]
dir_image2=file_list[currIndex+1]
result=比较两张图片是否相同(dir_image1,dir_image2)
if(result=="两张图相同"):
file_repeat.append(file_list[currIndex+1])
print("\n相同的图片:",file_list[currIndex],file_list[currIndex+1])
else:
print('\n不同的图片:',file_list[currIndex],file_list[currIndex+1])
currIndex+=1
ifcurrIndex>=len(file_list)-1:
break
#将重复的图片移动到新的文件夹,实现对原文件夹降重
forimageinfile_repeat:
shutil.move(image,save_path)
print("正在移除重复照片:",image)
以上就是python判断文件夹内的重复图片的方法,希望对大家有所帮助。更多Python学习教程请关注IT培训机构:千锋教育。
猜你喜欢LIKE
相关推荐HOT
更多>>python中如何dataframe转换为ndarray?
python中如何dataframe转换为ndarray?小编介绍过python中ndarray与series如何相互转换的方法,其实Series转换为ndarray是一个一维数组,作为pan...详情>>
2023-11-14 05:21:25python中os.remove()的使用注意
python中os.remove()的使用注意计算机一般来说是需要定期的清理,系统的内存不能延伸,同时有一些不需要的文件也可以得以清除掉。有些人会使用o...详情>>
2023-11-14 04:47:11python元组的优势有哪些
python元组的优势有哪些本文教程操作环境:windows7系统、Python3.9.1,DELLG3电脑。1、因为元素不可变性,它可以作为哈希类型的key值。这样使...详情>>
2023-11-14 03:55:04python如何获取当前文件的部分信息?
python中如何获取当前文件的部分信息?一、文件对象常用的属性1、file.name:文件的名称2、file.mode:打开文件时,采用的文件打开模式3、file.e...详情>>
2023-11-14 03:24:14热门推荐
python中如何应用视图函数?
沸python根据键值(value)返回键(key)
热python中pickle模块是什么?
热python解析json文件方法
新python中如何dataframe转换为ndarray?
python中os.remove()的使用注意
Python中if嵌套是什么?
python元组的优势有哪些
python如何获取当前文件的部分信息?
Python使用平面文件进行存储
python中remove()方法如何使用删除后的值?
python如何使用RE正则表达检验字符串
pythonSelenium操作Cookie的方法
python类方法的注意点