千锋教育-做有情怀、有良心、有品质的职业教育机构

400-811-9990
手机站
千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

领取全套视频
千锋教育

关注千锋学习站小程序
随时随地免费学习课程

上海
  • 北京
  • 郑州
  • 武汉
  • 成都
  • 西安
  • 沈阳
  • 广州
  • 南京
  • 深圳
  • 大连
  • 青岛
  • 杭州
  • 重庆
当前位置:南京千锋IT培训  >  技术干货  >  python如何判断文件夹内的重复图片

python如何判断文件夹内的重复图片

来源:千锋教育
发布人:xqq
时间: 2023-11-09 20:51:49

python如何判断文件夹内的重复图片

步骤

1、首先将所有的图片按照图片大小(byte)进行分类,然后再进行分类比较。

2、重复图片很有可能连续出现(因为重复图片大小相同)

如果要判断文件夹中是否有相同的图片,则需要对文件夹中的所有图片进行分类,并逐一判断两张图片是否相同。

如果文件夹中有1000张图片,则第一张图片需要与剩余的999张图片进行比较,第二张图片需要与剩余的998张图片进行比较,第三张图片需要与剩余的997张图片进行比较,以此类推。

实例

if__name__=='__main__':

load_path='E:\\测试图片集(未去重)'#要去重的文件夹

save_path='E:\\测试图片集(重复照片)'#空文件夹,用于存储检测到的重复的照片

os.makedirs(save_path,exist_ok=True)

#获取图片列表file_map,字典{文件路径filename:文件大小image_size}

file_map={}

image_size=0

#遍历filePath下的文件、文件夹(包括子目录)

forparent,dirnames,filenamesinos.walk(load_path):

#fordirnameindirnames:

#print('parentis%s,dirnameis%s'%(parent,dirname))

forfilenameinfilenames:

#print('parentis%s,filenameis%s'%(parent,filename))

#print('thefullnameofthefileis%s'%os.path.join(parent,filename))

image_size=os.path.getsize(os.path.join(parent,filename))

file_map.setdefault(os.path.join(parent,filename),image_size)

#获取的图片列表按文件大小image_size排序

file_map=sorted(file_map.items(),key=lambdad:d[1],reverse=False)

file_list=[]

forfilename,image_sizeinfile_map:

file_list.append(filename)

#取出重复的图片

file_repeat=[]

forcurrIndex,filenameinenumerate(file_list):

dir_image1=file_list[currIndex]

dir_image2=file_list[currIndex+1]

result=比较两张图片是否相同(dir_image1,dir_image2)

if(result=="两张图相同"):

file_repeat.append(file_list[currIndex+1])

print("\n相同的图片:",file_list[currIndex],file_list[currIndex+1])

else:

print('\n不同的图片:',file_list[currIndex],file_list[currIndex+1])

currIndex+=1

ifcurrIndex>=len(file_list)-1:

break

#将重复的图片移动到新的文件夹,实现对原文件夹降重

forimageinfile_repeat:

shutil.move(image,save_path)

print("正在移除重复照片:",image)

以上就是python判断文件夹内的重复图片的方法,希望对大家有所帮助。更多Python学习教程请关注IT培训机构:千锋教育。

声明:本站稿件版权均属千锋教育所有,未经许可不得擅自转载。

猜你喜欢LIKE

python根据键值(value)返回键(key)

2023-11-14

Python中if嵌套是什么?

2023-11-14

Python使用平面文件进行存储

2023-11-14

最新文章NEW

python中pickle模块是什么?

2023-11-14

python解析json文件方法

2023-11-14

pythonSelenium操作Cookie的方法

2023-11-14

相关推荐HOT

更多>>

快速通道 更多>>

最新开班信息 更多>>

网友热搜 更多>>