三分鐘教會你用Python+OpenCV批量裁剪xml格式標註的圖片
前言
在目標檢測中,數據集常常使用labelimg標註,會生成xml文件。本文旨在根據xml標註文件來裁剪目標,以達到去除背景信息的目的。
xml文件格式
以下是一個標註好的圖片生成的xml文件。具體含義見代碼註釋。
<annotation> <!--xml所屬文件夾--> <folder>JPEGImages</folder> <!--對應圖片所屬文件夾--> <filename>408.bmp</filename> <path>E:\JPEGImages\408.bmp</path> <source> <database>Unknown</database> </source> <size> <!--整張圖片寬,高,3通道彩色--> <width>413</width> <height>342</height> <depth>3</depth> </size> <segmented>0</segmented> <object> <!--標註的目標,一共5個框--> <name>bad_part</name> <!--名稱,也就是類別--> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <!--坐標,左上,左下,右上,右下--> <xmin>339</xmin> <ymin>103</ymin> <xmax>398</xmax> <ymax>173</ymax> </bndbox> </object> <object> <name>bad_part</name> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <xmin>265</xmin> <ymin>15</ymin> <xmax>364</xmax> <ymax>74</ymax> </bndbox> </object> <object> <name>bad_part</name> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <xmin>118</xmin> <ymin>33</ymin> <xmax>195</xmax> <ymax>52</ymax> </bndbox> </object> <object> <name>bad_part</name> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <xmin>113</xmin> <ymin>103</ymin> <xmax>177</xmax> <ymax>147</ymax> </bndbox> </object> <object> <name>bad_part</name> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <xmin>224</xmin> <ymin>298</ymin> <xmax>287</xmax> <ymax>326</ymax> </bndbox> </object> </annotation>
代碼思想
- 獲取到標簽文件路徑和圖片文件路徑;
- 遍歷圖片文件夾獲取到圖片,並分割文件名;
- 根據圖片的文件名加後綴xml得到具體的標簽文件;
- 通過xml.etree.ElementTree讀取xml文件;
- 遍歷所有的目標框,獲取到[
- 通過cv2裁剪目標(先高後寬 參考文章:https://www.jb51.net/article/211183.htm中的第二中裁剪方法);
- 將裁剪好的圖片保存到指定文件目錄。
完整代碼
''' 根據xml標簽裁剪目標 1.文件夾中可以有除瞭圖片格式或標簽格式的文件,有判斷可以忽略其他文件 2.圖片未標註沒有對應的xml文件自動忽略不會報錯 3.同一個圖片有多個真實框,會按名稱_0,名稱_1 …… 排列 4.圖片本身的命名無規律會按3中的命名規則加上名稱後綴重新命名。 ''' import cv2 import xml.etree.ElementTree as ET import os img_path = r'E:/JPEGImages' #圖片路徑 xml_path = r'E:/Annotations' #標簽路徑 obj_img_path = r'E:/cut' #目標裁剪圖片存放路徑 for img_file in os.listdir(img_path): #遍歷圖片文件夾 if img_file[-4:] in ['.bmp', '.jpg','.png']: #判斷文件是否為圖片格式 img_filename = os.path.join(img_path, img_file) #將圖片路徑與圖片名進行拼接 img_cv = cv2.imread(img_filename) #讀取圖片 img_name = (os.path.splitext(img_file)[0]) #分割出圖片名,如“000.png” 圖片名為“000” xml_name = xml_path + '\\' + '%s.xml'%img_name #利用標簽路徑、圖片名、xml後綴拼接出完整的標簽路徑名 if os.path.exists(xml_name): #判斷與圖片同名的標簽是否存在,因為圖片不一定每張都打標 root = ET.parse(xml_name).getroot() #利用ET讀取xml文件 count = 0 #目標框個數統計,防止目標文件覆蓋 for obj in root.iter('object'): #遍歷所有目標框 name = obj.find('name').text #獲取目標框名稱,即label名 xmlbox = obj.find('bndbox') #找到框目標 x0 = xmlbox.find('xmin').text #將框目標的四個頂點坐標取出 y0 = xmlbox.find('ymin').text x1 = xmlbox.find('xmax').text y1 = xmlbox.find('ymax').text obj_img = img_cv[int(y0):int(y1), int(x0):int(x1)] #cv2裁剪出目標框中的圖片 cv2.imwrite(obj_img_path + '\\' + '%s_%s'%(img_name, count) + '.jpg', obj_img) #保存裁剪圖片 count += 1 #目標框統計值自增1 print("裁剪完成!")
效果展示
總結
- ET解析樹基本上是xml標註文件必備的解析庫。
- labelimg→ \rightarrow→xml→ \rightarrow→VOC數據集
- labelme→ \rightarrow→json→ \rightarrow→COCO數據集
- json是字典形式,內存小;xml是DTD文檔,格式統一跨平臺
- 去除背景信息是很重要的一環,可以避免模型監督學習時學習到相似的錯誤信息。
到此這篇關於用Python+OpenCV批量裁剪xml格式標註圖片的文章就介紹到這瞭,更多相關Python+OpenCV批量裁剪xml格式圖片內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- python批量修改xml文件中的信息
- C++中TinyXML讀取xml文件用法詳解
- python之json文件轉xml文件案例講解
- python 生成xml文件,以及美化的實例代碼
- darknet框架中YOLOv3對數據集進行訓練和預測詳解