失眠网 > 基于Pytorch中的Dataset和Dataloader读取Voc类目标检测数据集

基于Pytorch中的Dataset和Dataloader读取Voc类目标检测数据集

时间：2022-09-22 21:22:44

记录一下使用Dataset和Dataloader读取诸如VOC类目标检测数据集的方法。

目标检测任务核心两点：

1，找到图片中目标的具体位置，使用框标记出来。

2，对找到的目标的种类进行识别。

所以需要读取的数据主要也为两种数据：图片，目标位置信息及种类，而第二类信息一般为.xml文件格式进行存储。

代码实现：

import torchfrom torch.utils.data import Datasets, DataLoaderimport numpy as npimport cv2 # 使用PIL进行图片处理也可以import xml.etree.ElementTree as ET # 用来解析.xml文件# 存储Voc数据集中的类别标签的字典没打全Voc_label = {'aeroplane', 'bycycle', 'bird','boat','bottle','...'}dict_labels = dict(zip(Voc_label, range(len(Voc_label))))class Read_data(Datasets):def __init__(self, root_path):super(Read_data).__init()__self.root_path = root_pathself.img_idx = []self.anno_idx = []self.bbox = []self.obj_name = []train_txt_path = self.root_path + "/ImageSets/存放用于Training 的图片的名称的txt文件"self.img_path = self.root + "/JPEGImage/存放.jpg图片的地址"self.anno_path = self.root + "/Annotations/存放annotation标注.xml文件的地址"train_txt = open(train_txt_path)lines = train_txt.readlnes()for l in lines:name = line.strip().split()[0]self.img_idx.append(self.img_path + name+ '.jpg')self.ano_idx.append(self.ano_path+ name + '.xml')def __getitem__(self, item):img = cv2.imread(self.img_idx[item])height, width, channels = img.shapetargets = ET.parse(self.ano_idx[item])res = [] #存储标注信息即边框左上角和右下角的四个点的坐标信息和目标的类别标签for obj n targets.iter('object'):name = obj.find('name').text.lower().strip()class_idx = dict_classes[name]bbox = obj.find('bndbox')pts = ['xmin', 'ymin', 'xmax', 'ymax']obj_bbox = []for i, pt in enumerate(pts):cur_pt = int(bbox.find(pt))cur_pt = cur_pt/ width if i% 2 ==0 else cur_pt / height # 将坐标做一个线性变换obj_bbox.append(cur_pt)res.append(obj_bbox)res.append(class_idx)return img, resdef __length__(self):data_length = len(self.img_idx)return data_lenth# 开始调用 Read_data类读取数据，并使用Dataloader生成迭代数据为送入模型中做准备Voc_data_path = ' Voc数据集地址'train_data = Read_data(root_path = Voc_data_path)train_loader = DataLoader(train_data, batch_size = 5, shuffle = False)# 可以这样理解：自己定义的Read_data负读取数据，而DataLoader负责按照定义的batch_size指派Read_data去读取#指定数目的数据，然后再进行相应的拼接等其它内部操作。

如果觉得《基于Pytorch中的Dataset和Dataloader读取Voc类目标检测数据集》对你有帮助，请点赞、收藏，并留下你的观点哦！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。