失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 基于Pytorch中的Dataset和Dataloader读取Voc类目标检测数据集

基于Pytorch中的Dataset和Dataloader读取Voc类目标检测数据集

时间:2022-09-22 21:22:44

相关推荐

基于Pytorch中的Dataset和Dataloader读取Voc类目标检测数据集

记录一下使用Dataset和Dataloader读取诸如VOC类目标检测数据集的方法。

目标检测任务核心两点:

1,找到图片中目标的具体位置,使用框标记出来。

2,对找到的目标的种类进行识别。

所以需要读取的数据主要也为两种数据:图片,目标位置信息及种类,而第二类信息一般为.xml文件格式进行存储。

代码实现:

import torchfrom torch.utils.data import Datasets, DataLoaderimport numpy as npimport cv2 # 使用PIL进行图片处理也可以import xml.etree.ElementTree as ET # 用来解析.xml文件# 存储Voc数据集中的类别标签的字典 没打全Voc_label = {'aeroplane', 'bycycle', 'bird','boat','bottle','...'}dict_labels = dict(zip(Voc_label, range(len(Voc_label))))class Read_data(Datasets):def __init__(self, root_path):super(Read_data).__init()__self.root_path = root_pathself.img_idx = []self.anno_idx = []self.bbox = []self.obj_name = []train_txt_path = self.root_path + "/ImageSets/存放用于Training 的图片的名称的txt文件"self.img_path = self.root + "/JPEGImage/存放.jpg图片的地址"self.anno_path = self.root + "/Annotations/存放annotation标注.xml文件的地址"train_txt = open(train_txt_path)lines = train_txt.readlnes()for l in lines:name = line.strip().split()[0]self.img_idx.append(self.img_path + name+ '.jpg')self.ano_idx.append(self.ano_path+ name + '.xml')def __getitem__(self, item):img = cv2.imread(self.img_idx[item])height, width, channels = img.shapetargets = ET.parse(self.ano_idx[item])res = [] #存储标注信息 即边框左上角和右下角的四个点的坐标信息和目标的类别标签for obj n targets.iter('object'):name = obj.find('name').text.lower().strip()class_idx = dict_classes[name]bbox = obj.find('bndbox')pts = ['xmin', 'ymin', 'xmax', 'ymax']obj_bbox = []for i, pt in enumerate(pts):cur_pt = int(bbox.find(pt))cur_pt = cur_pt/ width if i% 2 ==0 else cur_pt / height # 将坐标做一个线性变换obj_bbox.append(cur_pt)res.append(obj_bbox)res.append(class_idx)return img, resdef __length__(self):data_length = len(self.img_idx)return data_lenth# 开始调用 Read_data类读取数据,并使用Dataloader生成迭代数据为送入模型中做准备Voc_data_path = ' Voc数据集地址'train_data = Read_data(root_path = Voc_data_path)train_loader = DataLoader(train_data, batch_size = 5, shuffle = False)# 可以这样理解:自己定义的Read_data负读取数据,而DataLoader负责按照定义的batch_size指派Read_data去读取#指定数目的数据,然后再进行相应的拼接等其它内部操作。

如果觉得《基于Pytorch中的Dataset和Dataloader读取Voc类目标检测数据集》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。