解析VOC数据label的xml文件转为自己用的格式

2019-11-27 09:50:31   机器学习

很多时候我们需要将voc标准的格式转为我们自己代码用的格式,所以如何转换呢,我们知道原始的voc数据label都是xml格式的,这就需要我们需要解析xml,解析后再整理成我们需要的格式就好了

#!/usr/bin/python
# -*- coding: UTF-8 -*-

try:
    import xml.etree.cElementTree as ET  #解析xml的c语言版的模块
except ImportError:
    import xml.etree.ElementTree as ET

##get object annotation bndbox loc start 
def parse(annotation_path):#AnotPath VOC标注文件路径
    tree = ET.ElementTree(file=annotation_path)  #打开文件,解析成一棵树型结构
    root = tree.getroot()#获取树型结构的根
    obj_set=root.findall('object')#找到文件中所有含有object关键字的地方,这些地方含有标注目标
    obj_bndbox_set={} #以目标类别为关键字,目标框为值组成的字典结构
    for obj in obj_set:
        obj_name=obj.find('name').text
        bndbox=obj.find('bndbox')
        x1 = int(bndbox.find('xmin').text)#-1 #-1是因为程序是按0作为起始位置的
        y1 = int(bndbox.find('ymin').text)#-1
        x2 = int(bndbox.find('xmax').text)#-1
        y2 = int(bndbox.find('ymax').text)#-1
        bndbox_loc=[x1,y1,x2,y2]
        if obj_name in obj_bndbox_set:
            obj_bndbox_set[obj_name].append(bndbox_loc)#如果字典结构中含有这个类别了,那么这个目标框要追加到其值的末尾
        else:
            obj_bndbox_set[obj_name]=[bndbox_loc]#如果字典结构中没有这个类别,那么这个目标框就直接赋值给其值吧
    return obj_bndbox_set
viencoding.com版权所有,允许转载,但转载请注明出处和原文链接: https://viencoding.com/article/245
欢迎小伙伴们在下方评论区留言 ~ O(∩_∩)O
文章对我有帮助, 点此请博主吃包辣条 ~ O(∩_∩)O

猜你喜欢


评论

There are no comments yet.
未登录

登录后即可发表评论

登录或注册

标签

AdSense Anaconda Android apache API apt Auth AWS B-tree Bandwagon Blog bower brew bytes Caffe Catalina certbot Charles cloudcone Composer conda CoreML CPU crontab CSS csv Cuda cv2 datetime Digitalocean DNS Docker Docker-Compose Eloquent Excel export Flask FTP GET Git GitHub GitLab Gmail GoDaddy Google GTM hash Homebrew Homestead HTML http HTTPS IDEA image imagemagick imagick imgick import InnoDB ios iou iPhone ISO8601 iTerm2 Java JavaScript JPG JS Keras Laravel Laravel-Admin lazyload Linux list Livewire lnmp load logs Lravel Mac Markdown matplotlib md5 mix MobileNet Mojave mongo MongoDB MySQL Namesilo Nginx Node npm numpy Nvidia Nvidia-Docker onevps OpenCV Openpose openpyxl oss Outline parse PayPal PHP php-fpm PhpStorm PHP扩展 PIL Pillow pip PNG POST Protobuf PyCharm pyenv pymongo Python Python,人工智能,机器学习,VOC,xml Queue Redis requests RGB Sanctum save selenium SEO Shadowsock Shadowsocks ShadowsocksR simplemde Spring Boot SQLServer ssd SSH ssl SSL证书 SSR str Sublime sudo swap Swift Tensorflow TensorflowLite Terminal Terminator timestamp Ubuntu urllib UTC v2ray Valet Validation Validator VienBlog virtualenvs VPN VPS Vultr Web Windows WordPress Xcode xlsx yaml YAPI YUV zip zmq zsh 上网 下载图片 主从同步 云主机 云存储 云开发 云服务器 人工智能 优化 优惠码 伪原创 作弊与反作弊 免费ss账号 免费提现 切片 前端 加密 协议 博客 友链 双击事件 后台运行 后端 命令 国内镜像源 图标 图片操作 图片转换 域名 多身份认证 大小写转换 姿态检测 安卓模拟器 安装 定时任务 定时执行 密码 密钥 导出导入 小程序码 延迟加载 异常 微信 微信小程序 快捷方式 慢查询 懒加载 提现 搜索引擎 搬瓦工 搭梯子 教程 数据库 数据重复 文件上传 无法登录 日志 日期 时区 时间 时间戳 服务器 机器学习 权限 梯子 模拟浏览器 港版支付宝 漏洞 爬虫 生活服务 用户管理 病毒 登录 目标检测 科学上网 系统升级 索引 组件 组件开发 编辑器 自动付款 自定义组件 英文伪原创 计划任务 计算机视觉 订阅通知 认证 语法 读写分离 远程连接 配置文件 重定向 错误异常 错误提示 队列 阿里云 香港 香港手机号
亲情非友情链接