语义分割手动标注
有关数据集导入,导出,训练/验证/测试集划分步骤请参快速开始文档
PaddleLabel 将语义分割和实例分割视为两种项目类型,目前二者之间不支持转换。在语义分割项目中,每个像素有一个分类,表示其为背景或前景中的某一类别。实例分割项目在逐像素分类的基础上给每个像素一个实例 id,即不仅区分像素所属类别,而且区分同一类别下像素属于哪个实例。
PaddleLabel 支持多种分割数据集格式,各种类型的数据集导入后都可以使用多边形和笔刷两种标注工具。数据集导出时
- 如果导出掩膜格式,多边形标注会被转换成掩模格式
- 如果导出多边形格式,会跳过所有掩膜格式标注
数据结构
掩膜格式
v0.1.0+
掩膜格式数据集中图片和掩膜一般都是图片文件,二者需要通过所在文件夹进行区分。创建此类型标注项目时,请将待标注图片放在JPEGImages
文件夹中,将已有标注放在Annotations
文件夹中,数据集路径请填写二者的上层目录(下方示例中的数据集路径
)。
此类型项目可以导入 EISeg 保存的灰度和伪彩色掩膜。不过 EISeg 保存伪彩色掩膜时文件名格式为 图片名_pseudo.png
,导入前需要去掉伪彩色掩膜文件名中的_pseudo
部分,重命名为 图片名.png
。
样例格式如下:
数据集路径
├── Annotations
│ ├── A0001.png
│ ├── B0001.png
│ ├── H0002.png
│ └── ...
├── JPEGImages
│ ├── A0001.jpg
│ ├── B0001.png
│ ├── H0002.bmp
│ └── ...
├── labels.txt
├── test_list.txt
├── train_list.txt
└── val_list.txt
# labels.txt
background
optic_disk - 128 0 0 // 对于伪彩色掩膜,需要按此结构提供每个类别的颜色。灰度掩膜的id默认为从0开始依次递增
COCO 格式
v0.1.0+
COCO 格式的图片和标注对应规则可以参考检测项目中的描述。
样例格式如下:
数据集路径
├── image
│ ├── 0001.jpg
│ ├── 0002.jpg
│ ├── 0003.jpg
│ └── ...
├── train.json
├── val.json
└── test.json
COCO 文件的格式如下:
{
"info": info,
"images": [image],
"annotations": [annotation],
"licenses": [license],
"categories": [category],
}
image{
"id": int,
"width": int,
"height": int,
"file_name": str,
"license": int,
"flickr_url": str,
"coco_url": str,
"date_captured": datetime,
}
annotation{
"id": int,
"image_id": int,
"category_id": int,
"segmentation": RLE or [polygon],
"area": float,
"bbox": [x,y,width,height],
"iscrowd": 0 or 1,
}
category{
"id": int,
"name": str,
"supercategory": str,
"color": str // this feature is specific to PP Label. It's not in the coco spec.
}
数据标注
语义分割项目支持多边形和笔刷/橡皮掩膜标注两种标画工具
多边形标注
- 在右侧“类别列表”中点击选中一个类别,在左侧工具栏中点击“多边形”按钮激活该工具
- 在图像中沿待标注物体的边缘点击,使用多边形包围该物体。完成后
点击鼠标右键结束对该物体的标注
,标注结果将自动保存。这一过程可以重复多次,通常一个多边形只框选一个物体 - 如需要修改多边形顶点可以在左侧工具栏中点击“编辑”,之后拖动顶点位置
- 完成一张图片标注后点击画布两侧的 < > 按钮切换图片
掩膜标注
- 在右侧“类别列表”中点击选中一个类别,在左侧工具栏中点击“笔刷”按钮激活该工具
- 鼠标悬浮在笔刷工具上方时,可以在弹出的悬浮框中调整笔刷大小
- 在图像中使用笔刷标画所有属于该类别的像素。可以使用橡皮擦工具擦除过多的标画。每笔标注会自动保存
- 完成一张图片标画后点击画布两侧 < > 按钮切换图片
下一步
您可以继续浏览交互式分割使用方法了解如何使用 PaddleLabel-ML 提高语义分割标注效率