快速体验
本文档将带您快速了解 PaddleLabel 的主要功能及使用流程
创建样例项目
为了方便您快速体验 PaddleLabel,我们内置了一些样例项目。当 PaddleLabel 网页打开后,点击首页左上角“样例项目”按钮,即可进入样例选择页面。
样例页面提供了分类、检测、实例分割、语义分割和 OCR 五种类型的样例项目,点击卡片即可进入相应样例项目的总览。
项目总览
项目总览页面如下
总览页面上方提供了一些项目管理功能
点此查看各功能详细介绍
- 去标注:跳转到标注页面。如果在总览页面的任务列表中进行了排序,标注过程中会保持这一顺序
- 项目设置:修改项目名称和描述
- 划分数据集:对数据集进行训练/验证/测试子集的划分
- 导入额外数据:向当前数据集中导入更多数据
- 导出数据集:将数据集中的图片和标注信息导出
- 自动推理设置:配置 PaddleLabel-ML 选项,使用自动推理模型在项目中进行预标注。预标注功能详细使用文档
标注页面
五种项目中具体标注工具的使用方法将在各类型项目的文档页面介绍。本节主要对标注页面的整体结构进行简介。
在项目总览页面中,点击页面上方或任务右侧的去标注按钮可以跳转到标注页面。
标注页面的介绍以实例分割为例,页面和功能区如下
点此查看各功能区详细介绍
- 标注工具区域可以选择多边形,笔刷,橡皮擦,移动/缩放图片等工具。大多数标注操作支持撤销/重做。每步标注操作完成后都会自动向后端进行保存。最下方清空标注工具可以清除当前图片中的所有标注
- 上一张/下一张按钮在画布两侧,点击可以切换图片
- 标注进度在页面最下方,显示标注进度和当前图片编号
- 展示/推理设置工具栏主要包括对画布中标注元素展示的设置和基于深度学习的自动/交互式模型推理设置。顶部的项目总览按钮可以返回项目总览页面
- 标签/标注列表区域展示当前项目的标签(标注的类别,如分类项目中的类别)和当前图片中的标注(如实例分割中每条标注对应一个实例)。不同项目这一区域的展示的元素有所不同,如分类项目中没有标注列表,OCR 项目中没有标签列表,标注列表中添加了文字内容编辑功能。
数据集划分
在深度学习模型训练过程中,通常会将全部数据划分为训练/验证/测试三个子集。在训练过程中使用训练集数据进行模型训练,使用验证集数据观察模型泛化效果。最后在训练完成后,模型交付前,使用测试集汇报最终模型效果。您可以使用“项目总览”页面顶部“划分数据集”按钮随机划分三个子集,该划分会跟随图像和标注信息一并导出。步骤如下:
- 首先访问项目总览页面
- 点击页面上方“划分数据集”按钮
- 在弹出的窗口输入训练/验证/测试集比例(和需为 100)
- 点击确定,任务列表中的子集列将发生变化,项目中的所有数据将被随机划分入三个子集
导出数据集
完成标注后您可以将数据集导出用于模型训练。导出步骤如下:
-
首先访问项目总览页面
-
点击总览页面顶部“导出数据集”按钮
-
填写导出路径(需要是绝对路径),根据需要选择导出格式,点击导出
导入数据集
样例数据集主要是为了展示 PaddleLabel 功能,大多数情况下会导入自己的数据集进行标注和管理。导入的主要流程如下
- 访问项目首页,PaddleLabel 默认的首页地址是http://localhost:17995。或者您可以在任意页面点击左上角点击飞桨 Logo 返回首页。
- 点击创建项目区域的任一卡片,创建对应类型的项目。这里以分类项目为例,导入刚才导出的项目
- 在创建项目页面填写项目名称,注意不要和已有项目重名
- 选择一个跟待导入数据集最接近的项目类型/数据集格式。选择后右侧区域会显示样例数据集文件排布作为参考。如果待导入的数据集不包含标注信息,请选择“无标签”,这种情况下数据集路径下所有的图片文件都将被作为标注任务导入
- 填写“数据集路径”,该路径是到一个文件夹的绝对路径,为了避免导入过程中遇到问题,请将文件夹中的文件尽可能按右侧示例进行排布。点击右侧示例中的文件可以查看文件内容格式
- 点击创建,成功后会跳转到标注页面
下一步
恭喜您完成快速开始章节!您已经掌握了 PaddleLabel 的基本使用方法,下一步您可以在进行标注页面选择要标注的项目类型,详细了解该类型项目的数据集格式,标注方法和深度学习辅助标注配置方法。