数据标注
概念与意义
图像数据标注指的是运用人工或自动化手段,对图像里的目标物体、场景环境、属性特征等进行标记和注释的过程。它的意义在于生成带有标签的图像数据集,这些数据集能作为机器学习模型的训练素材,助力模型学会识别和理解图像中的各类元素。
标注的类型与方式
图像数据标注包含多种类型和方式,依据不同的应用场景以及任务要求,可挑选合适的标注形式。下面为你介绍一些常见的图像数据标注类型和方式:
-
目标检测标注:在图像里标记出目标对象的位置和边界框,同时给出该对象的类别标签。这种方式常用于自动驾驶、安防监控等领域。
-
语义分割标注:给图像中的每个像素都标注对应的类别标签,以达成像素级别的分类。该方式在医学图像分析、自动驾驶等领域应用广泛。
-
关键点标注:在图像中标注出目标对象的关键点位置,如人脸的眼角、嘴角等。这种方法常用于人脸识别、姿态估计等领域。
-
多边形标注:使用多边形框标注出图像中的不规则目标物体。这种方法比矩形框标注更精确 ,适用于复杂场景下的目标检测。
-
3D 标注:对图像中的物体进行三维空间中的标注,包括物体的形状、大小、位置等。这种方法常用于自动驾驶、虚拟现实等领域。
标注流程
图像数据标注的流程通常包括以下几个步骤:
1.数据准备:收集需要标注的图像数据,并进行预处理,如图像清洗、格式转换等。
2.制定标注规范:根据任务需求和数据特点,制定详细的标注规范,包括标注目标、标注方法 、标注精度等。
3.标注实施:按照标注规范对图像数据进行标注。标注工作可以由人工完成,也可以使用自动 化标注工具辅助完成。
4.质量控制:对标注结果进行质量控制和验证,确保标注的准确性和一致性。这可以通过抽样 检查、双重标注等方式实现。
5.数据整理与输出:将标注好的图像数据整理成统一格式,并输出为机器学习模型所需的训练 数据集。
标注工具
LabelImg安装与使用
LabelImg 是一款用 Python 编写的开源图像标注工具,其图形界面基于 Qt,简洁易用(尽管是英文版)。该工具主要用于分类和目标检测的数据标注,其注释可以保存为 PASCAL VOC 格式的 XML 文件,这也是 ImageNet 所使用的格式。此外,LabelImg 还支持 COCO 数据集格式。接下来,我们将介绍如何使用 LabelImg 进行目标检测数据标注,以及如何使用 Labelme 进行图像分割数据标注。
安装LabelImg之前必须安装acaconda,acaconda安装请自行查阅。
首先,请进入 conda 虚拟环境终端,并使用以下指令来创建一个新的虚拟环境,将新环境命名为labeling。(注:不建议在 conda 自带的 base 环境里安装)。
(base) C:\Users\Fanjiarong>conda create --name labelimg python=3.9

接着,请激活 labeling 虚拟环境,并在该环境中使用以下指令来安装 LabelImg 工具,等待其自动帮您安装 labelimg 以及 lxml 和 pyqt5。
(base) C:\Users\Fanjiarong>conda activate labelimg
(labeling) C:\Users\Fanjiarong>pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple

在安装好 labeling 的虚拟环境里输入 labelimg,等大约三秒左右出现 labelimg 界面。
(labeling) C:\Users\Fanjiarong>labelImg

labelimg 使用
我们打开需要标注的图片文件夹

并设置标注文件保存的目录(上图中的 Change Save Dir)
然后就开始标注,画框,标记目标的 label,然后按 D 键切换到下一张继续标注,不断重复重复。

标注结果展示:

Labelme****安装与使用
Labelme 是一款图像标注工具,它广泛应用于图像分割、目标检测等任务。该工具提供了多边形、矩形、圆形、多段线、线段以及点等多种标注形式,能够满足各种复杂的绘制需求。此外,Labelme 还支持视频标注功能,并能生成符合 VOC 和 COCO 等格式的数据集。
建议在 Anaconda 虚拟环境中安装 Labelme。
(labelimg) C:\Users\Fanjiarong>pip install labelme -i
https://pypi.tuna.tsinghua.edu.cn/simple

安装完成后,在终端中输入以下指令:
(labelimg) C:\Users\Fanjiarong>labelme
等(大约三秒)就会出现 labelme(界面如下图)

使用 labelme 对图片进行标注。

标注完后的标签文件为 json 文件

图像标注后,生成的 json 文件是保存的分割边界坐标,还需要进一步处理,将描述文件转 换为分割实例图像。才可放入到模型中进行训练
1216

被折叠的 条评论
为什么被折叠?



