graviti
产品公开数据集应用市场解决方案知识库关于我们

常见的图像标注类型(一)

发布于2020-12-23

1. 2D矩形框标注(2D Bounding Box)

矩形框用途广泛、简单明了,是计算机视觉领域最常用的图像标注类型之一。矩形框的目的在于帮助计算机视觉网络定位目标对象,易于创建,只需要指定矩形左上角和右下角的X坐标和Y坐标。

典型用例:

定位道路上的车辆;标记建筑工地物体,以分析工地的安全性;识别杂货店商品以实现结账过程的自动化;检测车辆外部损坏等

2. 3D矩形框标注/3D立方体标注(3D Bounding Box / 3D Cuboid Box)

3D矩形框标注是一种非常强大的图像标注类型,同2D标注框一样,都能帮助分类器找到目标。然而,3D矩形框有长、宽、高三维成像来显示目标深度。锚点一般位于目标边缘,各点之间用线填充。最终目标以三维效果呈现,让计算机视觉系统在三维空间中学会区分体积和位置等特征

典型用例:

无人驾驶车辆和机器人的计算机视觉系统的开发等

3. 图像分类(Image Classification)

矩形框标注指的是在一个图像中标注多个对象,而图像分类则是将整个图像与一个标签关联的过程。图像分类的一个简单例子是标记动物的类别。将这些带标注的图像数据输入计算机视觉模型后,可以让模型了解每种动物特有的视觉特征。理论上讲,该模型将能够把新的未标注动物图像归类到相应的物种类别中。

典型用例:动植物物种分类、零售物品分类、服装分类、手写字体分类等

4. 多边形分割(Polygonal Segmentation)

多边形分割是指在静态图片中,使用多边形框,标注出不规则的目标物体。相对于矩形框标注,多边形分割去除了对象物体周围可能混淆分类器的许多不必要的像素,能够更精准地框定目标,同时对于不规则物体,更具针对性;但也更耗时、成本更高。

典型用例:

为许多在城市景观中不规则形状物体添加标注,如汽车、树木或水池;精确检测水下物体;精准定位汽车;突出显示logo和街道标志等不规则形状的对象(例如卫星和无人机收集的图像中的对象检测)

5. 关键点标注(Keypoint Annotation)

关键点标注是指在规定位置标注上关键点,例如人脸特征点、人体骨骼连接点等,常用来训练面部识别模型以及统计模型。

典型用例:

人脸识别、人体姿态跟踪等

6. 语义分割(Semantic Segmentation)

语义分割是一种将整个图像中的每一个像素与其所对应的类别相关联的图像标注方法,即能将图像中的每个像素归为所属的对象类别。各个像素由语义信息所定义,而图片分类器则为不同的像素归类。

典型用例:

区分无人驾驶中的路段;分析作物,以发现杂草或特定作物类型;细胞检测、血流分析的医学图像识别等

7. 线条标注(Line Annotation)

线条标注涉及线条和样条线的创建,这些线条和样条线主要用于在图像的不同区域之间划定边界。但是当边界对于边界框或其他类型的标注来说太小、太薄而没有意义的话,则使用线标注。

典型用例:

两条线之间指定一个目标区域;指示机器人在哪里放置某些物品;描绘无人驾驶场景中道路上的车道线等