图像标注工具的一些做法

我主要面向图像分类和BoundingBox检测标注,没有考虑图像的语义标注、多边形标注的分割任务等,也没有考虑视频和语音类媒体。

我把(待)标注的数据集成为数据仓库,按照任务分为:
01二类:只包含正样本负样本两个分类;
带删除的01二类:附带一个删除操作将样本剔除;
多类分类:多个分类的分类标注;
单类ROI:单一目标类型的BoundingBox标注;
多类ROI:多类目标的BoundingBox标注,相比单类需要给出每个BBOX的类型了;
多标签ROI:每个BoundingBox可以给定多个标签。

其中,我可以把多个“单类ROI”加上类型合成一个“多类ROI”,这样的话,对于标注多类的任务就可以先拆解成多个单类的任务以减少标注时选择类别的操作。

为了提高操作效率,除了拖曳BoundingBox外,尽量使用键盘完成,比如选择类别标签和提交结果转到上一张下一张等等。具体,就是使用空格和回车键提交结果并转下一张,使用数字键和部分字母键直接给刚拖曳得到的Box赋予类别信息,和游戏一样使用方向键和WASD键来执行转到上一张下一张,甚至还设置了右键提交的选项,拖曳box完成后右键即执行提交。

这些操作优化都是针对正常途径操作的,对于修改操作等提供了到达方式但是没有这些优化操作。

经过这些优化,我自认为这个标注系统的操作还是很高效的,每人一小时甚至可以标注上千张图片。因为提交自动转下一张,这个操作甚至导致我成瘾难以推出任务。

发表评论

电子邮件地址不会被公开。 必填项已用*标注