(牛逼的数据集 都有相应的论文的 如coco
iamgenet:分类数据集
coco:目标检测,关键点检测,
研究某个问题,首先花一定的时间探索一下baseline数据集以及关于此数据集的论文。)
这个位置可以通过两种方式定义:
思路:
使用ijson读取json文件遍历
annotation和images唯一的联系就是image-id
1.首先遍历annotation对象,将含person的id的annotation保存到新的对象中;同时保存image_id到一个列表image_list中。
2.对image_list列表去重,然后用这个列表去读取images对象,ID匹配到的保存到新的images数组。
coco中:
检测(包括关键点检测)和分割就是coco数据集
视频动作:找个数据集
多目标跟踪:找个数据集
分类:找个数据集
object detection:
1.common object detection
2.precisly object detection(instance segmentation)
因此,在coco数据集中,做检测和分割只需要下载 instance train/val ---2017之后会新增任务但是原类别的标注是不变的,比如instances标注
关键点检测,需要下载person_keypoints train/val(注释中包含了instance 数据集中的部分注释)
coco2017:
train/val:118K:5k
test:dev/challenge
还发布了120K张无标签的img,方便半监督学习使用。
Please note that:请注意 coco api可以获取并处理annotations
{ }:一个json对象,即一个字典数据结构
[{obj1},{obj2}]:多个字典对象放到列表里,就成了json数组(json对象列表)。
json是指文件类型,json文件类型采用字典数据结构组织数据。
json文件内部就是一个大的dict()
打开json文件时,每个[0][1]...的地方都是一个json数组(即列表)
原文:https://www.cnblogs.com/Henry-ZHAO/p/14259581.html