图像分类数据集|NICO数据集介绍及下载
作者:graviti
发布于 1/29/2021

一、NICO数据集介绍

NICO(Non-I.I.D. Image dataset with Contexts)

发布方:清华大学媒体与网络技术教育部——微软重点实验室

数据集大小:16.56GB

高速下载NICO数据集:https://www.graviti.cn/open-datasets/NICO

相关论文:Towards Non-IID Image Classification: A Dataset and Baseline

NICO数据集是清华大学计算机系崔鹏团队构建的一个新型的具有跨数据集泛化性指标的数据集。

该数据集基本用主体对象和上下文来标记图像。 例如,在“狗”的类别中,图像被标记为不同的上下文,例如“草地”,“汽车”,“海滩”,这意味着“狗”分别位于“草地”,“汽车”或“海滩”上。有了这些上下文,就可以轻松设计出Non-I.I.D(非独立同分布)的实验场景数据集。

同时,通过调整训练和测试的数据中不同上下文的比例,可以灵活地控制分布偏移的程度。

NICO数据集包含有两个父类别:动物和车辆,其中动物有10个子类别,车辆有9个子类别,188个上下文,总共25,000多张图像。

数据集规模还在持续增加,目前的数据集规模已足够支持从头开始进行深度卷积网络的训练。

二、NICO数据集下载

针对海外数据获取难、下载慢的问题,Graviti给出了一站式解决方案——将全球资源Host至国内镜像,无需VPN访问即可享受高速下载。

  1. 点击进入Graviti-Open Datasets,搜索NICO,点击「获取数据集

2. 点击「确认」,将NICO数据集添加到「我的公开数据集

3. 添加后,系统将自动跳转至GAS控制台,点击进入「NICO数据集

4. 选择「下载」,

三、更多图像分类数据集推荐

  1. Animals with attributes 2数据集

涵盖50种动物类别的37322幅图像,同时提供了预先提取好的样本特征以及属性列表,该数据集可用于迁移学习和zero-shot学习。

数据集访问&下载链接:Animals with attributes 2

2. Oxford-IIIT Pet数据集

涵盖37个宠物类别,每个类别大约有200张图像。这些图像在比例、姿势和照明方面有很大的差异。所有的图像都有真值(Ground Truth)标注,这些真值标注包括关于动物品种,头部ROI,和像素级的三元分割图。

数据集访问&下载链接Oxford-IIIT Pet

3. Fish Recognition Ground-Truth

数据集介绍:数据是从实时视频数据集中获取的,由此产生了27370个可识别的鱼图像。 数据集可分为23个聚类,每个聚类由一个有代表性的物种表示。

数据集访问&下载链接Fish Recognition Ground-Truth

分享到:
立即开始构建AI