SVHN数据集介绍及下载
作者:Graviti
发布于 5/31/2021

一、SVHN数据集介绍
发布方:Stanford University

发布时间:2011年

数据格式:Image

数据集大小: 2.46GB

高速下载SVHN数据集:https://gas.graviti.cn/dataset/data-decorators/SVHN

相关论文: Reading Digits in Natural Images with Unsupervised Feature Learning

街景门牌号码(SVHN)数据集是摘自Google街景图像中的门牌号,其风格与MNIST相似(图像的裁剪数字很小),但是包含了更大数量级的标记数据(超过600,000位数字图像),用于一个更加困难,尚未解决的现实问题(识别自然场景图像中的字符数字)

10个类别,数字1~9对应标签1~9,而“0”的标签则为10。

训练集:73257张图像;

测试集:26032张图像。

数据集格式:带有字符级边界框的原始图像。

二、数据说明

1.完整的数字

这些是带有字符级边界框的原始可变分辨率的彩色门牌号图像,如上面的示例图像所示。 (此处的蓝色边界框仅用于说明目的。边界框信息存储在digitStruct.mat中,而不是直接绘制在数据集中的图像上。

每个tar.gz文件都包含png格式的原始图像,以及一个digitStruct.mat文件,可以使用Matlab加载。 digitStruct.mat文件包含一个名为digitStruct的文件,其长度与原始图像的数量相同。 digitStruct中的每个元素都有以下字段:

name是一个字符串,其中包含相应图像的文件名。

bbox是一个结构数组,包含图像中每个数字边界框的位置,大小和标签。

例如:digitStruct(300).bbox(2).height则是第300张图片中第二个数字边界框的高度。

2.剪裁的数据

以类似MNIST的形式展现人物层面的真实。所有数字都已调整到32×32像素的固定分辨率。原始字符边界框在适当的维度上被扩展成方形窗口,这样调整它们的大小到32×32像素不会引入纵横比失真。然而,这种预处理将一些分散注意力的数字引入到感兴趣的数字的侧面。加载mat文件会创建两个变量:X是包含图像的四维矩阵,y是类标签的向量。为了访问图像,X(:,:,:,I)给出了带有类标签的32×32的RGB图像。

三、SVHN数据集高速下载与管理

针对海外数据获取难、下载慢的问题,Graviti给出了一站式解决方案——将全球资源Host至国内镜像,无需VPN访问即可享受高速下载。公开数据集搜索网址https://gas.graviti.cn/open-datasets

1.点击进入Graviti公开数据集-SVHN数据集主页,点击右上角【探索数据集】,并继续点击【下载数据集】。

2.系统自动跳转到【下载数据集】页面,即可进行高速下载。




分享到:
立即开始构建AI