[自动驾驶][交通标志识别]GTSRB benchmark

迈图娱乐

2018-02-22 14:43:51

德国INI神经计算研究所提供用于交通标志识别领域的两个数据库German Traffic Sign Recognition Benchmark (GTSRB)和 German Traffic Sign Detection Benchmark (GTSDB),分别用于分类和检测,提供于2010和2013,是目前交通标志识别领域常用的benchmark数据库,文本介绍GTSRB;

GTSRB

German Traffic Sign Recognition Benchmark 数据构成:通过车载摄像头在2010年历经三个月,获取10个小时的视频资料,每帧的大小是1360×1024,然后利用NISYS Anvanced Development and Analysis Framework(ADAF)软件进行提取标注等工作,每一个交通标志实例对应唯一的一个视频序列帧,每类交通标志对应多个实例;其中删除小于30帧的序列帧,删除小于9个实例的类,如果一个序列帧大于30帧就随机选取30帧,最终获取了51,840张图片,1,700多实例,共43类,如下图。图片尺寸大小从15×15到222×193,80%小于50*50,每张图由90%的主体交通标志和10%的周边构成,即不用考虑分割的问题,直接对图像进行分类,50%训练,25%验证,25%测试。

上面是不同算法在不同大小图片上的CCR,整体上看所有方法都在小尺寸时表现相对不佳,另外还有一个有意思的现象,人类的在小尺寸的表现低于最优的Committee of 算法介绍:我们看到上面有两个算法不叫出众,一个是top1的committee of CNNs, 一个是top2的Multi-scale1 Multi-scale CNN(Sermanet and LeCun),如下所示,基于LeNet-5的7层结构,将C3输出的卷积特征合并C5一起全连接给F6,C3相对提取的偏局部低级特征,C5相对抽取的是偏全局的高级特征,这就是多尺度Multi-scale的含义,其中输入图像被归一化到32*32;另外在数据处理上构造了一定范围内位置、尺度和角度变化的样本,以增加识别结果的鲁棒性;最后在非线性激活上使用|tanh()| (rectified sigmoid);加了多尺度的特征后应该能缓解上面说的在大尺度下鲁棒性的问题,但从结果上看,还有差点,也许不加更糟糕;