FastReID项目中的行人重识别模型基准测试与分析
项目概述
FastReID是一个高效的行人重识别(ReID)框架,提供了多种先进的模型实现和训练方法。本文将详细介绍该项目中提供的各类基准模型及其性能表现,帮助读者理解不同模型架构在主流ReID数据集上的表现差异。
基准模型介绍
1. BoT模型系列
BoT(Bag of Tricks)模型源于论文《Bag of Tricks and A Strong Baseline for Deep Person Re-identification》,是CVPR2019的Oral论文。该模型通过整合多种训练技巧,为行人重识别任务提供了一个强大的基线。
核心特点:
- 结合了多种训练技巧的集成方案
- 提供了稳定且高效的基准性能
- 支持多种骨干网络(R50、R50-ibn、S50、R101-ibn等)
2. AGW模型系列
AGW模型来自《ReID-Survey with a Powerful AGW Baseline》,是在BoT基础上进一步优化的模型。
改进点:
- 引入了更有效的特征提取策略
- 优化了损失函数组合
- 提升了模型对困难样本的识别能力
3. SBS模型系列
SBS(Stronger Baseline)是在BoT基础上的增强版本,包含两大改进方向:
Bag of Freebies(BoF):
- Circle loss:改进的圆形损失函数
- 冻结骨干网络训练策略
- Cutout数据增强和自动数据增强
- 余弦退火学习率衰减
- 软间隔三元组损失
Bag of Specials(BoS):
- 非局部注意力模块
- GeM池化层
4. MGN模型
MGN(Multiple Granularity Network)源自论文《Learning Discriminative Features with Multiple Granularities for Person Re-Identification》,通过多粒度特征学习提升识别性能。
核心创新:
- 多分支网络结构
- 不同粒度的特征提取
- 全局与局部特征的融合
数据集性能对比
1. Market1501数据集
BoT模型表现:
模型变体 | Rank-1 | mAP | mINP |
---|---|---|---|
R50 | 94.4% | 86.1% | 59.4% |
R50-ibn | 94.9% | 87.6% | 64.1% |
S50 | 95.2% | 88.7% | 66.9% |
R101-ibn | 95.4% | 88.9% | 67.4% |
AGW模型表现:
模型变体 | Rank-1 | mAP | mINP |
---|---|---|---|
R50 | 95.3% | 88.2% | 66.3% |
R50-ibn | 95.1% | 88.7% | 67.1% |
S50 | 95.3% | 89.3% | 68.5% |
R101-ibn | 95.5% | 89.5% | 69.5% |
2. DukeMTMC数据集
SBS模型表现:
模型变体 | Rank-1 | mAP | mINP |
---|---|---|---|
R50 | 90.3% | 80.3% | 46.5% |
R50-ibn | 90.8% | 81.2% | 47.0% |
S50 | 91.0% | 81.4% | 47.6% |
R101-ibn | 91.9% | 83.6% | 51.5% |
3. MSMT17数据集
MGN模型表现:
- R50-ibn变体:Rank-1 85.1%,mAP 65.4%,mINP 18.4%
车辆重识别基准
1. VeRi数据集
SBS模型表现:
- R50-ibn变体:Rank-1 97.0%,mAP 81.9%,mINP 46.3%
2. VehicleID数据集
BoT模型表现(10折交叉验证):
测试集规模 | Rank-1 | Rank-5 |
---|---|---|
Small | 86.6% | 97.9% |
Medium | 82.9% | 96.0% |
Large | 80.6% | 93.9% |
3. VERI-Wild数据集
BoT模型表现:
测试集规模 | Rank-1 | mAP | mINP |
---|---|---|---|
Small | 96.4% | 87.7% | 69.2% |
Medium | 95.1% | 83.5% | 61.2% |
Large | 92.5% | 77.3% | 49.8% |
模型选择建议
-
追求最高精度:推荐使用SBS系列的R101-ibn变体,在多个数据集上都表现出最优性能。
-
平衡精度与效率:S50变体在保持较高精度的同时,计算效率优于R101-ibn。
-
车辆重识别任务:BoT系列的R50-ibn变体在VehicleID和VERI-Wild数据集上表现优异。
-
研究多粒度特征:MGN模型适合需要分析多尺度特征的场景。
训练环境说明
所有基准测试结果均在以下环境下获得:
- 硬件:NVIDIA V100 GPU
- 软件:PyTorch 1.6, CUDA 10.1
总结
FastReID项目提供了丰富的行人重识别基准模型,覆盖了从基础BoT到增强版SBS等多种架构。通过对比不同模型在主流数据集上的表现,研究人员和开发者可以根据具体需求选择合适的模型。特别值得注意的是,IBN(Instance Batch Normalization)变体在多数情况下都能带来性能提升,值得在实际应用中优先考虑。