Detectron2 是 Facebook AI Research 的下一代库,提供最先进的检测和分割算法。它是 Detectron 和 maskrcnn-benchmark 的后继者。它支持 Facebook 的众多计算机视觉研究项目和生产应用程序。
请参阅安装说明。
请参阅Detectron2 入门,
以及Colab Notebook,
了解基本用法。
请参阅我们的文档,
并参阅projects/,了解一些基于 detectron2 构建的项目。
本文件记录了 2019 年 9 月至 10 月期间使用 detectron2 训练的大量基线模型。
所有数据均在配备 8 块 NVIDIA V100 GPU 和 NVLink 的 Big Basin
服务器上获取。速度数据会定期使用最新的 PyTorch/CUDA/cuDNN 版本进行更新。
您可以使用 detectron2.model_zoo API 从代码中访问这些模型。
除了这些官方基线模型外,您还可以在 projects/ 中找到更多模型。
“名称”列包含配置文件的链接。可以使用 tools/train_net.py
及其对应的 yaml 配置文件,
或 tools/lazyconfig_train_net.py
(适用于 Python 配置文件)来复现模型。
训练速度是整个训练过程的平均值。
我们会根据 detectron2/pytorch 等软件的最新版本持续更新速度,
因此它们可能与 metrics
文件有所不同。
不提供多机作业的训练速度。
推理速度通过 tools/train_net.py --eval-only
或 inference_on_dataset() 测量,
并在 detectron2 中直接使用批量大小 1 进行测量。
使用自定义代码测量可能会带来其他开销。
由于进行了更多优化,实际生产部署通常应该比给定的推理速度更快。
模型 ID 列是为了方便参考而提供的。
为了检查下载文件的完整性,本页面上的任何模型在其文件名中都包含其 md5 前缀。
*您可以在每个模型的“指标”中找到训练曲线和其他统计数据。
train2017
上训练,并在 val2017
上进行评估。为了与 Detectron 的设置进行公平比较,请参阅
Detectron1-Comparisons 进行准确率比较,
以及 benchmarks
进行速度比较。
通常使用在 ImageNet 分类任务上预训练的主干模型进行初始化。以下是可用的主干模型:
请注意,上述模型的格式与 Detectron 提供的格式不同:我们没有将 BatchNorm 融合到仿射层中。
Detectron 格式的预训练模型仍然可以使用。例如:
这些模型在归一化和架构方面需要略有不同的设置。请参阅模型库配置以获取参考。
本文档中可供下载的所有模型均遵循
知识共享署名-相同方式共享 3.0 许可证 的许可。
Name | lr sched |
train time (s/iter) |
inference time (s/im) |
train mem (GB) |
box AP |
model id | download |
---|---|---|---|---|---|---|---|
R50-C4 | 1x | 0.551 | 0.102 | 4.8 | 35.7 | 137257644 | model | metrics |
R50-DC5 | 1x | 0.380 | 0.068 | 5.0 | 37.3 | 137847829 | model | metrics |
R50-FPN | 1x | 0.210 | 0.038 | 3.0 | 37.9 | 137257794 | model | metrics |
R50-C4 | 3x | 0.543 | 0.104 | 4.8 | 38.4 | 137849393 | model | metrics |
R50-DC5 | 3x | 0.378 | 0.070 | 5.0 | 39.0 | 137849425 | model | metrics |
R50-FPN | 3x | 0.209 | 0.038 | 3.0 | 40.2 | 137849458 | model | metrics |
R101-C4 | 3x | 0.619 | 0.139 | 5.9 | 41.1 | 138204752 | model | metrics |
R101-DC5 | 3x | 0.452 | 0.086 | 6.1 | 40.6 | 138204841 | model | metrics |
R101-FPN | 3x | 0.286 | 0.051 | 4.1 | 42.0 | 137851257 | model | metrics |
X101-FPN | 3x | 0.638 | 0.098 | 6.7 | 43.0 | 139173657 | model | metrics |
Name | lr sched |
train time (s/iter) |
inference time (s/im) |
train mem (GB) |
box AP |
model id | download |
---|---|---|---|---|---|---|---|
R50 | 1x | 0.205 | 0.041 | 4.1 | 37.4 | 190397773 | model | metrics |
R50 | 3x | 0.205 | 0.041 | 4.1 | 38.7 | 190397829 | model | metrics |
R101 | 3x | 0.291 | 0.054 | 5.2 | 40.4 | 190397697 | model | metrics |
Name | lr sched |
train time (s/iter) |
inference time (s/im) |
train mem (GB) |
box AP |
prop. AR |
model id | download |
---|---|---|---|---|---|---|---|---|
RPN R50-C4 | 1x | 0.130 | 0.034 | 1.5 | 51.6 | 137258005 | model | metrics | |
RPN R50-FPN | 1x | 0.186 | 0.032 | 2.7 | 58.0 | 137258492 | model | metrics | |
Fast R-CNN R50-FPN | 1x | 0.140 | 0.029 | 2.6 | 37.8 | 137635226 | model | metrics |
Name | lr sched |
train time (s/iter) |
inference time (s/im) |
train mem (GB) |
box AP |
mask AP |
model id | download |
---|---|---|---|---|---|---|---|---|
R50-C4 | 1x | 0.584 | 0.110 | 5.2 | 36.8 | 32.2 | 137259246 | model | metrics |
R50-DC5 | 1x | 0.471 | 0.076 | 6.5 | 38.3 | 34.2 | 137260150 | model | metrics |
R50-FPN | 1x | 0.261 | 0.043 | 3.4 | 38.6 | 35.2 | 137260431 | model | metrics |
R50-C4 | 3x | 0.575 | 0.111 | 5.2 | 39.8 | 34.4 | 137849525 | model | metrics |
R50-DC5 | 3x | 0.470 | 0.076 | 6.5 | 40.0 | 35.9 | 137849551 | model | metrics |
R50-FPN | 3x | 0.261 | 0.043 | 3.4 | 41.0 | 37.2 | 137849600 | model | metrics |
R101-C4 | 3x | 0.652 | 0.145 | 6.3 | 42.6 | 36.7 | 138363239 | model | metrics |
R101-DC5 | 3x | 0.545 | 0.092 | 7.6 | 41.9 | 37.3 | 138363294 | model | metrics |
R101-FPN | 3x | 0.340 | 0.056 | 4.6 | 42.9 | 38.6 | 138205316 | model | metrics |
X101-FPN | 3x | 0.690 | 0.103 | 7.2 | 44.3 | 39.5 | 139653917 | model | metrics |
以下基于 Mask R-CNN 的 COCO 实例分割基线,
是使用更长的训练时间以及大规模抖动生成的,具体方法请参阅 Google 的
简单复制粘贴数据增强 论文。
这些模型使用随机初始化从头开始训练。这些基线的性能超越了
之前的 Mask R-CNN 基线。
下表中,一个 epoch 包含 118,000 张 COCO 图像的训练。
Name | epochs | train time (s/im) |
inference time (s/im) |
box AP |
mask AP |
model id | download |
---|---|---|---|---|---|---|---|
R50-FPN | 100 | 0.376 | 0.069 | 44.6 | 40.3 | 42047764 | model | metrics |
R50-FPN | 200 | 0.376 | 0.069 | 46.3 | 41.7 | 42047638 | model | metrics |
R50-FPN | 400 | 0.376 | 0.069 | 47.4 | 42.5 | 42019571 | model | metrics |
R101-FPN | 100 | 0.518 | 0.073 | 46.4 | 41.6 | 42025812 | model | metrics |
R101-FPN | 200 | 0.518 | 0.073 | 48.0 | 43.1 | 42131867 | model | metrics |
R101-FPN | 400 | 0.518 | 0.073 | 48.9 | 43.7 | 42073830 | model | metrics |
regnetx_4gf_dds_FPN | 100 | 0.474 | 0.071 | 46.0 | 41.3 | 42047771 | model | metrics |
regnetx_4gf_dds_FPN | 200 | 0.474 | 0.071 | 48.1 | 43.1 | 42132721 | model | metrics |
regnetx_4gf_dds_FPN | 400 | 0.474 | 0.071 | 48.6 | 43.5 | 42025447 | model | metrics |
regnety_4gf_dds_FPN | 100 | 0.487 | 0.073 | 46.1 | 41.6 | 42047784 | model | metrics |
regnety_4gf_dds_FPN | 200 | 0.487 | 0.072 | 47.8 | 43.0 | 42047642 | model | metrics |
regnety_4gf_dds_FPN | 400 | 0.487 | 0.072 | 48.2 | 43.3 | 42045954 | model | metrics |
Detectron2 基于 Apache 2.0 许可证 发布。
如果您在研究中使用 Detectron2,或希望引用 Model Zoo 中发布的基线结果,请使用以下 BibTeX 条目。
@misc{wu2019detectron2,
author = {Yuxin Wu and Alexander Kirillov and Francisco Massa and
Wan-Yen Lo and Ross Girshick},
title = {Detectron2},
howpublished = {\url{https://github.com/facebookresearch/detectron2}},
year = {2019}
}