OpenMMLab全新推出算法评测库MMEval

2022 世界人工智能大会（WAIC）期间，上海人工智能实验室发布了基于新一代训练架构MMEngine的视觉算法体系OpenMMLab 2.0，涵盖30多个研究领域的算法库。近日，OpenMMLab团队将各算法库原有评测指标进行集成，全新推出了统一开放的跨框架算法评测库MMEval。

MMEval能够提供计算机视觉各细分方向丰富的评测指标，可支持多种分布式通信库，实现高效准确的分布式评测，并支持多种机器学习框架，根据输入自动分发对应实现。

MMEval的架构

和已有一些开源的算法评测库相比，MMEval对计算机视觉领域评测指标的支持更全面，并能提供跨框架评测。目前，MMEval提供了20多种评测指标，涵盖分类、目标检测、图像分割、点云分割、关键点检测和光流估计等任务。可在文档中查看已支持的评测指标：mmeval.readthedocs.io/zh_CN/latest/get_started/support_matrix.html

【MMEval的安装与使用】

MMEval依赖Python 3.6+，可以通过pip来安装MMEval：pip install mmeval。其评测指标提供两种使用方式，以Accuracy为例：

同时，MMEval还支持分布式评测功能，使用方式可参考教程：mmeval.readthedocs.io/zh_CN/latest/tutorials/dist_evaluation.html

【多分布式通信后端支持】

在评测过程中，通常会以数据并行的形式，在每张卡上推理部分数据集的结果，以加快评测速度。而在每个数据子集上计算得到的结果，往往不能通过简单的求平均与整个数据集的评测结果进行等价。因此，常见的做法是在分布式评测过程中，将每张卡得到的推理结果或指标计算中间结果保存下来，在所有进程中进行all-gather操作，最后再计算整个评测数据集的指标结果。

MMEval所需的分布式通信需求主要有以下两个：

• 将各个进程中保存的评测指标计算中间结果all-gather。

• 将rank 0进程计算得到的指标结果broadcast给所有进程。

为了能够灵活地支持多种分布式通信库，MMEval将上述分布式通信需求抽象定义了一个分布式通信接口BaseDistBackend，其接口设计如下图所示：