------------恢复内容开始------------
[TOC]
核心参考

核心步骤

- 给定视频的原始帧
- 运行对象检测器以获得对象的边界框
- 对于每个检测到的物体,计算出不同的特征,一般为视觉特征和动作特征
- 之后,相似度计算步骤计算两个对象属于同一目标的概率
- 最后,关联步骤为每个对象分配数字ID

核心步骤:检测——特征提取、运动预测——相似度计算——数据关联
检测所最为重要的部分,对最后指标影响最大。
但是,多目标追踪的研究重点又在相似度计算和数据关联这一块。所以就有一个很大的问题:你设计出更好的关联算法可能就提升了0.1个点,但别人用一些针对数据集的trick消除了一些漏检可能就能涨好几个点。所以研究更好的数据关联的回报收益很低。因此多目标追踪这一领域虽然工业界很有用,但学术界里因为指标数据集的一些原因,入坑前一定要三思。
评价指标
- 传统标准,已经没人用了23333
- Clear MOT metrics
\[MOTA =1-\frac{F N+F P+I D S W}{G T} \in(-\infty, 1]
\]
\[MOTP =\frac{\Sigma_{t, i} d_{t, i}}{\Sigma_{t} c_{t}}
\]
MOTA用的最多,但是FN、FP的权重很大,更多检测的是检测的质量,而不是跟踪的效果
- IDscores
$Identification precision: IDP=\frac{I D T P}{I D T P+I D F P} \(
\)Identification recall: IDR=\frac{I D T P}{I D T P+I D F N} \(
\)Identification F1: IDF1 =\frac{2}{\frac{1}{T D P}+\frac{1}{T D R}}=\frac{2 I D T P}{2 I D T P+I D F P+I D F N} $
因为是基于匹配的指标,能够更好的衡量数据的好坏
数据集 Benchmark

MOT相关
原文:https://www.cnblogs.com/kangshuaibo/p/14695802.html