Please enable JavaScript.
Coggle requires JavaScript to display documents.
Tracker, :red_flag:只关注目标信息,而忽略了背景信息 建模过程复杂,无法做到较好的实时性, 速度快 相关滤波类方法对快速变形和…
Tracker
判别式方法
图像特征+机器学习训练分类器
分类问题
深度学习
CNN-SVM
1.使用VGG-16的Conv4-3用来区分背景相似物体,Conv5-3用来捕捉类别信息。
2.构建特征提取网络sel-CNN选取与目标相关的特征图通道,生成热度图。
3.选取热度图生成最终跟踪结果
FCNT(2015)达到有效抑制distractor防止跟踪器漂移,同时对目标本身的形变更加鲁棒的效果。对遮挡的表现不是很鲁棒
1.应用多个有标注的视频预序列训练共享特征提取器
2.在测试阶段,训练一个新的二分类层并微调特征提取器
通过这种方式得到有别于分类任务而更适用于追踪任务的CNN
MDNET(2015)在Accuracy和Robustness上有所提升,但这时基于CNN的Tracker还不能达到实时处理
针对MDNET时间和空间方面具有很高的计算复杂度,相似目标不敏感的问题做出改进
用改进的RoIAlign来从特征图中提取目标候选,并改善目标定位。学习一个嵌入空间来区分跨多个域的具有相似语义信息的目标。
RT-MDNET(2018)速度提高了25倍,精度几乎相同
1.通过siamese网络同时提取目标(127)
和搜索图像(255)的feature maps
2.通过互相关层得到搜索图像的score map
3.得分最高处对应到搜索图中即为预测位置
SiamFC(2016)解决了以往算法实时性差的问题,例如帧率从MDNET的1fps提升到了58fps
1.只能区分目标和无语义信息的背景,当有语义的物体是背景时,效果不是很好;2.在跟踪阶段不进行tracker的更新,保证了速度损失了精度;3.在long-term tracking中,不能很好应对全遮挡和目标出画挑战。
1.造成问题1的原因是数据不平衡,在训练中增加正样本数,提升泛化能力,同时增加负样本,提升判别力;2.在追踪过程中,以最相似的作为追踪结果,通过非极大值抑制,选出一些干扰物,在后续帧中去掉干扰物的响应;当目标丢失时,启动local-to-global search strategy放大搜索框重新检测目标,可以解决遮挡和出画问题
DaSiamRPN(2018)110fps,相比于SiamFC和ECO等算法在速度和精度上都有所提升
SiamFC不对网络进行在线调整,使用固定标准来比较目标外观会阻止算法学习视频的特点。
将CF的在线学习效率与CNN的离线学习功能相结合,改进了性能。
CFNet(2017)追踪效果和实时性都有所提升
TCNN(2016)
回归问题
相关滤波(CF)
MOSSE(2010)669fps
采用单通道灰度特征,
表征目标的能力有限
增加了密集采样和kernel-trick
CSK(2012)362fps
损失速度,提升精度
扩展了多通道梯度的HOG特征
KCF172fps
同样是损失速度提升精度
2 more items...
尺度滤波+平移滤波分部完成
1 more item...
扩展了多通道颜色特征color names
CN202fps
虽然速度越来越慢
但精度越来越高
2 more items...
生成式方法(2010年之前)
step1:在当前帧对目标区域建模
step2:在下一帧中进行模型匹配
step3:更新追踪器状态
SIFT(2012)、SURF(2008)、MESR(2004)等
更为鲁棒的局部特征用来描述目标,以适应目标在局部的各种尺度和旋转的变化
KLT(1994)
通过匹配角点实现对目标的跟踪。随后工作则考虑采用原始的外观或者颜色作为主要特征来描述目标,或者采用更为复杂的混合方式描述目标
LK光流法(1981)
假定目标灰度在短时间内保持不变,同时目标邻域内的速度向量场变化缓慢
L1跟踪器(2011)
把跟踪看做一个稀疏近似问题,通过求解L1范数最小化问题实现对目标的跟踪
粒子滤波
mean-shift
1、通过颜色分布对目标进行建模;2、计算下一帧的概率分布;3、迭代得到局部最密集的区域。
Cam-shift
:red_flag:
只关注目标信息,而忽略了背景信息
建模过程复杂,无法做到较好的实时性
速度快
相关滤波类方法对快速变形和
快速运动情况的跟踪效果不好