失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 双流网络行为识别-Spatiotemporal Residual Networks for Video Action Recognition-论文阅读

双流网络行为识别-Spatiotemporal Residual Networks for Video Action Recognition-论文阅读

时间:2024-08-04 18:56:11

相关推荐

双流网络行为识别-Spatiotemporal Residual Networks for Video Action Recognition-论文阅读

前几天刚放出来的一篇paper:Spatiotemporal Residual Networks for Video Action Recognition,又将HMDB51数据库和UCF101数据库的精度刷高了。

精度结果如下:

这比之前的tsn网络的结果还要好,之前tsn的结果是:Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

将结果分别都提高了不到1个百分点,可见基于video 的action recognition的确被做的比较好了。

接下来会写一篇关于tsn网络的博文,这里先讲最新的结果的Spatiotemporal Residual

Networks for Video Action Recognition:

原文代码还未更新,地址是:/feichtenhofer/st-resnet

这篇文章使用的网络是何凯明大神的残差网络ResNet,网络结构如下

依然是使用了两个流,但是名字不是取为空间流和时间流,而是运动流(motion stream)和外观流(appearance stream),但是本质不变,运动流接收的输入依然是堆叠的多帧光流灰度图片,为什么是两幅,是因为光流计算后的结果分为x方向的光流和y方向的光流,真正计算的时候也是在同一位置取出x位置L=10帧做计算,y位置L=10做计算,而外观流和原来的空间流一致,接收的输入都是RGB图片,但是这里使用的 双流的两个流之间是有数据交换的,而不是像TSN网络一样在最后的得分进行融合

如果觉得《双流网络行为识别-Spatiotemporal Residual Networks for Video Action Recognition-论文阅读》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。