<返回更多

苹果开源FastViT:快速卷积Transformer的混合视觉架构

2023-08-16    OSC开源社区
加入收藏

苹果此前在论文《FastViT: A Fast Hybrid Vision Transformer using Structural Reparameterization》中提出的 FastViT 架构已正式开源。

论文地址:https://arxiv.org/pdf/2303.14189.pdf

代码仓库:https://Github.com/Apple/ml-fastvit

FastViT 有机地结合了 CNN 和 Transformer 的优势,无论在精度或者运行效率上均有了稳定的提升。FastViT 引入了一种新的 Token 混合算子,命名为 RepMixer。从名字来看,它结合了结构重新参数化技术。该算子的作用原理是通过消除网络中的 skip connection 来降低内存访问成本。

FastViT 整体框架图:

实验结果表明,FastViT:

参考:https://mp.weixin.qq.com/s/poJur-vOtU2-h2tUe89shA、https://mp.weixin.qq.com/s/uqcWy4sx1NQuqOplsGDUlg

END

关键词:FastViT      点击(6)
声明:本站部分内容来自互联网,如有版权侵犯或其他问题请与我们联系,我们将立即删除或处理。
▍相关推荐
更多FastViT相关>>>