focalnet专题

YOLOv9改进策略：注意力机制 | FocalNet焦点调制注意力取代自注意力

💡💡💡本文改进内容：由于自注意力二次的计算复杂度效率较低，尤其是对于高分辨率输入。因此，作者提出了focal modulation network（FocalNet）使用焦点调制模块来取代自注意力。改进结构图如下：《YOLOv9魔术师专栏》将从以下各个方向进行创新：【原创自研模块】【多组合点优化】【注意力机制】【卷积魔改】【block&多尺度融合结合】【损失&I

YOLO算法改进Backbone系列之：FocalNet

摘要：本文提出焦调制网络(FocalNets)，其中自注意(SA)完全被焦调制模块取代，用于建模视觉中的令牌交互。焦点调制包括三个组成部分：（1）焦点上下文化，使用深度卷积层堆栈实现，从短范围到长范围对视觉上下文进行编码；（2）门控聚合，选择性地将上下文收集到每个查询令牌的调制器中；（3）元素智能仿射变换，将调制器注入查询中。大量的实验表明，FocalNets具有非凡的可解释性，并且在图像分类、目

目标检测算法改进系列之Backbone替换为FocalNet

FocalNet 近些年，Transformers在自然语言处理、图像分类、目标检测和图像分割上均取得了较大的成功，归根结底是自注意力（SA ：self-attention）起到了关键性的作用，因此能够支持输入信息的全局交互。但是由于视觉tokens的大量存在，自注意力的计算复杂度高，尤其是在高分辨的输入时，因此针对该缺陷，论文《Focal Modulation Networks》提出了Foca