ViT
创新点:
- transformer在CV首次应用,使用patch划分图片,减少序列长度和注意力计算 知识迁移
- few-shot进行消融实验
ResNet
创新点:
- 提出残差结构,简单的数学认知,按理说不会差,只会好的结构现实中实现不了,就直接定义出确保理论进行的方法,让模型学到上一个的结果,再此基础上尽量学到更多 数学知识
MAE
创新点:
-
BERT结构,使用掩盖生成的方法训练Transformer模型,减少patch计算量 知识迁移
-
自编码器
Swin Transformer
创新点: