An Image Is Worth 16×16 Words: Transformers for Image Recognition at Scale相關資源蒐集

Yanwei Liu

Nov 14, 2020

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

While the Transformer architecture has become the de-facto standard for natural language processing tasks, its…

arxiv.org

google-research/vision_transformer

by Alexey Dosovitskiy†, Lucas Beyer, Alexander Kolesnikov, Dirk Weissenborn, Xiaohua Zhai*, Thomas Unterthiner…

github.com

lucidrains/vit-pytorch

Implementation of Vision Transformer, a simple way to achieve SOTA in vision classification with only a single…

github.com

A Demonstration of Using Vision Transformers in PyTorch: MNIST Handwritten Digit Recognition

A hands-on example (with code) of how one can use the popular PyTorch framework to apply the Vision Transformer to a…

towardsdatascience.com

AI趨勢周報第146期：再見了卷積網路？一篇Transformer匿名論文引起ML社群圍觀

再見了卷積網路，一篇Transformer匿名論文激起ML社群關注一直以來，卷積網路（CNN）是影像辨識的首選，但近日一篇匿名論文（An Image Is Worth 16×16 Words: Transformers for…

www.ithome.com.tw

用Transformer完全替代CNN

（抱歉昨天因为做实验调参鸽了一天QwQ）这里将介绍一篇我认为是比较新颖的一篇文章 --《An Image Is Worth 16X16 Words: Transformers for Image Recognition at Scale》…

zhuanlan.zhihu.com

AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE_Q1u1NG的博客-CSDN博客

论文地址： AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE…

blog.csdn.net

Vision Transformer

Transformer是 nlp领域的常见模型了，在 Attention is All You Need一文中凭借着嚣张的题目和明显的效果席卷了nlp的各个领域。最近CV领域也出现了一些使用Transformer的论文，比如目标检测的…

zhuanlan.zhihu.com

论文阅读：AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

这是一篇投稿ICLR2021的文章。图像对CNN的依赖不是必要的，并且将纯transformer直接应用于图像patch序列可以很好地执行图像分类任务。当对大量数据进行预训练并将其传输到中等大小或较小的图像识别基准（ImageNet，CIF…

52zju.cn

An Image Is Worth 16×16 Words: Transformers for Image Recognition at Scale相關資源蒐集

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

While the Transformer architecture has become the de-facto standard for natural language processing tasks, its…

google-research/vision_transformer

by Alexey Dosovitskiy†, Lucas Beyer, Alexander Kolesnikov, Dirk Weissenborn, Xiaohua Zhai*, Thomas Unterthiner…

lucidrains/vit-pytorch

Implementation of Vision Transformer, a simple way to achieve SOTA in vision classification with only a single…

A Demonstration of Using Vision Transformers in PyTorch: MNIST Handwritten Digit Recognition

A hands-on example (with code) of how one can use the popular PyTorch framework to apply the Vision Transformer to a…

AI趨勢周報第146期：再見了卷積網路？一篇Transformer匿名論文引起ML社群圍觀

再見了卷積網路，一篇Transformer匿名論文激起ML社群關注一直以來，卷積網路（CNN）是影像辨識的首選，但近日一篇匿名論文（An Image Is Worth 16×16 Words: Transformers for…

用Transformer完全替代CNN

（抱歉昨天因为做实验调参鸽了一天QwQ）这里将介绍一篇我认为是比较新颖的一篇文章 --《An Image Is Worth 16X16 Words: Transformers for Image Recognition at Scale》…

AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE_Q1u1NG的博客-CSDN博客

论文地址： AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE…

Vision Transformer

Transformer是 nlp领域的常见模型了，在 Attention is All You Need一文中凭借着嚣张的题目和明显的效果席卷了nlp的各个领域。最近CV领域也出现了一些使用Transformer的论文，比如目标检测的…

论文阅读：AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

这是一篇投稿ICLR2021的文章。图像对CNN的依赖不是必要的，并且将纯transformer直接应用于图像patch序列可以很好地执行图像分类任务。当对大量数据进行预训练并将其传输到中等大小或较小的图像识别基准（ImageNet，CIF…

Written by Yanwei Liu

No responses yet

An Image Is Worth 16×16 Words: Transformers for Image Recognition at Scale相關資源蒐集

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

While the Transformer architecture has become the de-facto standard for natural language processing tasks, its…

google-research/vision_transformer

by Alexey Dosovitskiy*†, Lucas Beyer*, Alexander Kolesnikov*, Dirk Weissenborn*, Xiaohua Zhai*, Thomas Unterthiner…

lucidrains/vit-pytorch

Implementation of Vision Transformer, a simple way to achieve SOTA in vision classification with only a single…

A Demonstration of Using Vision Transformers in PyTorch: MNIST Handwritten Digit Recognition

A hands-on example (with code) of how one can use the popular PyTorch framework to apply the Vision Transformer to a…

AI趨勢周報第146期：再見了卷積網路？一篇Transformer匿名論文引起ML社群圍觀

再見了卷積網路，一篇Transformer匿名論文激起ML社群關注 一直以來，卷積網路（CNN）是影像辨識的首選，但近日一篇匿名論文（An Image Is Worth 16×16 Words: Transformers for…

用Transformer完全替代CNN

（抱歉昨天因为做实验调参鸽了一天QwQ）这里将介绍一篇我认为是比较新颖的一篇文章 --《An Image Is Worth 16X16 Words: Transformers for Image Recognition at Scale》…

AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE_Q1u1NG的博客-CSDN博客

论文地址： AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE…

Vision Transformer

Transformer是 nlp领域的常见模型了，在 Attention is All You Need一文中凭借着嚣张的题目和明显的效果席卷了nlp的各个领域。最近CV领域也出现了一些使用Transformer的论文，比如目标检测的…

论文阅读：AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

这是一篇投稿ICLR2021的文章。图像对CNN的依赖不是必要的，并且将纯transformer直接应用于图像patch序列可以很好地执行图像分类任务。当对大量数据进行预训练并将其传输到中等大小或较小的图像识别基准（ImageNet，CIF…

Written by Yanwei Liu

No responses yet

by Alexey Dosovitskiy†, Lucas Beyer, Alexander Kolesnikov, Dirk Weissenborn, Xiaohua Zhai*, Thomas Unterthiner…

再見了卷積網路，一篇Transformer匿名論文激起ML社群關注一直以來，卷積網路（CNN）是影像辨識的首選，但近日一篇匿名論文（An Image Is Worth 16×16 Words: Transformers for…