Python影像辨識筆記(十一):YOLOv4論文閱讀筆記

Yanwei Liu
5 min readApr 25, 2020

YOLOv4屬於One-Stage的Object Detection演算法。一般來說,AP(Average Precision)會比Two-Stage(如:R-CNN、Fast R-CNN、Faster R-CNN....系列)低,但相對的FPS的表現會比較好一些。

然而,在YOLOv4的演算法當中,YOLOv4除了FPS優於Two-Stage外,甚至都超越了Two-Stage的演算法。

以論文摘要中的Performance說明為例:

目前在Tesla V100的GPU上,使用MS COCO資料集,已經達到了接近65 FPS的表現,而且還有著43.5% AP (65.7% AP50),已經完全超過R-CNN家族了。

或許在未來不斷優化下,Two-Stage有被消失的可能。

論文連結

由於原作者因為一些因素,不再繼續維護darknet的關係,改由俄羅斯的AlexeyAB接續維護。

值得一提的是:在這次的論文當中,三位作者中有兩位是台灣中研院資訊科學研究所的研究人員。

別人寫的筆記

--

--

No responses yet