Python影像辨識筆記(十一):YOLOv4論文閱讀筆記
5 min readApr 25, 2020
YOLOv4屬於One-Stage的Object Detection演算法。一般來說,AP(Average Precision)會比Two-Stage(如:R-CNN、Fast R-CNN、Faster R-CNN....系列)低,但相對的FPS的表現會比較好一些。
然而,在YOLOv4的演算法當中,YOLOv4除了FPS優於Two-Stage外,甚至都超越了Two-Stage的演算法。
以論文摘要中的Performance說明為例:
目前在Tesla V100的GPU上,使用MS COCO資料集,已經達到了接近65 FPS的表現,而且還有著43.5% AP (65.7% AP50),已經完全超過R-CNN家族了。
或許在未來不斷優化下,Two-Stage有被消失的可能。
論文連結
由於原作者因為一些因素,不再繼續維護darknet的關係,改由俄羅斯的AlexeyAB接續維護。
值得一提的是:在這次的論文當中,三位作者中有兩位是台灣中研院資訊科學研究所的研究人員。
別人寫的筆記