573 Followers
·
Follow

Python影像辨識筆記(十一):YOLOv4論文閱讀筆記

YOLOv4屬於One-Stage的Object Detection演算法。一般來說,AP(Average Precision)會比Two-Stage(如:R-CNN、Fast R-CNN、Faster R-CNN....系列)低,但相對的FPS的表現會比較好一些。

然而,在YOLOv4的演算法當中,YOLOv4除了FPS優於Two-Stage外,甚至都超越了Two-Stage的演算法。

以論文摘要中的Performance說明為例:

目前在Tesla V100的GPU上,使用MS COCO資料集,已經達到了接近65 FPS的表現,而且還有著43.5% AP (65.7% AP50),已經完全超過R-CNN家族了。

或許在未來不斷優化下,Two-Stage有被消失的可能。

論文連結

由於原作者因為一些因素,不再繼續維護darknet的關係,改由俄羅斯的AlexeyAB接續維護。

值得一提的是:在這次的論文當中,三位作者中有兩位是台灣中研院資訊科學研究所的研究人員。

別人寫的筆記

GitHub程式碼

目前相關的程式碼都已經於以下的repo發布,依照README文件跟著實作即可。

功能

Yolo v4 COCO - image: 
darknet.exe detector test cfg/coco.data cfg/yolov4.cfg yolov4.weights -thresh 0.25
Output coordinates of objects:
darknet.exe detector test cfg/coco.data yolov4.cfg yolov4.weights -ext_output dog.jpg
Yolo v4 COCO - video:
darknet.exe detector demo cfg/coco.data cfg/yolov4.cfg yolov4.weights -ext_output test.mp4
Yolo v4 COCO - WebCam 0:
darknet.exe detector demo cfg/coco.data cfg/yolov4.cfg yolov4.weights -c 0
Yolo v4 COCO for net-videocam - Smart WebCam:
darknet.exe detector demo cfg/coco.data cfg/yolov4.cfg yolov4.weights http://192.168.0.80:8080/video?dummy=param.mjpg
Yolo v4 - save result videofile res.avi:
darknet.exe detector demo cfg/coco.data cfg/yolov4.cfg yolov4.weights test.mp4 -out_filename res.avi

從上方區塊的指令可以看到,YOLOv4可以

(1)預測圖片

(2)預測影片

(3)輸出物件位置座標

(4)透過電腦的網路視訊攝影機偵測

(5)透過區域網路或遠端的網路視訊攝影機偵測

(6)將預測結果保存成*.avi格式的影片

我還看到一個很強的功能:

在電腦上,將Android手機的鏡頭串流到電腦上,再透過YOLO進行辨識。

https://github.com/AlexeyAB/darknet#for-using-network-video-camera-mjpeg-stream-with-any-android-smartphone

更多細節,請參考論文內容及Github專案的README文件

Written by

Machine Learning / Deep Learning / Python / Flutter cakeresume.com/yanwei-liu

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store