Descriere: YOLO este un algoritm specializat pe detecția și recunoașterea de obiecte în imagini. A apărut prima oară în 2016, fiind creat de către Joseph Redmon, iar de-a lungul timpului a fost eficientizat într-o manieră iterativă, ajungând la versiunea 5.
YOLO folosește deep learning pentru a învăța reprezentările obiectelor în imagine. Modelul este format din mai multe rețele neuronale specializate pe înțelegerea imaginilor (VGG, ResNet, MobileNet etc), detecția obiectelor prin trasarea unor dreptunghiuri peste fiecare obiect și în final o rețea care realizează clasificarea imaginilor din dreptunghiuri.
YOLOv5 prezintă mai multe arhitecturi (small, medium, large, xlarge). Acestea pot fi folosite în funcție de problema pe care dorim sa o rezolvam. Dimensiunea arhitecturilor variază de la 15 MB la 170 MB.
- Redmon, J. , Divvala, S. , Girshick, R. , & Farhadi, A. . (2016). You only look once: unified, real-time object detection.
- Bochkovskiy, A. , Wang, C. Y. , & Liao, H. . (2020). Yolov4: optimal speed and accuracy of object detection.