PHÁT HIỆN TÀU THUYỀN TỪ KHÔNG ẢNH SỬ DỤNG KIẾN TRÚC YOLO26M: PHÂN TÍCH ĐỊNH LƯỢNG VÀ THỰC NGHIỆM

Phan Thanh Nghị1, , Nguyễn Mạnh Cường1, Trần Đình Lân2
1 Trường Đại học Hàng hải Việt Nam
2 Viện KHCN Năng lượng và Môi trường

Nội dung chính của bài viết

Tóm tắt

Tóm tắt

Phát hiện tàu thuyền giữ vai trò then chốt trong giám sát hàng hải và an ninh vùng biển. Tuy nhiên, đặc thù của ảnh không gian là các đối tượng thường có kích thước nhỏ (chiều cao chỉ chiếm 0.05-0.1 khung hình) và chịu nhiễu lớn từ bề mặt nước. Bài báo này trình bày phương pháp ứng dụng kiến trúc YOLO26m kết hợp với huấn luyện chuyển tiếp để giải quyết bài toán trên. Mô hình được huấn luyện trên bộ dữ liệu “Kaggle Ships in Google Earth” gồm 1293 ảnh, sử dụng GPU Tesla P100. Kết quả thực nghiệm sau 70 epoch cho thấy phương pháp đề xuất có hiệu năng cao với mAP@0.5 đạt 0.971 và mAP@0.5:0.95 đạt 0.766. Bên cạnh đó, mô hình duy trì sự cân bằng tốt giữa Precision (0.96) và Recall (0.92), đồng thời đạt tốc độ suy luận trung bình 14.1 ms/ảnh (tương đương 58.8 FPS). Những kết quả này khẳng định khả năng của YOLO26m trong việc đáp ứng các yêu cầu xử lý thời gian thực cho hệ thống giám sát tự động.

Abstract

Ship detection plays a crucial role in maritime surveillance and coastal security. However, aerial imagery presents significant challenges due to the small size of objects (typically occupying 0.05–0.1 of the frame height) and interference from water surface noise. This paper presents a method applying the YOLO26m architecture combined with transfer learning to address this task. The model was trained on the "Kaggle Ships in Google Earth" dataset comprising 1293 images, utilizing a Tesla P100 GPU. Experimental results after 70 epochs demonstrate superior performance, with a mAP@0.5 of 0.971 and mAP@0.5:0.95 of 0.766. Furthermore, the model maintains a strong balance between Precision (0.96) and Recall (0.92), while achieving an average inference speed of 14.1 ms/image (approximately 58.8 FPS). These results confirm the capability of YOLO26m to meet real-time processing requirements for automated surveillance systems.

Keywords: YOLO26m, Ship Detection, Aerial Imagery, Maritime Surveillance.

Chi tiết bài viết

Tài liệu tham khảo

[1] M. Emara, Y. S. A. Abushawareb, and E. Sehirli, “Detection of Small and Medium Sized Ships in Satellite Images Using YOLO Models,” Curr. Trends Comput., vol. 3, no. 1, pp. 17–27, 2025.
[2] M. T. Nguyen, V. N. Tran, and X. T. Truong, “Developing Object Detection Algorithm for Optoelectronic Systems on Surface Vessels Using Deep Learning Models,” J. Sci. Tech., vol. 14, no. 02, pp. 89–103, 2025.
[3] X. Hong, D. Fu, J. Tang, V. Lyne, M. Luo, and F. Su, “Ship detection in reefs and deep-sea with medium-high resolution images,” Geo-spatial Inf. Sci., 2024.
[4] G. Liu, Y. Zhang, X. Zheng, X. Sun, K. Fu, and H. Wang, “A New Method on Inshore Ship Detection in High-Resolution Satellite Images Using Shape and Context Information,” IEEE Geosci. Remote Sens. Lett., vol. 11, no. 3, pp. 617–621, 2014.
[5] S. Zhang, R. Wu, K. Xu, J. Wang, and W. Sun, “R-CNN-Based Ship Detection from High Resolution Remote Sensing Imagery,” Remote Sens., vol. 11, no. 6, p. 631, 2019.
[6] J. Zhang, R. Huang, Y. Li, and B. Pan, “Oriented Ship Detection Based on Intersecting Circle and Deformable RoI in Remote Sensing Images,” Remote Sens., vol. 14, no. 19, p. 4749, 2022.
[7] V. Sanikommu, S. P. Marripudi, H. R. Yekkanti, R. Divi, R. Chandrakanth, and P. Mahindra, “Edge computing for detection of ship and ship port from remote sensing images using YOLO,” Front. Artif. Intell., vol. 8, p. 1508664, 2025.
[8] S. Liu, H. Wang, Z. Li, and P. Wei, “FrequencyFormer: Oriented Object Detection with Frequency Transformer,” EAI Endorsed Trans. AI Robot., vol. 4, 2025.
[9] Y. Dong, K. Xu, C. Zhu, E. Guan, and Y. Liu, “E-FPN: Evidential Feature Pyramid Network for Ship Classification,” Remote Sens., vol. 15, no. 15, p. 3916, 2023.
[10] L. Shen, T. Gao, and Q. Yin, “YOLO-LPSS: A Lightweight and Precise Detection Model for Small Sea Ships,” J. Mar. Sci. Eng., vol. 13, no. 5, p. 925, 2025.
[11] Y. Wang, S. Zhang, J. Xu, Z. Cheng, and G. Du, “YOLO-StarLS: A Ship Detection Algorithm Based on Wavelet Transform and Multi-Scale Feature Extraction for Complex Environments,” Symmetry (Basel)., vol. 17, no. 7, p. 1116, 2025.
[12] R. Sapkota and others, “Ultralytics YOLO Evolution: An Overview of YOLO26, YOLO11, YOLOv8, and YOLOv5 Object Detectors for Computer Vision and Pattern Recognition,” arXiv Prepr. arXiv2510.09653, 2025.
[13] R. Sapkota, R. H. Cheppally, A. Sharda, and M. Karkee, “YOLO26: Key Architectural Enhancements and Performance Benchmarking for Real-Time Object Detection,” arXiv Prepr. arXiv2509.25164, vol. 3, 2026, doi: https://doi.org/10.48550/arXiv.2509.25164.
[14] Ultralytics, “YOLO26 vs. YOLOv10: The Evolution of End-to-End Object Detection,” Ultralytics YOLO Docs. Accessed: Jan. 30, 2026. [Online]. Available: https://docs.ultralytics.com/compare/yolo26-vs-yolov10/