Tóm tắt
Trong nghiên cứu này, đóng góp chính của nhóm tác giả tập trung vào giải quyết bài toán phát hiện và phân loại người đi bộ (người trưởng thành hay trẻ em) trong hình ảnh dựa trên phương pháp học sâu theo hai hướng tiếp cận. Ở hướng thứ nhất, bài toán được chia thành hai bài toán thành phần: phát hiện người đi bộ và phân loại người đi bộ. Hình ảnh người đi bộ sẽ được tách ra từ hình ảnh đầu vào và đưa qua bộ phân loại để xác định người đi bộ đó là người lớn hay trẻ em. Cụ thể, bài toán phát hiện người đi bộ được nghiên cứu dựa trên mô hình phát hiện đối tượng YOLO trong khi bài toán phân loại hình ảnh người đi bộ được nghiên cứu trên mô hình VGG, Inception, ResNet và EfficientNet. Ở hướng tiếp cận thứ hai, bài toán được nghiên cứu theo hướng phát hiện và phân loại người đi bộ sử dụng duy nhất một mô hình cụ thể là mô hình phát hiện đối tượng YOLO. Kết quả thu được của nghiên cứu tương đối tốt với cả hai hướng tiếp cận. Hướng tiếp cận thứ nhất cho độ chính xác trung bình phát hiện người đi bộ đạt 0.797 và độ chính xác phân loại người đi bộ đạt 0.955. Tuy nhiên hướng tiếp cận thứ hai thể hiện sự vượt trội khi cho độ chính xác cao hơn đạt 0.851 đồng thời có thời gian thực thi tốt hơn nhiều so với hướng tiếp cận thứ nhất.