Dự án nghiên cứu và áp dụng các mô hình YOLO tiên tiến để phát hiện trạng thái ngủ gật của sinh viên trong lớp học.
Trải nghiệm công nghệ AI YOLO phát hiện ngủ gật ngay trên trình duyệt của bạn
Chưa có dữ liệu phát hiện
Click "Bắt đầu Demo" và cho phép truy cập camera
Ngồi thẳng trước camera để AI phát hiện khuôn mặt
Thử nghiệm bằng cách nhắm mắt hoặc cúi đầu
Quan sát kết quả phát hiện và độ tin cậy
Chưa có dữ liệu trong database
Học máy là lĩnh vực nghiên cứu các thuật toán và mô hình thống kê cho phép máy tính học từ dữ liệu mà không cần được lập trình rõ ràng. Trong dự án này, chúng ta sử dụng supervised learning để huấn luyện mô hình nhận diện trạng thái ngủ gật.
CNN là kiến trúc mạng nơ-ron chuyên biệt cho xử lý dữ liệu có cấu trúc lưới như hình ảnh. CNN sử dụng các lớp tích chập để trích xuất đặc trưng từ hình ảnh một cách hiệu quả.
Các thuật toán nhận dạng đối tượng phổ biến: R-CNN, SSD, YOLO. YOLO nổi bật với khả năng xử lý thời gian thực và độ chính xác cao.
Computer Vision là lĩnh vực nghiên cứu cách máy tính có thể hiểu và phân tích hình ảnh. Trong dự án này, chúng ta sử dụng CV để phát hiện các dấu hiệu ngủ gật.
Deep Learning là một nhánh của Machine Learning sử dụng mạng nơ-ron nhân tạo với nhiều lớp để học các đặc trưng phức tạp từ dữ liệu.
Xử lý dữ liệu là bước quan trọng trong quá trình huấn luyện mô hình. Bao gồm thu thập, làm sạch, và chuẩn hóa dữ liệu.
Phiên bản đầu tiên, giới thiệu khái niệm "You Only Look Once"
Cải thiện đáng kể về độ chính xác và khả năng phát hiện
Phiên bản được tối ưu hóa cho production với PyTorch
Phiên bản mới nhất với nhiều cải tiến về kiến trúc
Thu thập ảnh và video từ camera lớp học với các trạng thái khác nhau: tỉnh táo, buồn ngủ, ngủ gật
Sử dụng LabelImg để gán nhãn bounding box và phân loại trạng thái
Data augmentation và normalization để tăng tính đa dạng và chuẩn hóa dữ liệu
Huấn luyện YOLO model với transfer learning và fine-tuning
Đánh giá hiệu suất bằng các chỉ số chuẩn và testing trên dữ liệu thực tế
Video Demo YOLO Nhận Diện Ngủ Gật