YOLO AI
Nhận Diện Sinh Viên Ngủ Gật

Dự án nghiên cứu và áp dụng các mô hình YOLO tiên tiến để phát hiện trạng thái ngủ gật của sinh viên trong lớp học.

Demo Phát Hiện Ngủ Gật Trực Tiếp

Trải nghiệm công nghệ AI YOLO phát hiện ngủ gật ngay trên trình duyệt của bạn

Chưa kết nối camera

Trạng Thái Phát Hiện

Trạng thái: Đang chờ...
Độ tin cậy: 0%
FPS: 0

Lịch sử phát hiện:

Chưa có dữ liệu phát hiện

Database:

Chưa kết nối

Cài Đặt

0.6

Hướng dẫn sử dụng

1

Click "Bắt đầu Demo" và cho phép truy cập camera

2

Ngồi thẳng trước camera để AI phát hiện khuôn mặt

3

Thử nghiệm bằng cách nhắm mắt hoặc cúi đầu

4

Quan sát kết quả phát hiện và độ tin cậy

Database Lưu Trữ

0
Tổng số phát hiện
0
Ngủ gật
0
Buồn ngủ
0
Hôm nay

Chưa có dữ liệu trong database

Cơ Sở Lý Thuyết

Machine Learning

Học máy là lĩnh vực nghiên cứu các thuật toán và mô hình thống kê cho phép máy tính học từ dữ liệu mà không cần được lập trình rõ ràng. Trong dự án này, chúng ta sử dụng supervised learning để huấn luyện mô hình nhận diện trạng thái ngủ gật.

Các loại ML:

  • Supervised Learning: Huấn luyện với dữ liệu có nhãn
  • Unsupervised Learning: Tìm pattern trong dữ liệu không có nhãn
  • Reinforcement Learning: Học từ phản hồi môi trường

Convolutional Neural Networks

CNN là kiến trúc mạng nơ-ron chuyên biệt cho xử lý dữ liệu có cấu trúc lưới như hình ảnh. CNN sử dụng các lớp tích chập để trích xuất đặc trưng từ hình ảnh một cách hiệu quả.

Các thành phần chính:

  • Convolutional Layer: Trích xuất đặc trưng
  • Pooling Layer: Giảm kích thước và tăng tính tổng quát
  • Fully Connected Layer: Phân loại cuối cùng

Object Detection

Các thuật toán nhận dạng đối tượng phổ biến: R-CNN, SSD, YOLO. YOLO nổi bật với khả năng xử lý thời gian thực và độ chính xác cao.

So sánh các thuật toán:

  • R-CNN: Chính xác cao, tốc độ chậm
  • SSD: Cân bằng tốc độ và độ chính xác
  • YOLO: Tốc độ cao, phù hợp thời gian thực

Computer Vision

Computer Vision là lĩnh vực nghiên cứu cách máy tính có thể hiểu và phân tích hình ảnh. Trong dự án này, chúng ta sử dụng CV để phát hiện các dấu hiệu ngủ gật.

Ứng dụng trong dự án:

  • Face Detection: Phát hiện khuôn mặt
  • Eye Tracking: Theo dõi chuyển động mắt
  • Head Pose Estimation: Ước tính góc nghiêng đầu

Deep Learning

Deep Learning là một nhánh của Machine Learning sử dụng mạng nơ-ron nhân tạo với nhiều lớp để học các đặc trưng phức tạp từ dữ liệu.

Ưu điểm của Deep Learning:

  • Tự động trích xuất đặc trưng
  • Hiệu suất cao với dữ liệu lớn
  • Khả năng tổng quát hóa tốt

Data Processing

Xử lý dữ liệu là bước quan trọng trong quá trình huấn luyện mô hình. Bao gồm thu thập, làm sạch, và chuẩn hóa dữ liệu.

Quy trình xử lý:

  • Data Collection: Thu thập dữ liệu
  • Data Cleaning: Làm sạch dữ liệu
  • Data Augmentation: Tăng cường dữ liệu

Phân Tích Các Phiên Bản YOLO

YOLOv1 (2016)

Phiên bản đầu tiên, giới thiệu khái niệm "You Only Look Once"

YOLOv3 (2018)

Cải thiện đáng kể về độ chính xác và khả năng phát hiện

YOLOv5 (2020)

Phiên bản được tối ưu hóa cho production với PyTorch

YOLOv8 (2023)

Phiên bản mới nhất với nhiều cải tiến về kiến trúc

Quy Trình Thực Hiện

01

Thu Thập Dữ Liệu

Thu thập ảnh và video từ camera lớp học với các trạng thái khác nhau: tỉnh táo, buồn ngủ, ngủ gật

Dữ liệu thu thập:

  • 10,000+ hình ảnh sinh viên
  • 500+ video clips 30 giây
  • Đa dạng điều kiện ánh sáng và góc chụp
02

Gán Nhãn Dữ Liệu

Sử dụng LabelImg để gán nhãn bounding box và phân loại trạng thái

Quy trình gán nhãn:

  • Face Detection: Vùng khuôn mặt
  • Eye Region: Vùng mắt
  • Status Classification: awake/drowsy/sleeping
03

Tiền Xử Lý

Data augmentation và normalization để tăng tính đa dạng và chuẩn hóa dữ liệu

Kỹ thuật áp dụng:

  • Rotation: Xoay ảnh ±15°
  • Brightness: Điều chỉnh độ sáng
  • Noise: Thêm nhiễu Gaussian
  • Resize: Chuẩn hóa kích thước 416x416
04

Huấn Luyện

Huấn luyện YOLO model với transfer learning và fine-tuning

Cấu hình huấn luyện:

  • Model: YOLOv8n (nano version)
  • Epochs: 100 với early stopping
  • Batch Size: 16
  • Learning Rate: 0.001 với cosine decay
05

Đánh Giá

Đánh giá hiệu suất bằng các chỉ số chuẩn và testing trên dữ liệu thực tế

Chỉ số đánh giá:

  • mAP@0.5: 94.2%
  • Precision: 96.8%
  • Recall: 92.1%
  • F1-Score: 94.4%

Triển Khai Kỹ Thuật

Frontend Development

Technologies Used:

  • HTML5 & CSS3: Giao diện responsive
  • JavaScript ES6+: Logic xử lý
  • WebRTC: Truy cập camera
  • Canvas API: Xử lý hình ảnh
  • LocalStorage: Lưu trữ local

Features:

  • Real-time camera access
  • Live detection visualization
  • Interactive chatbot
  • Data export functionality

Backend Development

Technologies Used:

  • Node.js: Runtime environment
  • Express.js: Web framework
  • MySQL: Database management
  • RESTful API: Communication
  • CORS: Cross-origin support

Features:

  • Database integration
  • API endpoints
  • Data persistence
  • Error handling

AI Integration

Technologies Used:

  • Groq API: AI responses
  • OpenAI-compatible API
  • Llama3-8b model
  • Context management
  • Memory system

Features:

  • Intelligent chatbot
  • User memory
  • Fallback responses
  • Multi-language support

Database Design

Tables:

  • detections: Lưu kết quả phát hiện
  • users: Quản lý người dùng
  • chatbot_conversations: Lịch sử chat
  • system_settings: Cài đặt hệ thống
  • usage_stats: Thống kê sử dụng

Features:

  • Automated cleanup
  • Performance optimization
  • Data integrity
  • Backup system

Kết Quả & Demo

94.2%
mAP
96.8%
Precision
92.1%
Recall
25 FPS
Tốc Độ

Demo Thời Gian Thực

Video Demo YOLO Nhận Diện Ngủ Gật

Liên Hệ & Tài Liệu

Thông Tin Liên Hệ

nhakhoa1004@gmail.com
0395123864

Tài Liệu Tham Khảo

  • You Only Look Once: Unified, Real-Time Object Detection
  • YOLOv3: An Incremental Improvement
  • YOLOv8: State-of-the-Art YOLO Models

AI Assistant

Xin chào! Tôi có thể giúp bạn tìm hiểu về YOLO và nhận diện ngủ gật.