Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/88278
Title: PHÁT HIỆN TÉ NGÃ DỰA TRÊN HÌNH ẢNH BẰNG HỌC SÂU
Other Titles: VISION-BASED FALL DETECTION USING DEEP LEARNING
Authors: Phạm, Nguyên Khang
Nguyễn, Thị Kim Thoa
Keywords: KHOA HỌC MÁY TÍNH
Issue Date: 2023
Publisher: Trường Đại Học Cần Thơ
Abstract: Phát hiện té ngã là một bài toán quan trọng trong việc giúp đỡ và chăm sóc người cao tuổi, người bị bệnh thần kinh hoặc tim mạch, hoặc người có nguy cơ té ngã. Phát hiện té ngã dựa trên hình ảnh là một phương pháp sử dụng camera để theo dõi và phân tích hành động của con người, nhận biết các trường hợp té ngã và cảnh báo kịp thời. Phương pháp này có ưu điểm là không cần đeo thiết bị, không gây khó chịu cho người dùng, và có thể áp dụng cho nhiều môi trường khác nhau. Tuy nhiên, phát hiện té ngã dựa trên hình ảnh cũng gặp nhiều thách thức, như sự che khuất, biến đổi ánh sáng, đa dạng tư thế và loại té ngã. Để giải quyết những thách thức này, nhiều nghiên cứu đã áp dụng học sâu để xây dựng các mô hình phát hiện té ngã hiệu quả và chính xác. Học sâu là một lĩnh vực của học máy, sử dụng các mạng nơ-ron nhân tạo có nhiều lớp để học được các đặc trưng phức tạp từ dữ liệu. Bằng cách sử dụng Detectron2 để trích đặc trưng 17 điểm của cơ thể người và dùng dữ liệu 17 điểm đó để huấn luyện mô hình bằng mạng LSTM dùng cho việc dự đoán, phát hiện té ngã. Detectron2 là một công cụ phát triển mã nguồn mở có thể nhận diện được các điểm quan trọng của cơ thể người, như đầu, vai, khuỷu tay, cổ tay, háng, đầu gối và mắt cá chân. Bằng cách sử dụng Detectron2, ta có thể biến một bức ảnh thành một vector 17 điểm, mỗi điểm có tọa độ x, y. Mạng LSTM là một loại mạng nơ-ron hồi quy, có khả năng xử lý các chuỗi dữ liệu có độ dài biến thiên. Mạng LSTM có thể học được các mối quan hệ giữa các phần tử trong chuỗi và ghi nhớ được các thông tin quan trọng trong quá khứ. Bằng cách sử dụng mạng LSTM, ta có thể huấn luyện một mô hình phân loại các chuỗi 17 điểm thành 5 lớp: đứng, nằm, ngồi, cúi, bò. Và trường hợp không thể phân lớp được thì sẽ đưa vào dự đoán té ngã hoặc không có người. Kết quả cho thấy mô hình phát hiện té ngã dựa trên hình ảnh bằng học sâu, sử dụng Detectron2 để trích đặc trưng 17 điểm của cơ thể người và dùng dữ liệu 17 điểm đó để huấn luyện mô hình bằng mạng LSTM, có độ chính xác trên tập kiểm tra là 85,61%. Đây là một kết quả khả quan và có ý nghĩa thực tiễn trong việc phát triển các hệ thống phát hiện té ngã thông minh và hiệu quả.
Description: 51 Tr
URI: https://dspace.ctu.edu.vn/jspui/handle/123456789/88278
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
3.01 MBAdobe PDF
Your IP: 3.143.228.40


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.