Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/94813
Title: CHẨN ĐOÁN BỆNH DỰA TRÊN MÔ TẢ TRIỆU CHỨNG DẠNG VĂN BẢN DÙNG CÁC KỸ THUẬT MÁY HỌC VÀ PHƯƠNG PHÁP GIẢI THÍCH KẾT QUẢ
Other Titles: DISEASE DIAGNOSIS BASED ON TEXT-BASED SYMPTOMS USING MACHINE LEARNING AND EXPLAINABLE ARTIFICIAL INTELLIGENCE TECHNIQUES
Authors: Nguyễn, Thanh Hải
Huỳnh, Ngọc Tuyết
Keywords: HỆ THỐNG THÔNG TIN
Issue Date: 2023
Publisher: Trường Đại Học Cần Thơ
Abstract: Ở Việt Nam, sự tăng lên của dân số làm nhu cầu khám và chữa bệnh cũng có xu hướng tăng lên, các bệnh viện (đặc biệt là các bệnh viện ở tuyến trung ương) thường xuyên rơi vào tình trạng quá tải bệnh nhân, với số lượng bệnh nhân và hồ sơ y tế khổng lồ, nếu chỉ giải quyết bằng giấy tờ vật lý sẽ rất tốn thời gian và không hiệu quả, chính vì vậy sự hỗ trợ của công nghệ thông tin là điều cần thiết. Ở các khâu tiếp nhận bệnh, việc ứng dụng học máy để chẩn đoán loại bệnh mà bệnh nhân mắc phải và đề xuất buồng khám phù hợp sẽ giúp các nhân viên y tế tiết kiệm được thời gian xử lý công việc. Bên cạnh áp dụng học máy vào chẩn đoán ban đầu là một công việc vô cùng cần thiết, nhưng giải thích kết quả chẩn đoán của mô hình cũng quan trọng không kém. Chính vì vậy, đề tài “Chẩn đoán bệnh dựa trên mô tả triệu chứng dạng văn bản dùng các kỹ thuật máy học và phương pháp giải thích kết quả” được đề xuất để phân loại bệnh thông qua triệu chứng của bệnh nhân, có 10 bệnh và nhóm bệnh phổ biến được xem xét. Đề tài thực hiện hai công việc chính là phân loại bệnh và giải thích kết quả phân loại của mô hình. Với nhiệm vụ phân loại văn bản, đề tài sử dụng mô hình ngôn ngữ được đào tạo PhoBERT dành riêng cho tiếng Việt được huấn luyện trên khoảng 20GB dữ liệu với khả năng hiểu sâu ngôn ngữ do được huấn luyện đơn ngữ, hiệu suất cao và tiết kiệm được thời gian so với việc xây dựng mô hình hoàn toàn mới mà lượng dữ liệu lại hạn chế. Ở nhiệm vụ diễn giải kết quả của mô hình phân loại văn bản, đề tài sử dụng phương pháp XAI (Explainable Artificial Intelligence) là LIME cho nhiệm vụ văn bản (LIME text) để diễn giải cục bộ kết quả mô hình. Các mô hình được huấn luyện và đánh giá trên tập dữ liệu gồm 230.479 dòng mô tả triệu chứng được thu thập tại Trung tâm y tế thành phố Mỹ Tho, tỉnh Tiền Giang. Kết quả cho thấy mô hình PhoBERT được tinh chỉnh lớp đầu ra với bộ siêu tham số được đề xuất hoàn toàn phù hợp cho nhiệm vụ phân loại triệu chứng dựa trên văn bản thông qua việc đánh giá hiệu suất phân loại dựa trên các độ đo hiệu suất mô hình khác nhau như ACC, AUC và điểm F1. Mô hình tốt nhất được lựa chọn và tích hợp vào một hệ thống trên nền tảng Website với các công cụ và ngôn ngữ hỗ trợ như HTML, CSS, Javascript, Flask Framework, hệ quản trị Cơ sở dữ liệu (MySQL),… Trong thực nghiệm mô hình thì có sự hỗ trợ của Tensorflow, Keras, PyVi,… và Jupyter notebook, Anaconda Prompt. Những kết quả mà đề tài đã thực hiện mang mục đích nghiên cứu và đóng góp sức lực vào việc phát triển các hệ thống y tế thông minh, giúp giải quyết tình trạng quá tải trong các bệnh viện, nâng cao chất lượng chăm sóc bệnh nhân, phục vụ cho sự phát triển của cộng đồng.
Description: 80 Tr
URI: https://dspace.ctu.edu.vn/jspui/handle/123456789/94813
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
3.07 MBAdobe PDF
Your IP: 18.117.156.84


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.