Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/104095
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorPhạm, Nguyên Khang-
dc.contributor.authorKim, Minh Thắng-
dc.date.accessioned2024-06-28T03:42:57Z-
dc.date.available2024-06-28T03:42:57Z-
dc.date.issued2024-
dc.identifier.otherB2007210-
dc.identifier.urihttps://dspace.ctu.edu.vn/jspui/handle/123456789/104095-
dc.description70 Trvi_VN
dc.description.abstractViệc tìm kiếm thông tin trên tài liệu là một công việc tốn nhiều thời gian và công sức, đặc biệt là đối với những văn bản có kích thước lớn. Một công cụ có khả năng giúp người dùng trả lời các câu hỏi dựa trên thông tin trong văn bản của họ là một giải pháp có thể giải quyết vấn đề này. Luận văn này trình bày cách tiếp cận với kỹ thuật RAG (RAG) bao gồm các bước lập chỉ mục, truy xuất thông tin và sinh câu trả lời. Giới thiệu một số cơ sở dữ liệu vector như Faiss, ChromaDB – những cơ sở dữ liệu này được phát triển cho mục đích lưu trữ các dữ liệu dạng vector và cung cấp các phương thức truy xuất dữ liệu dựa trên ngữ nghĩa của câu truy vấn. Kỹ thuật nhận diện ký tự quang học dùng để trích xuất văn bản từ hình ảnh. Kết quả đánh giá dựa trên chất lượng của mô hình truy xuất đạt 70% và mô hình sinh văn bản đạt 84% trên dữ liệu kiểm thử. Cuối cùng, kết hợp với các công nghệ và kỹ thuật hiện có để triển khai chúng vào một hệ thống thông tin hoạt động một cách tự động cho việc đọc và tách văn bản, lập chỉ mục và truy xuất thông tin.vi_VN
dc.language.isovivi_VN
dc.publisherTrường Đại Học Cần Thơvi_VN
dc.subjectKHOA HỌC MÁY TÍNHvi_VN
dc.titleXÂY DỰNG HỆ THỐNG HỎI ĐÁP DỰA TRÊN VĂN BẢN CỦA NGƯỜI DÙNGvi_VN
dc.title.alternativeBUILDING A USER DOCUMENT-BASED QUESTION AND ANSWERING SYSTEMvi_VN
dc.typeThesisvi_VN
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
7.64 MBAdobe PDF
Your IP: 18.222.161.245


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.