Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/104095
Nhan đề: | XÂY DỰNG HỆ THỐNG HỎI ĐÁP DỰA TRÊN VĂN BẢN CỦA NGƯỜI DÙNG |
Nhan đề khác: | BUILDING A USER DOCUMENT-BASED QUESTION AND ANSWERING SYSTEM |
Tác giả: | Phạm, Nguyên Khang Kim, Minh Thắng |
Từ khoá: | KHOA HỌC MÁY TÍNH |
Năm xuất bản: | 2024 |
Nhà xuất bản: | Trường Đại Học Cần Thơ |
Tóm tắt: | Việc tìm kiếm thông tin trên tài liệu là một công việc tốn nhiều thời gian và công sức, đặc biệt là đối với những văn bản có kích thước lớn. Một công cụ có khả năng giúp người dùng trả lời các câu hỏi dựa trên thông tin trong văn bản của họ là một giải pháp có thể giải quyết vấn đề này. Luận văn này trình bày cách tiếp cận với kỹ thuật RAG (RAG) bao gồm các bước lập chỉ mục, truy xuất thông tin và sinh câu trả lời. Giới thiệu một số cơ sở dữ liệu vector như Faiss, ChromaDB – những cơ sở dữ liệu này được phát triển cho mục đích lưu trữ các dữ liệu dạng vector và cung cấp các phương thức truy xuất dữ liệu dựa trên ngữ nghĩa của câu truy vấn. Kỹ thuật nhận diện ký tự quang học dùng để trích xuất văn bản từ hình ảnh. Kết quả đánh giá dựa trên chất lượng của mô hình truy xuất đạt 70% và mô hình sinh văn bản đạt 84% trên dữ liệu kiểm thử. Cuối cùng, kết hợp với các công nghệ và kỹ thuật hiện có để triển khai chúng vào một hệ thống thông tin hoạt động một cách tự động cho việc đọc và tách văn bản, lập chỉ mục và truy xuất thông tin. |
Mô tả: | 70 Tr |
Định danh: | https://dspace.ctu.edu.vn/jspui/handle/123456789/104095 |
Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
_file_ Giới hạn truy cập | 7.64 MB | Adobe PDF | ||
Your IP: 3.129.63.214 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.