Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/110395
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Lê, Huỳnh Quốc Bảo | - |
dc.contributor.author | Ngô, Huỳnh Công Trứ | - |
dc.date.accessioned | 2025-01-10T09:06:59Z | - |
dc.date.available | 2025-01-10T09:06:59Z | - |
dc.date.issued | 2024 | - |
dc.identifier.other | B2014627 | - |
dc.identifier.uri | https://dspace.ctu.edu.vn/jspui/handle/123456789/110395 | - |
dc.description | 55 Tr | vi_VN |
dc.description.abstract | Nghiên cứu này tập trung vào việc xây dựng một mô hình dự đoán từ tiếp theo hiệu quả, nhằm cải thiện chất lượng của các hệ thống xử lý ngôn ngữ tự nhiên. Dự đoán từ tiếp theo là một nhiệm vụ quan trọng trong xử lý ngôn ngữ tự nhiên (NLP), mô hình này có tiềm năng ứng dụng trong các hệ thống tạo văn bản tự động, chatbot và các ứng dụng khác liên quan đến xử lý ngôn ngữ tự nhiên. Để đạt được mục tiêu này, ba mô hình mạng nơ-ron tiên tiến bao gồm LSTM (Long Short-Term Memory), GRU (Gated Recurrent Unit), và Transformer đã được sử dụng nhằm học hỏi mối quan hệ giữa các từ và dự đoán từ tiếp theo có khả năng xuất hiện cao nhất. Mô hình được huấn luyện trên một tập dữ liệu văn bản tiếng Việt, với quy mô 600.000 ký tự. Để tăng cường khả năng biểu diễn của mô hình, mô hình được sử dụng các kỹ thuật đặc trưng như phân tách từ (Tokenization), tạo chuỗi N-gram, đệm dữ liệu (Padding). Sau tiền xử lí dữ liệu thu được 3847 từ khác nhau, có 141,704 mẫu đầu vào (chuỗi n-gram). Kết quả đánh giá cho thấy mô hình đạt được độ chính xác cao từ 91 – 93% trên tập dữ liệu kiểm thử, riêng mô hình Transformer do hạn chế cấu hình nên độ chính xác chỉ đạt được 70%. Mô hình này được phát triển trong nghiên cứu có thể được ứng dụng rộng rãi trong các hệ thống chatbot để tạo ra các cuộc hội thoại tự nhiên và hấp dẫn hơn. Bằng cách dự đoán từ tiếp theo một cách chính xác, chatbot có thể hiểu ý định của người dùng tốt hơn và đưa ra những phản hồi phù hợp. Ngoài ra, mô hình này còn có tiềm năng trong việc hỗ trợ các nhà văn sáng tạo ý tưởng bằng cách đề xuất các từ và cụm từ liên quan, từ đó thúc đẩy quá trình sáng tạo văn bản. | vi_VN |
dc.language.iso | vi | vi_VN |
dc.publisher | Trường Đại Học Cần Thơ | vi_VN |
dc.subject | CÔNG NGHỆ THÔNG TIN | vi_VN |
dc.title | XÂY DỰNG MÔ HÌNH DỰ ĐOÁN TỪ TIẾP THEO | vi_VN |
dc.title.alternative | BUILDING A NEXT WORD PREDICTION MODEL | vi_VN |
dc.type | Thesis | vi_VN |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 2.31 MB | Adobe PDF | ||
Your IP: 216.73.216.119 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.