Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://dspace.ctu.edu.vn/jspui/handle/123456789/68936
Nhan đề: | ỨNG DỤNG MÔ HÌNH PHOBERT TRONG PHÂN LOẠI VĂN BẢN |
Tác giả: | Trần, Công Án Trương, Văn Sang |
Từ khoá: | CÔNG NGHỆ THÔNG TIN |
Năm xuất bản: | 2021 |
Nhà xuất bản: | Trường Đại Học Cần Thơ |
Tóm tắt: | Hiện nay, có rất nhiều phương pháp phân loại văn bản và đều đạt được những kết quả nhất định như Phương pháp k láng giềng gần nhất, Cây quyết định, Máy học Vector hỗ trợ,... Các phương pháp này lại chỉ áp dụng hầu hết trong việc phân loại tiếng Anh, còn phân loại tiếng Việt hiện nay lại khá ít nghiên cứu và phương pháp áp dụng. Đây chính là một thách thức, một bài toán đặt ra cho việc xử lý ngôn ngữ tự nhiên, đặc biệt là là xử lý ngôn ngữ tiếng Việt. Chính vì giải quyết vấn đề trên nên tôi đã chọn đề tài “Ứng dụng mô hình PhoBERT trong phân loại văn bản” nhằm tập trung vào việc tìm hiểu và ứng dụng mô hình PhoBERT vào việc phân loại văn bản tiếng Việt. Mô hình PhoBERT là một mô hình pre-trained cho tiếng Việt. Đây là một mô hình vượt trội và hiệu quả cho việc xử lý tiếng Việt, vì vậy tôi quyết định chọn mô hình này để phân loại văn bản tiếng Việt. Quá trình phân loại văn bản gồm các giai đoạn: Xử lý dữ liệu, huấn luyện mô hình với dữ liệu của đề tài, đánh giá mô hình. Mô hình đã phân loại được văn bản tiếng Việt và độ chính xác tương đối cao, khoảng trên 94%. Trong tương lai sẽ tiến hành cải tiến để mô hình huấn luyện được hoàn thiện hơn. |
Mô tả: | 67 Tr |
Định danh: | https://dspace.ctu.edu.vn/jspui/handle/123456789/68936 |
Bộ sưu tập: | Trường Công nghệ Thông tin & Truyền thông |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
_file_ Giới hạn truy cập | 1.45 MB | Adobe PDF | ||
Your IP: 3.133.136.117 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.