Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/68936
Title: | ỨNG DỤNG MÔ HÌNH PHOBERT TRONG PHÂN LOẠI VĂN BẢN |
Authors: | Trần, Công Án Trương, Văn Sang |
Keywords: | CÔNG NGHỆ THÔNG TIN |
Issue Date: | 2021 |
Publisher: | Trường Đại Học Cần Thơ |
Abstract: | Hiện nay, có rất nhiều phương pháp phân loại văn bản và đều đạt được những kết quả nhất định như Phương pháp k láng giềng gần nhất, Cây quyết định, Máy học Vector hỗ trợ,... Các phương pháp này lại chỉ áp dụng hầu hết trong việc phân loại tiếng Anh, còn phân loại tiếng Việt hiện nay lại khá ít nghiên cứu và phương pháp áp dụng. Đây chính là một thách thức, một bài toán đặt ra cho việc xử lý ngôn ngữ tự nhiên, đặc biệt là là xử lý ngôn ngữ tiếng Việt. Chính vì giải quyết vấn đề trên nên tôi đã chọn đề tài “Ứng dụng mô hình PhoBERT trong phân loại văn bản” nhằm tập trung vào việc tìm hiểu và ứng dụng mô hình PhoBERT vào việc phân loại văn bản tiếng Việt. Mô hình PhoBERT là một mô hình pre-trained cho tiếng Việt. Đây là một mô hình vượt trội và hiệu quả cho việc xử lý tiếng Việt, vì vậy tôi quyết định chọn mô hình này để phân loại văn bản tiếng Việt. Quá trình phân loại văn bản gồm các giai đoạn: Xử lý dữ liệu, huấn luyện mô hình với dữ liệu của đề tài, đánh giá mô hình. Mô hình đã phân loại được văn bản tiếng Việt và độ chính xác tương đối cao, khoảng trên 94%. Trong tương lai sẽ tiến hành cải tiến để mô hình huấn luyện được hoàn thiện hơn. |
Description: | 67 Tr |
URI: | https://dspace.ctu.edu.vn/jspui/handle/123456789/68936 |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 1.45 MB | Adobe PDF | ||
Your IP: 3.129.210.36 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.