Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/68936
Title: ỨNG DỤNG MÔ HÌNH PHOBERT TRONG PHÂN LOẠI VĂN BẢN
Authors: Trần, Công Án
Trương, Văn Sang
Keywords: CÔNG NGHỆ THÔNG TIN
Issue Date: 2021
Publisher: Trường Đại Học Cần Thơ
Abstract: Hiện nay, có rất nhiều phương pháp phân loại văn bản và đều đạt được những kết quả nhất định như Phương pháp k láng giềng gần nhất, Cây quyết định, Máy học Vector hỗ trợ,... Các phương pháp này lại chỉ áp dụng hầu hết trong việc phân loại tiếng Anh, còn phân loại tiếng Việt hiện nay lại khá ít nghiên cứu và phương pháp áp dụng. Đây chính là một thách thức, một bài toán đặt ra cho việc xử lý ngôn ngữ tự nhiên, đặc biệt là là xử lý ngôn ngữ tiếng Việt. Chính vì giải quyết vấn đề trên nên tôi đã chọn đề tài “Ứng dụng mô hình PhoBERT trong phân loại văn bản” nhằm tập trung vào việc tìm hiểu và ứng dụng mô hình PhoBERT vào việc phân loại văn bản tiếng Việt. Mô hình PhoBERT là một mô hình pre-trained cho tiếng Việt. Đây là một mô hình vượt trội và hiệu quả cho việc xử lý tiếng Việt, vì vậy tôi quyết định chọn mô hình này để phân loại văn bản tiếng Việt. Quá trình phân loại văn bản gồm các giai đoạn: Xử lý dữ liệu, huấn luyện mô hình với dữ liệu của đề tài, đánh giá mô hình. Mô hình đã phân loại được văn bản tiếng Việt và độ chính xác tương đối cao, khoảng trên 94%. Trong tương lai sẽ tiến hành cải tiến để mô hình huấn luyện được hoàn thiện hơn.
Description: 67 Tr
URI: https://dspace.ctu.edu.vn/jspui/handle/123456789/68936
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
1.45 MBAdobe PDF
Your IP: 3.129.210.36


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.