Please use this identifier to cite or link to this item:
https://dspace.ctu.edu.vn/jspui/handle/123456789/68956
Title: | PHÂN LOẠI SẮC THÁI BÌNH LUẬN SỬ DỤNG MÔ HÌNH PRE-TRAINED PHOBERT |
Authors: | Trần, Công Án Đặng, Anh Tuấn |
Keywords: | CÔNG NGHỆ THÔNG TIN |
Issue Date: | 2021 |
Publisher: | Trường Đại Học Cần Thơ |
Abstract: | Bài toán phân tích sắc thái bình luận từ lâu đã là một trong những vấn đề cơ bản của lĩnh vực xử lý ngôn ngữ tự nhiên, cùng với đó là hàng loạt các phương pháp và mô hình học sâu khác nhau đã được đề xuất. Đề tài này giới thiệu một cách tiếp cận mới dựa vào model pre-trained. PhoBERT là một model pre-trained được huấn luyện danh riêng cho tiếng Việt và để giải quyết các bài toán liên quan tới phân tích sắc thái bình luận tiếng Việt. Đề tài sử dụng dataset SA_demo của cuộc thi phân loại sắc thái bình luận do AIVIVN tổ chức và datatset NTC-SCV. Qua thực nghiệm cho thấy bằng cách tinh chỉnh mô hình PhoBERT kết quả thu được rất khả quan khi so sánh với phương pháp cổ điển là sử dụng mô hình Support Vector Machine. Cụ thể, kết quả mô hình PhoBERT thu được trên 2 tập dữ liệu là SA_demo và NTC-SCV với độ chính xác lần lượt là : 88.72% và 90.76%, còn đối với mô hình SVM kết quả là 87.16% và 88.99%. |
Description: | 47 Tr |
URI: | https://dspace.ctu.edu.vn/jspui/handle/123456789/68956 |
Appears in Collections: | Trường Công nghệ Thông tin & Truyền thông |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
_file_ Restricted Access | 1.92 MB | Adobe PDF | ||
Your IP: 18.119.124.24 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.