Please use this identifier to cite or link to this item: https://dspace.ctu.edu.vn/jspui/handle/123456789/68956
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorTrần, Công Án-
dc.contributor.authorĐặng, Anh Tuấn-
dc.date.accessioned2021-11-24T07:03:04Z-
dc.date.available2021-11-24T07:03:04Z-
dc.date.issued2021-
dc.identifier.otherB1706888-
dc.identifier.urihttps://dspace.ctu.edu.vn/jspui/handle/123456789/68956-
dc.description47 Trvi_VN
dc.description.abstractBài toán phân tích sắc thái bình luận từ lâu đã là một trong những vấn đề cơ bản của lĩnh vực xử lý ngôn ngữ tự nhiên, cùng với đó là hàng loạt các phương pháp và mô hình học sâu khác nhau đã được đề xuất. Đề tài này giới thiệu một cách tiếp cận mới dựa vào model pre-trained. PhoBERT là một model pre-trained được huấn luyện danh riêng cho tiếng Việt và để giải quyết các bài toán liên quan tới phân tích sắc thái bình luận tiếng Việt. Đề tài sử dụng dataset SA_demo của cuộc thi phân loại sắc thái bình luận do AIVIVN tổ chức và datatset NTC-SCV. Qua thực nghiệm cho thấy bằng cách tinh chỉnh mô hình PhoBERT kết quả thu được rất khả quan khi so sánh với phương pháp cổ điển là sử dụng mô hình Support Vector Machine. Cụ thể, kết quả mô hình PhoBERT thu được trên 2 tập dữ liệu là SA_demo và NTC-SCV với độ chính xác lần lượt là : 88.72% và 90.76%, còn đối với mô hình SVM kết quả là 87.16% và 88.99%.vi_VN
dc.language.isovivi_VN
dc.publisherTrường Đại Học Cần Thơvi_VN
dc.subjectCÔNG NGHỆ THÔNG TINvi_VN
dc.titlePHÂN LOẠI SẮC THÁI BÌNH LUẬN SỬ DỤNG MÔ HÌNH PRE-TRAINED PHOBERTvi_VN
dc.typeThesisvi_VN
Appears in Collections:Trường Công nghệ Thông tin & Truyền thông

Files in This Item:
File Description SizeFormat 
_file_
  Restricted Access
1.92 MBAdobe PDF
Your IP: 18.117.91.116


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.