Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/101047
Nhan đề: Trích xuất danh mục khía cạnh sử dụng bert với hàm mất mát cân bằng
Tác giả: Nguyễn, Thị Thanh Thủy
Nguyễn, Ngọc Điệp
Từ khoá: Trích xuất danh mục khía cạnh
Học máy
Học sâu
BERT
Hàm mất mát cân bằng
Năm xuất bản: 2022
Tùng thư/Số báo cáo: Tạp chí Khoa học Công nghệ Thông tin và Truyền thông;Số 03(CS.01) .- P.31-39
Tóm tắt: Trích xuất danh mục khía cạnh (aspect category extraction) là nhiệm vụ đầu tiên trong bài toán khai thác quan điểm dựa trên khía cạnh (aspect-based opinion mining). Đây là một nhiệm vụ khó khăn vì người dùng thường sử dụng các từ khóa khác nhau để diễn tả về cùng một khía cạnh hoặc nhiều khi chỉ dùng các từ ngụ ý đề cập đến khía cạnh. Các phương pháp học máy có giám sát nói chung được đánh giá là có độ chính xác cao, tuy nhiên thường tốn kém nhiều công sức trong việc gắn nhân dữ liệu huấn luyện, đặc biệt là cho các miền lĩnh vực mới. Hơn nữa, các phương pháp này thường yêu cầu phải có kiến thức chuyên gia giúp trích chọn ra được các đặc trưng thủ công hữu ích đối với miền lĩnh vực nghiên cứu. Bài báo này trình bày đề xuất một phương pháp cải tiến sử dụng mô hình học sâu dựa trên BERT để giải quyết và nâng cao hiệu năng cho nhiệm vụ trích xuất danh mục khía cạnh. Mô hình đề xuất tự học các đặc trưng từ chuỗi dữ liệu văn bản đầu vào và biểu diễn hiệu quả nhờ BERT. Ngoài ra, để khắc phục vấn đề mất cân bằng dữ liệu giữa các nhân lớp, chúng tôi đề xuất sử dụng các hàm mất mát cân bằng (balanced loss functions). Kết quả thực nghiệm cho thấy mô hình đề xuất có hiệu năng vượt trội hơn, với trung bình độ đo F₁, cao nhất đạt 77%.
Định danh: https://dspace.ctu.edu.vn/jspui/handle/123456789/101047
ISSN: 2525-2224
Bộ sưu tập: Khoa học Công nghệ Thông tin và Truyền thông

Các tập tin trong tài liệu này:
Tập tin Mô tả Kích thước Định dạng  
_file_
  Giới hạn truy cập
9.19 MBAdobe PDF
Your IP: 13.59.67.189


Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.