Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/84009
Nhan đề: Đề xuất mô hình quản lý và thực trạng quan hóa kết quả thống kê văn bản trực tuyến-ứng dụng trong phân tích xu hướng nghiên cứu khoa học tại Trường Đại học Cần Thơ
Tác giả: Nguyễn, Hùng Dũng
Trương, Xuân Việt
Trương, Quốc Định
Lương, Huy Nhật
Huỳnh, Gia Khương
Nguyễn, Hoàng Việt
Từ khoá: Big Data
Hệ thống tệp phân tán
Chỉ mục nghịch đảo
Solr
Lucene
Tìm kiếm toàn văn
Năm xuất bản: 2016
Tùng thư/Số báo cáo: Tạp chí Nghiên cứu Khoa học Trường Đại học Cần Thơ;Số 45(A) .- Tr.01-11
Tóm tắt: Mục tiêu của bài viết là đề xuất mô hình quản lý và khai thác hữu hiệu các dữ liệu phong phú, đa dạng đang tồn tại dưới dạng các văn bản, bảng tính của một tổ chức. Bên cạnh đó, Các tác giả cũng đề xuất giải pháp công nghệ cụ thể dựa trên các nền tảng Big Data phổ biến, bao gồm: (1) HDFS (Hadoop Distributed File System) của Hadoop dùng trong quản lý tập tin, (2) Lucene để lập chỉ mục nghịch đảo (Inverted Index) cho văn bản và (3) Apache Solr hỗ trợ cơ chế quản lý chỉ mục nghịch đảo, tìm kiếm toàn văn và một số chức năng tìm kiếm nâng cao. Bài viết cũng trình bày kết quả thực nghiệm, tổng hợp kết quả và trình bày biểu đồ thống kê của việc áp dụng mô hình trong phân tích xu hướng nghiên cứu khoa học tại Trường Đại học Cần Thơ.
Định danh: https://dspace.ctu.edu.vn/jspui/handle/123456789/84009
ISSN: 1859-2333
Bộ sưu tập: Trong Đại học Cần Thơ

Các tập tin trong tài liệu này:
Tập tin Mô tả Kích thước Định dạng  
_file_
  Giới hạn truy cập
3.56 MBAdobe PDF
Your IP: 3.21.43.192


Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.