Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/45253
Nhan đề: TRÍCH XUẤT DỮ LIỆU TỪ PHIẾU THÔNG TIN HỌC VIÊN
Tác giả: Lưu, Tiến Đạo
Nguyễn, Tấn Thành
Từ khoá: KHOA HỌC MÁY TÍNH
Năm xuất bản: 2021
Nhà xuất bản: Trường Đại Học Cần Thơ
Tóm tắt: Ngày nay, việc chuyển đổi dữ liệu trên các biểu mẫu, trên giấy thành dữ liệu có thể lưu trữ trên máy tính đang được các cơ quan tổ chức hành chánh văn phòng và doanh nghiệp thực hiện hàng ngày, cùng với đó bài toán nhận dạng biểu mẫu tự động là bài toán dành được nhiều sự quan tâm của các nhà khoa học trong và ngoài nước. Nhận dạng biểu mẫu tự động mang lại những lợi ích nhất định như giảm chi phí thuê đội ngũ nhập liệu, tăng năng suất nhập liệu,... Nắm bắt được những vấn đề trên, nghiên cứu “Trích xuất dữ liệu từ phiếu thông tin học viên” sẽ phần nào đáp ứng được những nhu cầu trên. Bài toán này được thực hiện gồm hai phần. Phần thứ nhất, xây dựng hệ thống quản lý công tác tuyển sinh dựa trên công cụ hỗ trợ Framework Laravel để thiết kế các phân hệ nhập liệu, quản lý tài khoản nhân viên, quản lý mùa tuyển sinh, thống kê. Hệ thống quản lý công tác tuyển sinh lưu trữ cơ sở dữ liệu sử dụng MySQL. Phần thứ hai, xây dựng hệ thống trích xuất phiếu thông tin học viên dựa trên công cụ hỗ trợ Flask Python, trích xuất và nhận dạng chữ viết tay Tiếng Việt trên phiếu thông tin học viên. Bài toán này được thực hiện qua nhiều công đoạn như thu thập dữ liệu, tiền xử lý dữ liệu, khử nghiêng, cắt ảnh, dữ liệu cuối cùng là các ô vuông chứa ký tự Tiếng Việt có dấu hoặc không, nghiên cứu sử dụng thư viện mã nguồn mở OpenCV để xử lý ảnh và NumPy để tính toán trên ma trận, nhận dạng ảnh sau khi cắt sử dụng học sâu, dữ liệu sau khi nhận dạng. Hệ thống trích xuất phiếu thông tin học viên sẽ gọi API do hệ thống quản lý công tác tuyển sinh cung cấp, cuối cùng là lưu trữ dữ liệu vào cơ sở dữ liệu của hệ thống quản lý công tác tuyển sinh. Nhìn chung “Trích xuất dữ liệu từ phiếu thông tin học viên”, là một hệ thống thông tin lớn bao gồm hai hệ thống con. Thứ nhất, hệ thống quản lý công tác tuyển sinh. Thứ hai, hệ thống trích xuất chữ viết tay Tiếng Việt trên phiếu thông tin, độ chính xác của mô hình nhận dạng chữ viết tay Tiếng Việt lên đến 94.26%, trên tập dữ liệu ký tự Tiếng Việt gồm 75,600 tập tin ảnh.
Mô tả: 83 Tr
Định danh: https://dspace.ctu.edu.vn/jspui/handle/123456789/45253
Bộ sưu tập: Trường Công nghệ Thông tin & Truyền thông

Các tập tin trong tài liệu này:
Tập tin Mô tả Kích thước Định dạng  
_file_
  Giới hạn truy cập
5.41 MBAdobe PDF
Your IP: 18.226.96.61


Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.