Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://dspace.ctu.edu.vn/jspui/handle/123456789/127484
Nhan đề: XÂY DỰNG NỀN TẢNG BÁCH KHOA TRI THỨC MỞ VỀ GIỐNG CÂY TRỒNG VÀ KỸ THUẬT CANH TÁC – PHÂN HỆ SỔ TAY NÔNG NGHIỆP
Nhan đề khác: BUILDING A WIKI-BASED OPEN KNOWLEDGE PLATFORM FOR CROP VARIETIES AND CULTIVATION TECHNIQUES – AGRICULTURAL NOTEBOOK MODULE
Tác giả: Lưu, Tiến Đạo
Nguyễn, Đoàn Hoàng Phúc
Từ khoá: KHOA HỌC MÁY TÍNH
Năm xuất bản: 2026
Nhà xuất bản: Đại Học Cần Thơ
Tóm tắt: WikiCrop là nền tảng bách khoa tri thức mở về giống cây trồng và kỹ thuật canh tác do các giảng viên tại Đại học Cần Thơ phát triển, hướng đến việc cung cấp thông tin khoa học cho các loại cây trồng phổ biến tại Đồng bằng sông Cửu Long. Hệ thống vận hành theo mô hình tương tự Wikipedia, cho phép người dùng đóng góp và chia sẻ nội dung. Nhằm hỗ trợ người dùng tổng hợp tài liệu và tạo nội dung thuận tiện hơn, phân hệ “Sổ tay nông nghiệp” được đề xuất để chuyển đổi các tài liệu thu thập được thành những bài viết có cấu trúc thống nhất. Về mặt kỹ thuật, hệ thống sử dụng các thư viện chuyên dụng để trích xuất thông tin từ nhiều nguồn dữ liệu đầu vào, bao gồm PyMuPDF cho tập tin PDF, python-docx cho tập tin DOCX, Trafilatura cho trang web, Whisper cho dữ liệu âm thanh và video, cùng youtube-transcript-api hoặc yt-dlp cho nội dung YouTube. Sau đó, hệ thống áp dụng phương pháp RAG kết hợp với mô hình ngôn ngữ lớn (LLM) để truy xuất thông tin liên quan và tạo nội dung bài viết theo dàn ý. Hệ thống được đánh giá thông qua các phương pháp kiểm thử như độ tương đồng chuỗi cho quá trình trích xuất dữ liệu, cùng các chỉ số Claim Recall, Citation Precision và Citation Recall nhằm đo lường độ chính xác của nội dung và khả năng trích dẫn nguồn. Kết quả cho thấy hệ thống có thể chuyển đổi dữ liệu từ nhiều nguồn khác nhau thành bài viết có cấu trúc dựa trên dàn ý do người dùng cung cấp. Mỗi thông tin trong bài viết đều được gắn kèm nguồn tham chiếu từ tài liệu gốc, giúp người dùng dễ dàng kiểm tra và chỉnh sửa khi cần. Phân hệ được tích hợp vào WikiCrop nhằm hỗ trợ quá trình tổng hợp tri thức trên nền tảng. WikiCrop is a wiki-based open platform on crop varieties and cultivation techniques, developed by lecturers at Can Tho University, aiming to provide scientific information on common crops in the Mekong Delta. The system operates in a manner similar to Wikipedia, allowing users to contribute and share content. To support users in compiling documents and generating content more efficiently, the “Agricultural Handbook” module is proposed to convert collected materials into articles with a unified structure. Technically, the system uses specialized libraries to extract information from various input data sources, including PyMuPDF for PDF files, python-docx for DOCX files, Trafilatura for web content, Whisper for audio and video, and youtube-transcript-api or yt-dlp for YouTube data. It then applies the RAG method combined with a large language model (LLM) to retrieve relevant information and generate article content based on a predefined outline. The system is evaluated using testing methods such as string similarity for data extraction, along with metrics including Claim Recall, Citation Precision, and Citation Recall to assess content accuracy and the system’s ability to provide reliable source citations. Results show that the system can transform data from multiple sources into structured articles based on user-provided outlines. Each piece of information in the article is accompanied by a reference to the original document, making it easy for users to verify and edit when necessary. The module is integrated into WikiCrop to support the process of knowledge compilation on the platform.
Mô tả: 77 Tr
Định danh: https://dspace.ctu.edu.vn/jspui/handle/123456789/127484
Bộ sưu tập: Trường Công nghệ Thông tin & Truyền thông

Các tập tin trong tài liệu này:
Tập tin Mô tả Kích thước Định dạng  
_file_
  Giới hạn truy cập
3.67 MBAdobe PDF
Your IP: 216.73.216.231


Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.