Trong lĩnh vực khoa học máy tính, định nghĩa về Ontology đã chuyển từ việc tập trung vào các đặc tả hình thức, rõ ràng của các khái niệm được chia sẻ sang nhấn mạnh vào việc xác định một tổ chức chặt chẽ và toàn diện của một miền tri thức. Wordnet từ Đại học Princeton định nghĩa Ontology là sự biểu diễn có thứ bậc của một miền tri thức chứa tất cả các thực thể liên quan và các mối quan hệ của chúng. Ngày càng có nhiều nghiên cứu đề cập đến Ontology như một phương tiện để biểu diễn tri thức được đặc trưng bởi nhiều khái niệm với các mối quan hệ giữa các khái niệm cũng được biểu diễn.
Rodrigues và cộng sự lưu ý rằng một Ontology có thể được ánh xạ bằng các công cụ dựa trên máy tính, do đó cho phép miền tri thức được chuẩn hóa và chia sẻ. Ví dụ: công cụ Oracle 10g sử dụng Ontology để mô tả siêu dữ liệu, đặc tả mô hình miền và tích hợp dữ liệu. Như Bobillo và cộng sự đã chỉ ra, các Ontology tạo ra các mẫu để biểu diễn mối quan hệ giữa các mô tả ngữ cảnh và các tập con miền. Mẫu Ontology có thể được sử dụng để cho phép suy luận, phân tích và tái sử dụng kiến thức miền.
Các ấn phẩm gần đây và nghiên cứu thực nghiệm cho thấy cơ sở tri thức được xây dựng từ các tài liệu có thể được sử dụng để mô hình hóa ý nghĩa của văn bản. Vì ý nghĩa của văn bản không được thể hiện rõ ràng ngay từ các từ hoặc cụm từ nên các mẫu ngữ nghĩa được trích xuất từ văn bản được sử dụng để viết tóm tắt và phân tích ý nghĩa bị ràng buộc bởi Ontology. Theo Buitelaar và cộng sự, một Ontology cũng có thể được sử dụng như một lược đồ cơ sở dữ liệu, giúp chính thức hóa dữ liệu liên quan đến việc tóm tắt và thể hiện ý nghĩa theo từ vựng. Lược đồ Ontology cung cấp kiến thức nền tảng có giá trị và thể hiện các mối quan hệ nhân quả trong văn bản.
Zheng và cộng sự đã chứng minh cách trình bày kiến thức trong lĩnh vực bằng các khái niệm và mối quan hệ được đánh giá bằng điểm phù hợp, điểm số này được sử dụng để đánh giá liệu bản tóm tắt có liên quan đến một chủ đề cụ thể hay không. Các chuyên gia chú thích các cụm từ khóa để có thể suy ra mối quan hệ có ý nghĩa giữa các từ. Do đó, Ontology mô tả ngữ nghĩa của nguồn thông tin và làm cho nội dung trở nên rõ ràng.
Cuối cùng, Joung và Chuang đưa ra một cuộc thảo luận sâu rộng về các ứng dụng để phát triển các Ontology ngang hàng (P2P). Các Ontology này được bắt nguồn từ các Ontology ngang hàng nhằm xác định các từ và cụm từ tạo điều kiện thuận lợi cho việc xử lý và trích xuất văn bản để tóm tắt.
Tài liệu tham khảo:
1. Trappey, A.J., Trappey, C.V. & Wu, CY. Automatic patent document summarization for collaborative knowledge systems and services. J. Syst. Sci. Syst. Eng. 18, 71–94 (2009). https://doi.org/10.1007/s11518-009-5100-7.
Web lưu trữ kiến thức cá nhân đã tham khảo và thấy hữu ích cho người đọc. Các bạn có thể đóng góp bài viết qua địa chỉ: dzokha1010@gmail.com