GraphDB ™ Fundamentals
Xem
thêm: Dữ
liệu Mở liên kết - Linked Open Data.
Cơ bản về GraphDB™
Những
điều cơ bản về GraphDB™ xây dựng cơ sở để làm
việc với các cơ
sở dữ liệu đồ thị
sử dụng các tiêu chuẩn của W3C và
đặc biệt GraphDB™. Đây là lớp huấn luyện đã đưa
ra hàng loạt 9 video
sẽ đi với bạn trong các bước đầu sử dụng các
cơ
sở dữ liệu đồ thị
triplestore.
-
Học những điều cơ bản về các tiêu chuẩn của W3C cho các cơ sở dữ liệu đồ thị theo 3 chủ đề chính: RDF & RDFS, SPARQL và Bản thể học (Ontology).
-
Đi theo với các chỉ dẫn cài đặt và thiết lập cấu hình GraphDB để bắt đầu với các truy vấn đầu tiên của bạn hoặc tải các tập hợp dữ liệu của bạn.
-
Cuối cùng có được tối đa sự hiểu biết về chức năng của GraphDB, các chiến lược với các lý do của nó; RDFRank, không gian địa lý Geo-spatial và các mở rộng tìm kiếm toàn văn; và nơi nào để bắt đầu khi có hỏng hóc.
Đừng quên một điều
- đăng ký kênh
YouTube của bạn - và đi
theo chúng tôi trên Twitter
Module 1 – RDF(S)
RDF là định dạng
được tiêu chuẩn hóa cho trình bày dữ liệu đồ thị.
Module này giới thiệu RDF, những gì RDFS thêm vào nó, và
cách sử dụng nó bằng những ví dụ đễ đi theo từ
biếm họa “Flintstones”.
Module 2 – SPARQL
SPARQL là ngôn ngữ
truy vấn tương tự như SQL cho dữ liệu RDF. Nó được
thừa nhận như là một trong những công cụ chính của
công nghệ Ngữ nghĩa và từng được W3C làm thành tiêu
chuẩn. Module này đề cập tới cơ bản về SPARQL, đủ
để tạo cho bạn đồ thị RDF đầu tiên và chạy các
truy vấn SPARQL đầu tiên của bạn.
Module 3 - Bản thể học
Module
này xem xét các bản thể học – Ontologies: bản thể học
là gì; dạng tài nguyên nào nó mô tả; và đâu là những
lợi ích của việc sử dụng bản thể học. Bản thể
học là cốt lõi của cách thức chúng ta mô hình hóa tri
thức theo ngữ
nghĩa. Chúng
là một phần của tất cả các tập hợp Dữ liệu Liên
kết.
Module 4 - Cài đặt GraphDB
Video
này chỉ dẫn bạn qua 5 bước trong việc thiết lập
GraphDB của
bạn: từ việc tải về và triển khai các tệp
war tới Máy chủ Ứng dụng Tomcat của bạn, qua việc khởi
tạo Workbench (công cụ quản trị GraphDB), tới việc cuối
cùng tạo cơ
sở dữ liệu và chèn vào và lựa chọn dữ
liệu trong nó. Ví dụ ưa thích của chúng tôi từ
Flintstones là sẵn sàng ở đây như là dữ liệu để bạn
bắt đầu.
Module 5 - Tinh chỉnh hiệu năng & mở rộng phạm vi
Module
này cung cấp thông tin về cách thiết lập cấu hình cho
GraphDB để có hiệu năng và khả năng mở rộng phạm vi
tối ưu. Kích cỡ của các tập hợp dữ liệu và các
trường hợp điển hình hưởng lợi từ các cấu hình bộ
nhớ GraphDB khác nhau.
Hãy
xem video này
để học được nhiều hơn về 4 yếu tố bạn có thể
kiểm soát cũng như cách sử dụng công cụ cấu hình
GraphDB. Các gợi ý về dành riêng bộ nhớ trong thời gian
tải và vận hành bình thường cũng được đưa ra.
Module 6 – GraphDB Workbench & Sesame
GraphDB
Workbench là công cụ quản trị dựa vào web mà cho phép
bạn quản lý các kho GDB, tải và xuất khẩu dữ liệu,
giám sát thực thi truy vấn, phát triển và thực thi các
truy vấn, quản lý các kết nối và những người
sử dụng. Trong video
này chúng tôi cung cấp tổng quan ngắn gọn chức
năng chính mà bạn sẽ sử dụng hầu hết mọi lúc.
Module 7 - Tải dữ liệu
Dữ
liệu là tài sản có giá trị nhất và GraphDB được
thiết kế để lưu trữ và cải tiến nó. Module này chỉ
cho bạn cách sử dụng GraphDB Workbench để tải các tệp
riêng rẽ và đánh đống dữ liệu từ các thư mục. Đối
với các tập hợp dữ liệu khổng lồ thì chúng tôi
khuyến cáo tăng tốc độ quy trình đó bằng việc sử
dụng trình tải đánh đống Parallel (song song).
Module
8 – Tập hợp quy tắc & các chiến lược lập luận
Module
này đưa ra các chiến lược lập luận (cách để có
thông tin mới từ dữ liệu của bạn) cũng như tập hợp
quy tắc được GraphDB sử dụng. 3 chiến lược lập luận
khác nhau được thảo luận là: xâu chuỗi tiến, xâu
chuỗi lùi, xâu chuỗi hỗn hợp. Chúng hỗ trợ cho sự
tối ưu hóa lập luận khác nhau của GraphDB, nghĩa là sử
dụng owl:SameAs
Module 9 - Các mở rộng
-
Module này trình bày 3 mở rộng trang bị cho các truy vấn RDFRank của GraphDB tính toán các kết nối của các nút - tương tự với thuật toán PageRank (Xếp hạng trang) nổi tiếng.
-
Các truy vấn không gian địa lý trích xuất dữ liệu được đặt trong các hình tam giác, các hình đa giác và các hình tròn.
-
Tìm kiếm toàn văn đưa ra đánh giá nhanh hơn cho dữ liệu văn bản dựa vào Apache Lucene, Solr và ElasticSearch
Module 10 - Sửa chữa hỏng hóc
Module
này đề cập tới việc sửa chữa hỏng hóc cho vài vấn
đề phổ biến. Các vấn đề đó bao gồm cả các vấn
đề cài đặt và vận hành. Các vấn đề cài đặt bao
gồm: Workbench, Lucene, Informatiq và các tệp quy tắc tùy
biến. Các vấn đề vận hành gồm: các tính toán lệnh,
xóa các lệnh và socket timeouts.
GraphDB™ Fundamentals
GraphDB™
Fundamentals builds the basis for working with graph databases that
utilize the W3C standards and particularly GraphDB™. It is a
training class delivered in a series of nine videos that will
accompany you in your first steps of using triplestore graph
databases.
-
Learn the fundamentals of W3C standards for graph databases in the first three topics: RDF & RDFS, SPARQL and Ontology.
-
Follow with GraphDB installation and set-up instructions to start with your firs query or load your datasets.
-
Finally get maximum of GraphDB functionality understanding its reasoning strategies; RDFRank, Geo-spatial and Full-Text-Search extensions; and where to start while troubleshooting.
Don’t
miss a thing – subscribe to our
YouTube channel – and follow
us on Twitter
Module 1 – RDF(S)
RDF is a
standardized format for graph data representation. This module
introduces RDF, what RDFS adds to it, and how to use it by
easy-to-follow examples from “The Flintstones” cartoon.
Module 2 – SPARQL
SPARQL is a
SQL-like query language for RDF data. It is recognized as one of the
key tools of the Semantic technology and was made a standard by W3C.
This module covers the basis of SPARQL, sufficient to create you
first RDF graph and run you first SPARQL queries.
Module 3 – Ontology
This module
looks at Ontologies: what is ontology; what kind of resources does it
describe; and what are the benefits of using ontologies. Ontologies
are the core of how we model knowledge semantically. They are part of
all Linked Data sets.
Module 4 – GraphDB Installation
This video
guides you through five steps in setting up your GraphDB: from
downloading and deploying war files to your Tomcat Application
Server, through launching Workbench, to final creation of a database
and inserting and selecting data in it. Our favourite example from
The Flintstones is available here as data for you to start with.
Module 5 – Performance Tuning & Scalability
This
module provides information on how to configure GraphDB for optimal
performance and scalability. The size of datasets and the
specific use cases benefit from different GraphDB memory
configurations.
Watch this video
to learn more about the four elements you can control as well as
how to use GraphDB configuration tool. Tips about memory dedication
during loading time and normal operation are provided as well.
Module 6 – GraphDB Workbench & Sesame
GraphDB
Workbench is a web-based administration tool that allows you to
manage GDB repositories, load and export data, monitor query
execution, developing and executing queries, managing
connectors and users. In this video we provide brief overview of
the main functionality that you’ll be using most of the time.
Module 7 – Loading Data
Data is the most
valuable asset and GraphDB is designed to store and enhance it. This
module shows you how to use GraphDB Workbench to load individual
files and bulk data from directories. For huge datasets we
recommend speeding up the process by using Parallel bulk loader.
Module 8 – Rule Set & Reasoning Strategies
This module
outlines the reasoning strategies (how to get new information
from your data) as well as the rule set that are used by GraphDB. The
three different reasoning strategies that are discussed are: forward
chaining, backward chaining, hybrid chaining. They support various
GraphDB Reasoning optimization e.g. using owl:SameAs
Module 9 – Extensions
-
This module presents three extensions that empower GraphDB queries RDFRank calculates connectives of notes – similar to well known PageRank algorithm.
-
Geo-spatial queries extracts data placed in rectangles, polygons and circles
-
Full test search provides faster assess to textual data based on Apache Lucene, Solr and ElasticSearch
Module 10 – Troubleshooting
This module
covers troubleshooting some common issues. These issues include both
installation and operational issues. Installation issues covered
include: Workbench, Lucene, Informatiq and custom rule files.
Operational issues covered include: statement counts, deleting
statements and socket timeouts.
Dịch:
Lê Trung Nghĩa
Không có nhận xét nào:
Đăng nhận xét
Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.