What is Semantic Technology?
Xem
thêm: Dữ
liệu Mở liên kết - Linked Open Data.
Công
nghệ ngữ nghĩa (Semantic Technology), như bản thân cụm từ
đó gợi ý, sử dụng các ngữ nghĩa chính thống để đưa
ra ý nghĩa cho tất cả các dữ liệu thô và tạp nham bao
quanh chúng ta. Công nghệ Web Ngữ nghĩa
(Semantic Web Technology) - hoặc công nghệ về Web Dữ liệu
hoặc công nghệ Dữ
liệu Liên kết (Linked Data) như được
nhà phát minh ra World Wide Web, ngài Tim Berners-Lee hình
dung - xây dựng các mối quan hệ
giữa dữ liệu với các định dạng và các nguồn khác
nhau, từ chuỗi này tới chuỗi khác, giúp xây dựng ngữ
cảnh và tạo ra các đường liên kết bên ngoài các mối
quan hệ đó.
Công
nghệ Ngữ nghĩa xác định và liên kết các dữ liệu
trên web hoặc bên trong doanh nghiệp bằng việc phát triển
các ngôn ngữ để thể hiện các mối quan hệ qua lại
giàu có, tự mô tả của dữ liệu ở dạng mà các
máy tính
có thể xử lý được. Vì thế, máy tính không chỉ
có khả năng xử lý các chuỗi dài các ký tự tính toán
và đánh chỉ số cho hàng đống các dữ liệu, mà chúng
còn có khả năng để lưu trữ, quản lý và truy xuất
thông tin dựa vào các mối quan hệ có ý nghĩa và logic.
Các ngữ nghĩa bổ sung một lớp khác
cho web và có khả năng để chỉ ra các hạng mục sự
việc có liên quan thay vì chỉ là các từ trùng khớp
nhau.
Ngó
qua công nghệ ngữ nghĩa
Các
công nghệ cơ bản của Công nghệ Ngữ nghĩa, cơ
sở dữ liệu đồ
họa ngữ
nghĩa (semantic graph),
ví
dụ thế, sử dụng tập hợp các tiêu chuẩn vạn năng,
như được cộng đồng quốc tế Nhóm Word Wide Web (W3C)
thiết lập để phát triển các tiêu chuẩn mở.
“Sự
khác biệt cốt lõi giữa các Công nghệ Ngữ nghĩa và các
công nghệ khác về dữ liệu, ví dụ như cơ
sở dữ liệu quan
hệ, là Công
nghệ Ngữ nghĩa làm việc với ý nghĩa thay vì cấu trúc
của dữ liệu”.
Sáng
kiến Semantic Web
của W3C nêu rằng mục đích của công nghệ này trong ngữ
cảnh của web ngữ nghĩa là để tạo ra ‘phương tiện
vạn năng để trao đổi dữ liệu’ bằng việc liên kết
lẫn nhau một cách trơn tru việc chia sẻ toàn cầu bất
kỳ dạng dữ liệu nào, gồm các dữ liệu cá nhân,
thương mại, khoa học và văn hóa. W3C đã phát triển các
đặc tả mở cho những người phát triển công nghệ ngữ
nghĩa để gắn vào và đã nhận diện, qua sự phát triển
nguồn mở, các thành phần hạ tầng cần thiết để mở
rộng phạm vi trên Web, và có khả năng áp dụng được ở
những nơi khác.
Về
Công nghệ Ngữ nghĩa, các tiêu chuẩn áp dụng trước hết
là Khung Mô tả Tài nguyên - RDF (Resource Description
Framework), giao thức SPARQL và ngôn ngữ truy vấn RDF -
SPARQL (SPARQL Protocol and RDF Query Language), và tùy chọn Ngôn
ngữ Bản thể học Web - OWL (Web Ontology Language).
-
RDF(S), hoặc bộ 3 (triples), là định dạng mà Công nghệ Ngữ nghĩa sử dụng để lưu trữ dữ liệu trong các cơ sở dữ liệu đồ họa.
-
SPARQL là ngôn ngữ truy vấn ngữ nghĩa của Web Ngữ nghĩa, nó được thiết kế đặc biệt để truy vấn các dữ liệu qua các hệ thống và các cơ sở dữ liệu khác nhau và để truy xuất và xử lý các dữ liệu được lưu trữ ở định dạng RDF.
-
OWL (tùy chọn) là ngôn ngữ dựa vào logic tính toán, nó được thiết kế để chỉ ra sơ đồ dữ liệu và trình bày tri thức giàu có và phức tạp của hệ thống tôn ti trật tự của mọi điều và các mối quan hệ giữa chúng. Nó bổ sung cho RDF và cho phép chính thức hóa sơ đồ/bản thể học dữ liệu trong một lĩnh vực cho trước nhất định, tách bạch khỏi bản thân các dữ liệu đó.
Việc
sử dụng tất cả các tiêu chuẩn đó, Công nghệ Ngữ
nghĩa làm cho cuộc sống dễ dàng hơn bằng việc giúp cho
các máy tính giúp đỡ chúng ta cách để tìm đúng mẩu
dữ liệu tức thì và cách để lọc các hạng mục để
tạo ra giá trị nhiều hơn.
Ứng
dụng công nghiệp của Công nghệ Ngữ nghĩa
Công
nghệ Ngữ nghĩa giúp những người
sử dụng và các doanh nghiệp
phát hiện ra các dữ liệu thông minh hơn, kết nối lẫn
nhau và trích xuất tri thức từ các tập hợp khổng lồ
các dữ liệu thô ở các định dạng khác nhau và từ các
nguồn khác nhau. Web Ngữ nghĩa, với công nghệ như
GraphDB,
làm cho nội dung dữ liệu dễ dàng hơn cho các máy tính
để tích hợp, tìm kiếm, truy cập, truy xuất, xử lý và
tự động hóa. Điều này, tới lượt nó, cho phép các tổ
chức giành được sự truy cập nhanh hơn và có hiệu quả
hơn về chi phí tới các dữ liệu có ý nghĩa và chính
xác, để phân tích dữ liệu đó và biến nó thành tri
thức. Sau đó họ có thể sử dụng tiếp tri thức đó để
giành được sự thấu hiểu, áp dụng các mô hình dự
đoán và đưa ra các quyết định được dữ liệu dẫn
dắt.
Các
doanh nghiệp khác nhau đang sử dụng rồi các công nghệ
ngữ nghĩa và các cơ
sở dữ liệu đồ họa
để quản lý nội dung của họ, để tái mục đích và
sử dụng lại thông tin, để cắt giảm các chi phí và
giành được các dòng doanh thu mới. BBC, FT, và Elsevier sử
dụng xuất bản ngữ nghĩa; trong y tế và các khoa học
đời sống Astra Zeneca cũng sử dụng công nghệ ngữ
nghĩa. Các công ty bảo hiểm và giới công nghiệp tài
chính cũng đã bắt đầu áp dụng các công nghệ để làm
giàu nội dung theo ngữ nghĩa và truy cập và xử lý các
dữ liệu phức tạp và hỗn tạp. Thương mại điện tử,
giới công nghiệp ô tô, chính phủ và khu vực nhà nước,
các nhà cung cấp công nghệ, lĩnh vực năng lượng, lĩnh
vực các dịch vụ, trong số các lĩnh vực khác, cũng đang
sử dụng các nhà phát triển công nghệ ngữ nghĩa để
trích xuất tri thức từ dữ liệu bằng việc gắn
ý nghĩa cho các tập hợp dữ liệu khác nhau.
Ý
nghĩa, đây là những gì Web Ngữ nghĩa nhắm tới
Đầu
năm 2007, ngài Berners-Lee đã
nói với Bloomberg
“Công nghệ Ngữ nghĩa vốn dĩ không phức tạp. Ngôn ngữ
Công nghệ Ngữ nghĩa, ở trong tâm của nó, là rất, rất
đơn giản. Nó chỉ là về các mối quan hệ giữa mọi
điều”. Các cơ hội là ‘các mối quan hệ giữa tất
cả mọi điều’ sẽ làm cho cuộc sống của tất cả
những người
sử dụng dễ dàng hơn
và sẽ giúp cho các tổ chức quản lý dữ liệu có hiệu
quả hơn để tạo ra các dữ liệu ngày càng thông minh
hơn và giành được giá trị nhiều hơn.
Nếu
bạn muốn trực tiếp bắt đầu làm việc với các cơ sở
dữ liệu đồ họa, hãy thử GraphDB Free trên máy tính của
bạn, nó là tự do.
Semantic
Technology, as the phrase itself suggests, uses formal semantics to
give meaning to all the disparate and raw data that surrounds us. The
Semantic Web Technology – or technology for the Web of Data or the
Linked
Data technology as envisioned
by World Wide Web inventor Sir Tim Berners-Lee – builds
relationships between data in various formats and sources, from one
string to another, helping build context and creating links out of
those relationships.
The
Semantic Technology defines and links data on the web or within an
enterprise by developing languages to express rich, self-describing
interrelations of data in a form that machines can process. Thus,
machines are not only able to process long computing strings of
characters and index tons of data, but they are also able to store,
manage and retrieve information based on meaning and logical
relations. Semantics adds another layer to the web and is able to
show related factsitems instead of just word matching.
Semantic Technology at a Glance
The
principal technologies of the Semantic Technology, the semantic
graph database for example, use a set of universal standards, as
set down by the World Wide Web Consortium (W3C) international
community that develops open standards.
“The core difference between Semantic Technologies and other technologies for data, the relational database for instance, is that the Semantic Technology deals with the meaning rather than the structure of the data.
W3C’s
Semantic Web initiative
states that the purpose of this technology in the context of the
semantic web to create a ‘universal medium for the exchange of
data’ by smoothly interconnecting the global sharing of any kind of
personal, commercial, scientific and cultural data. W3C has developed
open specifications for the semantic technology developers to stick
to and has identified, via open source development, the
infrastructure parts that will be needed to scale in the Web, and
applicable elsewhere .
In
terms of Semantic Technology, the standards that apply are primarily
the Resource Description Framework (RDF), SPARQL (SPARQL Protocol and
RDF Query Language), and optionally OWL (Web Ontology Language).
-
RDF(S), or triples, is the format the Semantic Technology uses to store data in graph databases.
-
SPARQL is the semantic query language of the Semantic Web, which is specifically designed to query data across various systems and databases and to retrieve and process data stored in RDF format.
-
(optionally) OWL is the computational logic-based language which is designed to show the data schema and represents rich and complex knowledge about hierarchies of things and the relations between things. It is complementary to RDF and allows for formalizing a data schema/ontology in a given domain, separately from the data itself.
Using
all those standards, the Semantic Technology makes life easier by
helping computers help us how to find the right data piece right away
and how to filter items to create more value.
Industry application of Semantic Technology
Semantic
Technology helps users and enterprises discover smarter data, infer
links and extract knowledge from enormous sets of raw data in various
formats and from various sources. The Semantic Web, let’s say that
a technology such as GraphDB
, makes data content easier for machines to integrate, find,
access, retrieve, process and automate. This, in turn, enables
organizations to gain faster and more cost-effective access to
meaningful and accurate data, to analyze that data and turn it into
knowledge. Then they can further use that knowledge to gain insights,
apply predictive models and make data-driven decisions.
Various
businesses are already using semantic technologies and graph
databases to manage their content, repurpose and reuse information,
cut costs and gain new revenue streams. The BBC, FT and Elsevier use
semantic publishing; in healthcare and life sciences Astra Zeneca
also uses semantic technology. The financial industry and insurance
companies have also started adopting technologies to semantically
enrich content and access and process complex and heterogeneous data.
E-commerce, the automotive industry, the government and public
sector, technology providers, the energy sector, the services sector,
among others, are also employing semantic technology developers to
extract knowledge from data by attributing meaning to various
datasets.
Meaning, this is what the Semantic Web is all about.
As
early as in 2007, Sir Berners-Lee told
Bloomberg “The Semantic Technology isn’t inherently complex.
The Semantic Technology language, at its heart, is very, very simple.
It’s just about the relationships between things.”
Chances are that the ‘relationships between things’ will make the lives of all users easier and will help organizations manage data more efficiently to create more and more smarter data and gain more value.
Chances are that the ‘relationships between things’ will make the lives of all users easier and will help organizations manage data more efficiently to create more and more smarter data and gain more value.
If you want to directly start working with graph databases try GraphDB Free on your machine, its Free.
Dịch:
Lê Trung Nghĩa
Không có nhận xét nào:
Đăng nhận xét
Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.