The FAIR Data Principles
Các
nguyên tắc Dữ liệu FAIR
Lời
nói đầu
Một
trong những thách thức của khoa học tăng cường dữ liệu
là để tạo thuận lợi để phát hiện tri thức bằng
việc hỗ
trợ cho con người và máy
trong phát hiện chúng để, truy cập tới, tích hợp và
phân tích, thực hiện các tác vụ đúng thích hợp đối
với dữ liệu khoa học và liên kết tới các thuật toán
và tiến trình công việc của chúng. Ở đây chúng tôi mô
tả FAIR - một tập hợp các nguyên tắc chỉ dẫn để
làm cho dữ liệu Tìm thấy được, Truy cập được, Tương
hợp được, và Sử dụng lại được (Findable,
Accessible, Interoperable, and Re-usable).
Để
tìm thấy được (Findable):
F1:
(siêu) dữ liệu chỉ định một mã
thường trực toàn cầu duy nhất và vĩnh viễn
F2:
dữ liệu được mô tả với siêu
dữ liệu giàu (rich metadata).
F3:
(siêu) dữ liệu được đăng ký hoặc được đánh chỉ
mục trong tài nguyên có khả năng tìm kiếm được.
F4:
siêu dữ liệu chỉ
định
mã dữ liệu.
Để
có khả năng Truy cập được (Accessible):
A1:
(siêu) dữ liệu có khả năng truy xuất được bằng mã
của chúng khi sử dụng giao thức truyền thông được
tiêu chuẩn hóa.
A1.1:
giao thức đó là mở, tự do, và triển khai được
vạn năng.
A1.2:
giao thức đó cho phép thủ tục xác thực và ủy
quyền, ở những nơi cần thiết.
A2:
siêu dữ
liệu là truy cập được,
thậm chí khi dữ liệu không còn tồn tại nữa.
Để
có khả năng tương hợp được (Interoperable)
:
I1:
(siêu) dữ liệu sử dụng ngôn ngữ chính thống, truy
cập được, được chia sẻ và áp dụng được rộng rãi
để trình bày tri thức.
I2:
(siêu) dữ liệu sử dụng các từ vựng tuân theo các
nguyên tắc FAIR.
I3.
(siêu) dữ liệu gồm các tham chiếu đủ điều kiện
tới (siêu) dữ liệu khác.
Để
sử dụng lại được (Re-usable):
R1:
(siêu) dữ liệu có nhiều thuộc tính chính xác và
thích hợp.
R1.1:
(siêu) dữ liệu được phát hành với giấy phép sử
dụng dữ liệu rõ ràng và truy cập được.
R1.2:
(siêu) dữ liệu có liên kết tới gốc gác của
chúng.
R1.3:
(siêu) dữ liệu đáp
ứng được các tiêu chuẩn cộng đồng phù hợp với
lĩnh vực.
FAIR
Data Principles
Preamble
One
of the grand challenges of data-intensive science is to facilitate
knowledge discovery by assisting humans and machines in their
discovery of, access to, integration and analysis of,
task-appropriate scientific data and their associated algorithms and
workflows. Here, we describe FAIR
-
a set of guiding principles to make data Findable,
Accessible, Interoperable, and Re-usable.
To
be Findable:
F1.
(meta)data are assigned a globally unique and eternally persistent
identifier
F2.
data are described with rich metadata.
F3.
(meta)data are registered or indexed in a searchable resource.
F4.
metadata specify the data identifier.
To
be Accessible:
A1
(meta)data are retrievable by their identifier using a
standardized communications protocol.
A1.1 the protocol is open, free, and universally implementable.
A1.2 the protocol allows for an authentication and authorization procedure, where necessary.
A2 metadata are accessible, even when the data are no longer available.
A1.1 the protocol is open, free, and universally implementable.
A1.2 the protocol allows for an authentication and authorization procedure, where necessary.
A2 metadata are accessible, even when the data are no longer available.
To
be Interoperable:
I1.
(meta)data use a formal, accessible, shared, and broadly
applicable language for knowledge representation.
I2.
(meta)data use vocabularies that follow FAIR principles.
I3.
(meta)data include qualified references to other (meta)data.
To
be Re-usable:
R1.
meta(data) have a plurality of accurate and relevant
attributes.
R1.1. (meta)data are released with a clear and accessible data usage license.
R1.2. (meta)data are associated with their provenance.
R1.3. (meta)data meet domain-relevant community standards.
R1.1. (meta)data are released with a clear and accessible data usage license.
R1.2. (meta)data are associated with their provenance.
R1.3. (meta)data meet domain-relevant community standards.
Dịch:
Lê Trung Nghĩa
Không có nhận xét nào:
Đăng nhận xét
Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.