Chủ Nhật, 2 tháng 7, 2017

Các nguyên tắc Dữ liệu FAIR

The FAIR Data Principles



Các nguyên tắc Dữ liệu FAIR
Lời nói đầu
Một trong những thách thức của khoa học tăng cường dữ liệu là để tạo thuận lợi để phát hiện tri thức bằng việc hỗ trợ cho con người và máy trong phát hiện chúng để, truy cập tới, tích hợp và phân tích, thực hiện các tác vụ đúng thích hợp đối với dữ liệu khoa học và liên kết tới các thuật toán và tiến trình công việc của chúng. Ở đây chúng tôi mô tả FAIR - một tập hợp các nguyên tắc chỉ dẫn để làm cho dữ liệu Tìm thấy được, Truy cập được, Tương hợp được, và Sử dụng lại được (Findable, Accessible, Interoperable, and Re-usable).
Để tìm thấy được (Findable):
F1: (siêu) dữ liệu chỉ định một mã thường trực toàn cầu duy nhất và vĩnh viễn
F2: dữ liệu được mô tả với siêu dữ liệu giàu (rich metadata).
F3: (siêu) dữ liệu được đăng ký hoặc được đánh chỉ mục trong tài nguyên có khả năng tìm kiếm được.
F4: siêu dữ liệu chỉ định mã dữ liệu.


Để có khả năng Truy cập được (Accessible):
A1: (siêu) dữ liệu có khả năng truy xuất được bằng mã của chúng khi sử dụng giao thức truyền thông được tiêu chuẩn hóa.
A1.1: giao thức đó là mở, tự do, và triển khai được vạn năng.
A1.2: giao thức đó cho phép thủ tục xác thực và ủy quyền, ở những nơi cần thiết.
A2: siêu dữ liệu là truy cập được, thậm chí khi dữ liệu không còn tồn tại nữa.


Để có khả năng tương hợp được (Interoperable) :
I1: (siêu) dữ liệu sử dụng ngôn ngữ chính thống, truy cập được, được chia sẻ và áp dụng được rộng rãi để trình bày tri thức.
I2: (siêu) dữ liệu sử dụng các từ vựng tuân theo các nguyên tắc FAIR.
I3. (siêu) dữ liệu gồm các tham chiếu đủ điều kiện tới (siêu) dữ liệu khác.


Để sử dụng lại được (Re-usable):
R1: (siêu) dữ liệu có nhiều thuộc tính chính xác và thích hợp.
R1.1: (siêu) dữ liệu được phát hành với giấy phép sử dụng dữ liệu rõ ràng và truy cập được.
R1.2: (siêu) dữ liệu có liên kết tới gốc gác của chúng.
R1.3: (siêu) dữ liệu đáp ứng được các tiêu chuẩn cộng đồng phù hợp với lĩnh vực.


FAIR Data Principles
Preamble
One of the grand challenges of data-intensive science is to facilitate knowledge discovery by assisting humans and machines in their discovery of, access to, integration and analysis of, task-appropriate scientific data and their associated algorithms and workflows. Here, we describe FAIR - a set of guiding principles to make data Findable, Accessible, Interoperable, and Re-usable.
To be Findable:
F1. (meta)data are assigned a globally unique and eternally persistent identifier
F2. data are described with rich metadata.
F3. (meta)data are registered or indexed in a searchable resource.
F4. metadata specify the data identifier.
To be Accessible:
A1 (meta)data are retrievable by their identifier using a standardized communications protocol.
A1.1 the protocol is open, free, and universally implementable.
A1.2 the protocol allows for an authentication and authorization procedure, where necessary.
A2 metadata are accessible, even when the data are no longer available.
To be Interoperable:
I1. (meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation.
I2. (meta)data use vocabularies that follow FAIR principles.
I3. (meta)data include qualified references to other (meta)data.
To be Re-usable:
R1. meta(data) have a plurality of accurate and relevant attributes.
R1.1. (meta)data are released with a clear and accessible data usage license.
R1.2. (meta)data are associated with their provenance.
R1.3. (meta)data meet domain-relevant community standards.
Dịch: Lê Trung Nghĩa

Không có nhận xét nào:

Đăng nhận xét

Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.