Thứ Hai, 8 tháng 5, 2023

Dữ liệu Mở / dữ liệu FAIR

Open / FAIR Data

Theo: https://sparceurope.org/what-we-do/open-data/

Trong kỷ nguyên số, dữ liệu là vật liệu thô dựa vào đó các phát hiện được xây dựng, và quyền truy cập không có ràng buộc tới dữ liệu nghiên cứu, dù trong Khoa học Đời sống hay Khoa học Xã hội. Là rất quan trọng để tăng tốc sự tiến bộ trong nghiên cứu. Dữ liệu đóng vai trò trung tâm trong khả năng của chúng ta để giúp giải quyết cuộc khủng hoảng Coronavirus, dự báo trước và đối phó chống các thảm họa tự nhiên, để hiểu sinh học của con người, hoặc để phát triển các tiến bộ trong công nghệ điện toán.

Bất kể tầm quan trọng khổng lồ của nó, ngày nay, dữ liệu nghiên cứu phần lớn vẫn bị phân mảnh - bị cô lập khắp hàng triệu máy tính cá nhân, bị khóa bởi các hạn chế khác nhau về kỹ thuật, pháp lý và tài chính.

Lượng dữ liệu khoa học và học thuật tăng trưởng theo số mũ mỗi năm, chúng ta vẫn còn thiếu hạ tầng, các chính sách và thực hành để khai thác nguồn rất quan trọng này. Trong khi vài dự án nổi tiếng — ví dụ như Dự án Gen của con người và Máy va đập Hạt Lớn (Large Hadron Collider) — làm cho dữ liệu của chúng sẵn sàng mở, rất thường thấy dữ liệu không được chia sẻ ngoài những người đã tạo ra nó. Internet đã được các nhà nghiên cứu xây dựng để chia sẻ dữ liệu, nhưng việc chia sẻ dữ liệu còn chưa là chuẩn mục trong nghiên cứu. Dữ liệu nghiên cứu cũng cần phải là Tìm thấy được, Truy cập được, Tương hợp được, Sử dụng lại được - FAIR (Findable, Accessible, Interoperable or Reusable).

Khoảng trống khổng lồ giữa những gì là có thể với công nghệ số và hạ tầng lỗi thời của chúng ta đã dẫn tới lời kêu gọi về Dữ liệu Mở.

Những lợi ích của Dữ liệu Mở và dữ liệu FAIR là rõ ràng (bản dịch sang tiếng Việt).

In the digital age, data is the raw material on which discoveries are built, and unfettered access to research data, whether in the Life Sciences or the Social Sciences. It is crucial to accelerating progress in research. Data plays a central role in our ability to help solve the Coronavirus crisis, predict and counter natural disasters, to understand human biology, or to develop advances in computing technology.

Despite its tremendous importance, today, research data remains largely fragmented—isolated across millions of individual computers, blocked by disparate technical, legal and financial restrictions.

The amount of scientific and scholarly data grows exponentially each year, yet we still lack the infrastructure, policies, and practices to harness this vital resource. While some high profile projects—such as the Human Genome Project and the Large Hadron Collider—make their data openly accessible, too often data isn’t shared beyond those who generate it. The Internet was built by researchers to share data, but data sharing isn’t yet the norm in research. Research data also needs to be FAIR (Findable, Accessible, Interoperable or Reusable).

The tremendous gap between what is possible with digital technology and our outdated infrastructure has led to the call for Open Data.

The benefits of Open and FAIR Data are clear.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Không có nhận xét nào:

Đăng nhận xét

Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.