What
is the Open Research Data Pilot?
Updated on 15
November 2016
Bài
được cập
nhật trên
Internet ngày: 15/11/2016
Thí
điểm Dữ liệu Nghiên cứu Mở là gì?
Dữ
liệu Mở là dữ liệu được tự do để chia sẻ, sử
dụng lại, tái mục đích, và phân phối lại. Thí điểm
Dữ liệu Nghiên cứu Mở (Open Research Data Pilot) nhằm làm
cho dữ liệu nghiên
cứu được tạo
ra bởi các dự án được lựa chọn của chương trình
Horizon 2020 là truy cập được với càng ít hạn chế có
thể càng tốt, trong khi cùng lúc bảo vệ các dữ liệu
nhạy cảm khỏi sự truy cập không thích hợp.
Nếu
dự án Horizon 2020 của bạn là một phần của thí điểm,
và dữ liệu của
bạn đáp ứng được các
điều kiện nhất định, thì bạn phải ký gửi dữ liệu
của
bạn vào một kho dữ liệu
nghiên cứu nơi mà chúng có khả năng được những người
khác tìm thấy và truy cập. Đừng hoảng hốt nhé -
bạn chưa có kinh nghiệm chia sẻ các dữ liệu nhạy cảm
hoặc chưa vi phạm bất kỳ thỏa thuận nào về quyền sở
hữu trí tuệ (IPR) với các đối tác công
nghiệp. Bạn cũng không cần phải ký gửi tất cả các
dữ liệu bạn tạo ra trong quá trình dự án đó - chỉ
các dữ liệu chống trụ cho các phát hiện nghiên cứu
được xuất bản và/hoặc có giá trị trong dài hạn. Hơn
nữa, để hỗ trợ cho tính toàn vẹn nghiên cứu của
bạn, tính mở có nhiều lợi ích khác. Tính trực quan
được nâng cao ngụ ý nghiên cứu của bạn sẽ với tới
được nhiều người hơn và có ảnh hưởng lớn hơn -
đối với khoa học, xã hội và sự nghiệp của riêng
bạn. Các nghiên cứu gấn đây đã chỉ
ra rằng các trích dẫn gia tăng khi dữ liệu được làm
cho sẵn sàng cùng với xuất bản phẩm;
các tài liệu đó cũng có cuộc
sống trên giá sách lâu hơn.
Các thành
phần nào của H2020 được yêu cầu tham gia?
Các
dự án bắt đầu vào tháng 01/2017 mặc định là một
phần của Thí điểm Dữ liệu Mở. Nếu dự án của
bạn đã bắt đầu sớm hơn trước đó và xuất phát từ
một trong những lĩnh vực đó của Horizon 2020, thì bạn
cũng tự động là một phần của thí điểm đó:
-
Các công nghệ đang nổi lên và trong tương lai
-
Các hạ tầng nghiên cứu (bao gồm cả các hạ tầng điện tử)
-
Lãnh đạo trong các công nghệ thúc đẩy và công nghiệp - các CNTT-TT
-
Các công nghệ nano, các vật liệu tiên tiến, Sản xuất và Xử lý tiên tiến, công nghệ sinh học: các chủ đề ‘an toàn nano’ và ‘mô hình hóa’
-
Thách thức xã hội: An toàn thực phẩm, nông nghiệp và nghề rừng bền vững, nghiên cứu về nước biến, hàng hải và nội địa và kinh tế sinh học - các chủ đề được lựa chọn trong các lời gọi H2020-SFS-2016/2017, H2020-BG-2016/2017, H2020-RUR-2016/2017 và H2020-BB-2016/2017, như được chỉ định trong chương trình làm việc.
-
Thách thức xã hội: Hành động về Khí hậu, Môi trường, Hiệu quả của Tài nguyên và các tư liệu thô - ngoại trừ các tư liệu thô
-
Thách thức xã hội: Châu Âu trong thế giới đang thay đổi - các xã hội có tính tham gia, có tính đổi mới và có tính phản hồi.
-
Khoa học với và vì xã hội
-
Các hoạt động liên ngành - các lĩnh vực trọng tâm - phần cho các Thành phố Thông minh và Bền vững
Có thể việc
chia sẻ dữ liệu là không thích hợp với dự án của
bạn; Chỉ
dẫn của EC về Truy cập Mở tới các Xuất bản phẩm
Khoa học và Dữ liệu Nghiên cứu liệt kê các điều
kiện có thể cho phép hoặc yêu cầu bạn lựa chọn đối
với thí điểm. Trong trường hợp đó, xin cân nhắc liệu
một phần lựa chọn có là có khả năng hay không.
Kế hoạch
Quản lý Dữ liệu - DMP (Data Management Plan) là gì?
Để giúp bạn
tối ưu hóa tiềm năng cho việc chia sẻ và sử dụng lại
trong tương lai, DMP có thể giúp bạn cân nhắc bất kỳ
vấn đề nào hoặc thách thức nào có thể xảy ra và
giúp bạn nhận diện các cách thức để vượt qua chúng.
DMP nên được hiểu như là tài liệu
“sống” phác thảo cách dữ liệu nghiên cứu được
thu thập hoặc được sinh ra sẽ được thao
tác trong và sau dự án nghiên cứu.
Hãy nhớ, kế hoạch đó nên là thực tế và dựa vào
xung quanh các tài nguyên có sẵn với bạn và các đối
tác dự án của bạn. Không có điểm cho một kế hoạch
được mạ vàng nếu nó không thể triển khai được!
Nên mô tả:
-
Tập hợp dữ liệu: Dạng dữ liệu nào dự án sẽ thu thập hoặc sinh ra, và chúng có thể là hữu dụng cho ai sau này? Thí điểm áp dụng cho: (1) dữ liệu và siêu dữ liệu cần thiết để thẩm định các kết quả trong các xuất bản phẩm khoa học; và (2) dữ liệu và siêu dữ liệu thô và/hoặc được tuyển chọn khác mà có thể được yêu cầu vì các mục đích thẩm định hoặc với giá trị sử dụng lại được.
-
Các tiêu chuẩn và siêu dữ liệu: Các chỉ tiêu nào theo quy định bạn sẽ áp dụng trong dự án? Dữ liệu là về cái gì? Ai đã tạo ra nó và vì sao? Ở các dạng nào nó là sẵn sàng? Siêu dữ liệu sẽ trả lời các câu hỏi như vậy để xúc tác cho dữ liệu được tìm ra và được hiểu, lý tưởng là tuân theo các tiêu chuẩn đặc thù của nguyên tắc khoa học của bạn. Siêu dữ liệu, tài liệu và các tiêu chuẩn giúp làm cho dữ liệu của bạn có khả năng tìm thấy được, truy cập được, tương hợp được và sử dụng lại được hoặc ngắn gọn FAIR (Findable, Accessible, Interoperable and Re-usable).
-
Chia sẻ dữ liệu: Mặc định càng nhiều dữ liệu kết quả càng tốt nên được lưu trữ như là Truy cập Mở. Vì thế các lý do hợp pháp cho việc không chia sẻ các dữ liệu kết quả nên được giải thích trong DMP. Hãy nhớ, không ai kỳ vọng bạn làm hỏng sự bảo vệ dữ liệu hoặc vi phạm bất kỳ thỏa thuận IPR nào. Chia sẻ dữ liệu nên được làm có trách nhiệm. Các chỉ dẫn DMP vì thế yêu cầu bạn mô tả bất kỳ vấn đề đạo đức hay pháp lý nào có thể có ảnh hưởng tới việc chia sẻ dữ liệu. Hơn nữa,
-
Việc lưu trữ và bảo tồn: Các cơ quan cấp vốn sẵn sàng đảm bảo rằng các đầu ra nghiên cứu được cấp vốn công khai có thể có ảnh hưởng tích cực tới nghiên cứu trong tương lai, để phát triển chính sách, và thay đổi xã hội. Họ hiểu ảnh hưởng đó có thể mất nhiều thời gian để hiện thực hóa và, vì vậy, kỳ vọng dữ liệu sẽ là sẵn sàng trong một giai đoạn phù hợp vượt ra khỏi vòng đời của dự án. Hãy nhớ, đơn giản là không đủ để đảm bảo rằng một chút gì đó được lưu giữ trong một kho dữ liệu nghiên cứu, nhưng cũng hãy cân nhắc khả năng sử dụng dữ liệu của bạn. Về khía cạnh này, bạn nên cân nhắc duy trì phần mềm hoặc bất kỳ mã nào được sản xuất để thực hiện các phân tích nhất định hoặc để trả về dữ liệu cũng như là rõ ràng về bất kỳ công cụ sở hữu độc quyền hoặc nguồn mở nào sẽ là cần thiết để thẩm định và sử dụng dữ liệu được duy trì gìn giữ đó.
DMP
không phải là tài liệu cố định. Phiên bản đầu tiên
của DMP được kỳ vọng sẽ được phân phối trong vòng
6 tháng đầu của dự án của bạn, nhưng bạn còn chưa
phải cung cấp các câu trả lời chi tiết cho tất cả các
câu hỏi. DMP cần phải được cập nhật trong quá trình
làm việc của dự án ở bất cứ khi nào có những thay
đổi đáng kể phát sinh, như các dữ liệu hoặc các thay
đổi mới trong các chính sách của nhóm hoặc trong sự
tổng hợp của nhóm. DMP nên được cập nhật ít nhất
vào đúng thời điểm với đánh giá và ước tính định
kỳ của dự án cũng như vào thời điểm rà soát lại
cuối cùng. Hãy cân nhắc việc rà soát lại DMP của bạn
thường xuyên định kỳ trong dự án và xem xét cách bạn
có thể sử dụng WP được lập lịch và/hoặc các cuộc
họp của các nhân viên dự án để tạo thuận lợi cho
sự rà soát lại này.
Các
bước thực hành nào bạn nên tiến hành?
-
Khi dự án của bạn là một phần của thí điểm, bạn nên tạo ra Kế hoạch Quản lý Dữ liệu (DMP). Cơ sở của bạn có thể chào hỗ trợ Quản lý Dữ liệu Nghiên cứu để giúp bạn lên kế hoạch.
-
Hơn nữa, bạn nên lựa chọn kho dữ liệu mà sẽ duy trì dữ liệu, siêu dữ liệu và các công cụ có thể của bạn về lâu dài. Được khuyến cáo liên hệ với kho theo lựa chọn của bạn khi viết phiên bản đầu tiên DMP của bạn. Các kho có thể chào các chỉ dẫn về các định dạng dữ liệu bền vững và các tiêu chuẩn siêu dữ liệu, cũng như hỗ trợ làm việc với các dữ liệu nhạy cảm và việc cấp phép.
-
Như được nêu trước đó, bạn không cần phải giữ mọi điều. Việc tuyển chọn dữ liệu đòi hỏi thời gian và nỗ lực nên bạn muốn chắc chắn bạn đang đặt nỗ lực của bạn vào các kết quả đầu ra thực sự đúng vấn đề. Hãy chọn dữ liệu nào bạn sẽ cần giữ lại để hỗ trợ thẩm định phát hiện của bạn nhưng cũng hãy cân nhắc bất kỳ kết quả đầu ra dữ liệu nào mà cũng có thể có giá trị về lâu dài - cho bạn và cho những người khác.
Các
đường liên kết
-
Chỉ dẫn của EC về Truy cập Mở tới các Xuất bản phẩm Khoa học và Dữ liệu Nghiên cứu theo Horizon 2020 (được cập nhật ngày 25/08/2016) http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf
-
Chỉ dẫn của EC về Quản lý Dữ liệu theo Horizon 2020 (được cập nhật 26/07/2016): http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf
-
Chương trình nghị sự của EC về Khoa học Mở: https://ec.europa.eu/digital-agenda/en/open-science
-
Công cụ DMP trên trực tuyến: https://dmponline.dcc.ac.uk/
-
DCC Viết chỉ dẫn DMP thế nào: http://www.dcc.ac.uk/resources/how-guides/develop-data-plan
-
DCC Chỉ dẫn Làm thế nào để chọn Dữ liệu gì để Giữ: http://www.dcc.ac.uk/resources/how-guides/five-steps-decide-what-data-keep
-
DCC Chỉ dẫn Cách Cấp phép cho Dữ liệu Nghiên cứu: http://www.dcc.ac.uk/resources/how-guides/license-research-data
-
Video của RDNL Lên kế hoạch quản lý dữ liệu: Cái gì, Vì sao và Như thế nào: http://datasupport.researchdata.nl/en/start-de-cursus/ii-planfase/datamanagementplanning/
-
Kế hoạch Quản lý Phần mềm của Viện về Tính bền vững của Phần mềm: https://www.software.ac.uk/sites/default/files/images/content/SMP_Checklist_2016_v0.1.pdf
What is the Open Research Data Pilot?
Open
data is data that is free to access, reuse, repurpose, and
redistribute. The Open Research Data Pilot aims to make the research
data generated by selected Horizon 2020 projects accessible with as
few restrictions as possible, while at the same time protecting
sensitive data from inappropriate access.
If
your Horizon 2020 project is part of the pilot, and your data meets
certain conditions, you must deposit your data in a research data
repository where they will be findable and accessible for others.
Don’t panic - you are not expected to share sensitive data or
breach any IPR agreements with industrial partners. You do not need
to deposit all the data you generate during the project either –
only that which underpins published research findings and/or has
longer-term value. In addition to supporting your research’s
integrity, openness has many other benefits. Improved visibility
means your research will reach more people and have a greater impact
– for science, society and your own career. Recent studies have
shown that citations increase when data is made available alongside
the publication; these papers also have a longer shelf-life.
Which H2020 strands are required to participate?
Projects
starting from January 2017 are by default part of the Open Data
Pilot. If your project started before earlier and stems from one of
these Horizon 2020 areas, you are automatically part of the pilot as
well:
-
Future and Emerging Technologies
-
Research infrastructures (including e-Infrastructures)
-
Leadership in enabling and industrial technologies – Information and Communication Technologies
-
Nanotechnologies, Advanced Materials, Advanced Manufacturing and Processing, and Biotechnology: ‘nanosafety’ and ‘modelling’ topics
-
Societal Challenge: Food security, sustainable agriculture and forestry, marine and maritime and inland water research and the bioeconomy - selected topics in the calls H2020-SFS-2016/2017, H2020-BG-2016/2017, H2020-RUR-2016/2017 and H2020-BB-2016/2017, as specified in the work programme
-
Societal Challenge: Climate Action, Environment, Resource Efficiency and Raw materials – except raw materials
-
Societal Challenge: Europe in a changing world – inclusive, innovative and reflective Societies
-
Science with and for Society
-
Cross-cutting activities - focus areas – part Smart and Sustainable Cities.
Maybe
data sharing is not appropriate for your project; the EC’s
Guide on Open Access Scientific Publications and Research Data lists
conditions that would allow or require you to opt out of the pilot.
In that case please consider if a partial opt-out is possible.
What is a Data Management Plan (DMP)?
To
help you optimise the potential for future sharing and reuse, a Data
Management Plan (DMP) can help you to consider any problems or
challenges that may be encountered and helps you to identify ways to
overcome these. A DMP should be thought of as a “living”
document outlining how the research data collected or generated will
be handled during and after a research project. Remember, the plan
should be realistic and based around the resources available to you
and your project partners. There is no point in writing a gold plated
plan if it cannot be implemented!
It
should describe:
-
The data set: What kind of data will the project collect or generate, and to whom might they be useful later on? The pilot applies to (1) the data and metadata needed to validate results in scientific publications and (2) other curated and/or raw data and metadata that may be required for validation purposes or with reuse value.
-
Standards and metadata: What disciplinary norms will you adopt in the project? What is the data about? Who created it and why? In what forms it is available? Metadata answers such questions to enable data to be found and understood, ideally according to the particular standards of your scientific discipline. Metadata, documentation and standards help to make your data Findable, Accessible, Interoperable and Re-usable or FAIR for short.
-
Data sharing: By default as much of the resulting data as possible should be archived as Open Access. Therefore legitimate reasons for not sharing resulting data should be explained in the DMP. Remember, no one expects you to compromise data protection or breach any IPR agreements. Data sharing should be done responsibly. The DMP Guidelines therefore ask you to describe any ethical or legal issues that can have an impact on data sharing. Furthermore,
-
Archiving and preservation: Funding bodies are keen to ensure that publicly funded research outputs can have a positive impact on future research, for policy development, and for societal change. They recognise that impact can take quite a long time to be realised and, accordingly, expect the data to be available for a suitable period beyond the life of the project. Remember, it is not simply enough to ensure that the bits are stored in a research data repository, but also consider the usability of your data. In this respect, you should consider preserving software or any code produced to perform specific analyses or to render the data as well as being clear about any proprietary or open source tools that will be needed to validate and use the preserved data.
The
DMP is not a fixed document. The first version of the DMP is expected
to be delivered within the first 6 months of your project, but you
don’t have to provide detailed answers to all the questions yet.
The DMP needs to be updated over the course of the project whenever
significant changes arise, such as new data or changes in the
consortium policies or consortium composition. The DMP should be
updated at least in time with the periodic evaluation or assessment
of the project as well as in time for the final review. Consider
reviewing your DMP at regular intervals in the project and consider
how you might make use of scheduled WP and/or project staff meetings
to facilitate this review.
What practical steps should you take?
1.
When your project is part of the pilot, you should create
a Data Management Plan. Your institution may offer Research Data
Management support to help you planning.
2.
Also, you should select
a data repository that will preserve your data, metadata and
possibly tools in the long term. It is advisable to contact the
repository of your choice when writing the first version of your DMP.
Repositories may offer guidelines for sustainable data formats and
metadata standards, as well as support for dealing with sensitive
data and licensing.
3.
As noted earlier, you do not need to keep everything. Curating data
requires time and effort so you want to make sure that you are
putting your effort into the outputs that really matter. Select what
data you’ll need to retain to support validation of your finding
but nalso consider any data outputs that may have longer term value
as well – for you and for others.
Links
EC’s
Guide on Open Access
to Scientific Publications and Research Data
in Horizon 2020 (updated August 25,
2016) http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf
EC’s
Guidelines on Data Management in Horizon 2020 (updated July 26,
2016):
http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf
EC’s Agenda on Open Science: https://ec.europa.eu/digital-agenda/en/open-science
EC’s Agenda on Open Science: https://ec.europa.eu/digital-agenda/en/open-science
DMPonline
tool: https://dmponline.dcc.ac.uk/
DCC How to Write a DMP guide:http://www.dcc.ac.uk/resources/how-guides/develop-data-plan
DCC How to Select What Data to Keep guide: http://www.dcc.ac.uk/resources/how-guides/five-steps-decide-what-data-keep
DCC How to Licence Research Data guide: http://www.dcc.ac.uk/resources/how-guides/license-research-data
DCC How to Write a DMP guide:http://www.dcc.ac.uk/resources/how-guides/develop-data-plan
DCC How to Select What Data to Keep guide: http://www.dcc.ac.uk/resources/how-guides/five-steps-decide-what-data-keep
DCC How to Licence Research Data guide: http://www.dcc.ac.uk/resources/how-guides/license-research-data
RDNL
video The what, why and how of data management planning:
http://datasupport.researchdata.nl/en/start-de-cursus/ii-planfase/datamanagementplanning/
Software Sustainability Institute’s Software Management Plan: https://www.software.ac.uk/sites/default/files/images/content/SMP_Checklist_2016_v0.1.pdf
Software Sustainability Institute’s Software Management Plan: https://www.software.ac.uk/sites/default/files/images/content/SMP_Checklist_2016_v0.1.pdf
Dịch:
Lê Trung Nghĩa
Không có nhận xét nào:
Đăng nhận xét
Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.