Zenodo
now supports DOI versioning!
By
Lars Holm Nielsen, 2017-05-30
Bài
được đưa lên Internet ngày: 30/05/2017
Xem
thêm: Khoa
học mở - Open Science
Chúng
tôi vui mừng thông báo khởi xướng hỗ trợ tạo phiên
bản mã
định danh đối tượng số -
DOI (Digital
Object Identifier) trong
Zenodo - kho nghiên cứu mở từ OpenAIRE và CERN. Tính năng
mới này cho phép những người sử dụng cập nhật các
tập hồ sơ sau khi họ dã đưa ra công khai và các nhà
nghiên cứu dễ dàng trích dẫn các phiên bản nhất định
của hồ sơ hoặc để trích dẫn, thông qua DOI mức đỉnh,
tất cả các phiên bản của hồ sơ.
Hỗ
trợ tạo phiên bản DOI từng là một trong những tính
năng được mong đợi nhất đối với Zenodo, và nó đã
được đội Zenodo của OpenAIRE và đội B2SHARE của EUDAT
cùng hợp tác phát triển như một module mở rộng cho nền
tảng kho số Invenio của CERN, nó trang bị cho cả Zenodo và
B2SHARE.
Đây
là những thời điểm thú vị cho các Zenodo và OpenAIRE.
Bản cập nhật này tới ngay trước thềm tái
khởi tạo gần đây đã làm cho Zenodo nhanh hơn, tích
hợp GitHub được cải thiện, hỗ trợ có tích hợp cho
thông tin được trao của Horizon2020, và đã cho phép tải
dữ liệu lên tới 50 GB!
Về Zenodo: Zenodo từng được các nhà nghiên cứu xây dựng và phát triển, để đảm bảo tính tiên phong của các phong trào truy cập mở và dữ liệu mở ở châu Âu từng được EC ủy quyền để hỗ trợ cho chính sách Dữ liệu Mở mới mẻ của họ bằng việc cung cấp một kho thu thập tất cả cho nghiên cứu được EC cấp vốn. CERN, và OpenAIRE đối tác và tiên phong trong nguồn mở, truy cập mở và dữ liệu mở, đã cung cấp khả năng này và Zenodo từng được khởi xướng vào tháng 5/2013. Để hỗ trợ chương trình nghiên cứu của mình, CERN đã phát triển các công cụ cho quản lý Dữ liệu Lớn và đã mở rộng các khả năng Thư viện Số cho Dữ liệu Mở. Thông qua Zenodo, các công cụ Khoa học Lớn (Big Science) đó có thể được chia sẻ có hiệu quả với cái đuôi dài của nghiên cứu.
Ở
đây chúng tôi giải thích nhiều hơn về tính năng mới
thú vị này:
Tạo
ra phiên bản DOI là gì?
Tạo ra phiên
bản DOI cho phép bạn:
-
sửa đổi/cập nhật các tệp hồ sơ sau khi chúng đã được xuất bản.
-
trích dẫn phiên bản hồ sơ nhất định.
-
trích dẫn tất cả các phiên bản hồ sơ.
Việc
tạo ra phiên bản DOI làm việc như thế nào?
Khi bạn xuất
bản một bản tải lên Zenodo lần đầu, chúng tôi đăng
ký 2 DOI:
-
một DOI đại diện cho phiên bản cụ thể hồ sơ của bạn.
-
một DOI đại diện cho tất cả các phiên bản hồ sơ của bạn.
Sau
đó, chúng tôi đăng ký DOI cho từng phiên bản mới bản
tải lên của bạn.
Điều
này được minh họa tốt nhất bằng ví dụ của một gói
phần mềm. Nếu phần mềm đó đã được phát hành theo
2 phiên bản (v1.0 và v1.1) trên Zenodo, thì các DOI sau
đây có thể được đăng ký:
-
v1.0 (phiên bản cụ thể): 10.5281/zenodo.60943
-
v1.1 (phiên bản cụ thể): 10.5281/zenodo.800648
-
Khái niệm (tất cả các phiên bản): 10.5281/zenodo.705645
2
DOI đầu tiên cho các phiên bản v1.0 và v.1.1
đại diện cho các phiên bản cụ thể của phần mềm.
DOI cuối cùng đại diện cho tất cả các phiên bản của
gói phần mềm được đưa ra, nghĩa là khái niệm gói
phần mềm và sự tập hợp các phiên bản đó. Chúng tôi
vì thế cũng gọi chúng là các DOI phiên bản
(Version DOIs) và các DOI khái niệm (Concept DOIs) (lưu
ý, về mặt kỹ thuật cả 2 loại đó đều chỉ là các
DOI thông thường).
Bạn có lẽ
lưu ý thấy rằng các phiên bản DOI không bao gồm tiền
tố “.v1”. Hãy đọc bên dưới để tìm hiểu vì sao.
DOI
nào tôi nên sử dụng trong các trích dẫn?
Thường
thì bạn nên luôn sử dụng DOI cho phiên
bản cụ thể
hồ sơ của
bạn trong
các trích dẫn. Điều này đảm bảo rằng các nhà
nghiên cứu khác có thể truy cập chế tác
nghiên cứu chính xác mà bạn đã sử dụng để tái
tạo lại. Mặc định, Zenodo sử dụng phiên bản cụ thể
để sinh ra các trích dẫn.
Bạn
có thể sử dụng DOI khái niệm (Concept DOI) đại diện
cho tất cả các phiên bản trong các trích dẫn nếu điều
đó là mong muốn trích dẫn một chế tác nghiên cứu có
liên quan, không cần chắc chắn về phiên bản.
DOI
khái niệm phân giải ở đâu?
Hiện
hành DOI khái niệm phân giải trang đích của phiên bản
mới nhất hồ sơ của bạn. Điều này chưa hoàn toàn
đúng, và trong tương lai chúng tôi sẽ thay đổi điều
này để tạo ra trang đích đại diện đặc biệt cho tất
cả các phiên bản.
Bạn
có hỗ trợ việc tạo phiên bản cho các hồ sơ đang tồn
tại rồi hay không?
Có.
Tuy nhiên, đối với các bản tải lên được xuất bản
trước ngày 30/05/2017, bạn trước hết phải nâng cấp hồ
sơ của
bạn để hỗ
trợ cho việc tạo ra phiên bản. Điều này được thực
hiện bằng việc nhấn vào núm “Upgrade to versioned record”
(Nâng cấp lên hồ sơ có phiên bản) tên trang hồ sơ.
QUAN TRỌNG
Nếu
bạn đã tải lên trước đó nhiều phiên bản của một
bản tải lên như là các hồ sơ riêng rẽ trên Zenodo, thì
ĐỪNG CÓ nhấn vào núm nâng cấp hồ sơ của
bạn với hỗ trợ tạo ra phiên bản. Xin hãy
liên hệ với chúng tôi tại info@zenodo.org
sao cho chúng tôi có thể liên kết các hồ sơ đó theo một
lược đồ tạo phiên bản.
Việc nhấn vào
núm “Upgrade to versioned record” (Nâng cấp lên hồ sơ có
phiên bản) trên bất kỳ hồ sơ nào bạn muốn liên kết,
sẽ đăng ký không thể đảo ngược chúng như các hồ sơ
có phiên bản riêng rẽ.
Nếu
bạn đã sử dụng tích hợp của GitHub để lưu trữ phần
mềm của
bạn trên Zenodo, thì chúng tôi đã chuyển đổi
rồi và đã liên kết các hồ sơ của bạn để hỗ trợ
việc tạo ra phiên bản.
Bạn
có hỗ trợ tạo ra phiên bản DOI cho các DOI từ các nhà
cung cấp khác với Zenodo hay không?
Không, chúng
tôi chỉ hỗ trợ việc tạo ra phiên bản DOI cho các hồ
sơ với các DOI của Zenodo (nghĩa là các DOI bắt đầu với
tiền tố 10.5281).
Tôi
chỉ muốn thay đổi tiêu đề bản tải lên của tôi,
liệu tôi có còn được DOI mới hay không?
Không,
như trước đó bạn có thể tiếp tục sửa siêu dữ liệu
bản tải lên của
bạn mà không cần tạo ra phiên bản hồ sơ
mới. Bạn chỉ nên tạo ra phiên bản mới nếu bạn muốn
cập nhật các tệp hồ sơ của bạn.
Vì
sao các DOI không có tiền tố số phiên bản giống như
“.v1”?
Việc
thêm thông tin ngữ nghĩa như số phiên bản vào DOI là
thực hành tồi, vì thông tin này có thể thay đổi theo
thời gian, trong khi các DOI phải giữ luôn ổn định và
không nên thay đổi.
Hơn
nữa, việc tạo ra phiên bản DOI của Zenodo là tuyến
tính, điều ngụ ý là số phiên bản của Zenodo trên thực
tế có thể không phải là số phiên bản thực tế của
tài nguyên. Lấy ví dụ từ phần mềm, nơi thực hành phổ
biến để có các phiên bản có dấu chấm và tạo ra các
phiên bản mới theo một trật tự phi tuyến tính (như ban
đầu là v1.0, rồi sau đó v1.1, sau đó là v2.0, rồi sau đó
là v1.2).
Hậu
tố
của việc tạo ra phiên bản cũng không là chức năng của
hệ thống DOI, nghĩa là việc thêm .v2 vào DOI sẽ không
phân giải phiên bản 2 của tài nguyên cho bất kỳ DOI nào
từ bất kỳ nhà
cung cấp nào. Các nhà cung cấp khác nhau cũng
sử dụng các mẫu khác nhau như .v2, .2, /2.
Quan
trọng nhất, các hậu tố phiên bản là các hậu tố máy
không đọc được. Hệ thống phát hiện mà hiểu được
các DOI, sẽ không biết rằng .v1 và .v2 của một DOI trên
thực tế là 2 phiên bản của cùng một tài nguyên.
Giải
pháp tốt hơn cho vấn đề này là liên kết ngữ nghĩa 2
DOI trong siêu dữ liệu của DOI. Điều này đảm bảo rằng
các hệ thống phát hiện có cách máy đọc được để
phát hiện rằng 2 DOI là các phiên bản của cùng một tài
nguyên.
Xem
thêm “Cool DOIs” (Các DOI hay), bài viết của Martin
Fenner, Giám đốc Kỹ thuật của DataCite:
https://doi.org/10.5438/55E5-T5C0
Vì
sao bạn đưa “zenodo” vào DOI?
Hiện
hành các DOI được Zenodo đăng ký tuân theo mẫu
“10.5281/zenodo.”,
trong đó 10.5281 là tiền tố của Zenodo DOI và
là số nguyên được chỉ định theo dãy số. Từ “zenodo”
là thông tin ngữ nghĩa, và như được nêu trong câu hỏi
trước đó là ý tưởng tồi để đưa thông tin ngữ
nghĩa vào các DOI khi nó có thể thay đổi theo thời gian.
Thực hành hiện nay đã được giới thiệu khi Zenodo từng
được tung ra vào tháng 5/2013, và trong khi nó không là lý
tưởng thì chúng tôi đã không muốn thay đổi thực hành
đang tồn tại đó.
Bạn có đúp
bản tất cả các tệp cho từng phiên bản mới của hồ
sơ?
Không, nếu bạn
thay đổi một tệp README kích thước 10KB trong một tập
hợp dữ liệu 50GB thì chúng tôi không đúp bản toàn bộ
tập hợp dữ liệu 50GB đó. Invenio v3,
nền tảng kho số nằm bên dưới mà trang bị cho Zenodo,
thao tác có hiệu quả kho lưu trữ các tệp nên chúng tôi
chỉ lưu trữ phần thêm mới 10KB đó.
Lars Holm Nielsen
Tôi
hiện là kỹ sư phần mềm tại CERN — nơi tôi đã tung
ra ZENODO, một dịch vụ quản lý dữ liệu nghiên cứu có
tính đổi mới cho khoa học đuôi dài. Chuyên môn của tôi
bao gồm việc mang các sản phẩm dựa vào web có tính đổi
mới từ tư duy ban đầu tới khởi xướng thành công
trong khoảng thời gian ngắn.
We
are pleased to announce the launch of DOI versioning support in
Zenodo – the open research repository from OpenAIRE and CERN. This
new feature enables users to update the record’s files after they
have been made public and researchers to easily cite either specific
versions of a record or to cite, via a top-level DOI, all the
versions of a record.
DOI
versioning support was one of our most requested features for Zenodo,
and it has been co-developed by OpenAIRE’s Zenodo team and EUDAT’s
B2SHARE team as an extension module for CERN’s Invenio digital
repository platform, which powers both Zenodo and B2SHARE.
These
are exciting times for Zenodo and OpenAIRE. This update comes
hot on the heels of the recent relaunch
which made Zenodo faster, improved GitHub integration,
integrated support for Horizon2020 grant information, and enabled 50
gigabyte uploads!
About Zenodo: Zenodo was built and developed by researchers, to ensure that everyone can join in Open Science. The OpenAIRE project, in the vanguard of the open access and open data movements in Europe was commissioned by the EC to support their nascent Open Data policy by providing a catch-all repository for EC funded research. CERN, an OpenAIRE partner and pioneer in open source, open access and open data, provided this capability and Zenodo was launched in May 2013. In support of its research programme CERN has developed tools for Big Data management and extended Digital Library capabilities for Open Data. Through Zenodo these Big Science tools could be effectively shared with the long-tail of research.
We
here explain more about this new exciting feature:
What
is DOI versioning?
DOI
versioning allows you to:
-
edit/update the record’s files after they have been published.
-
cite a specific version of a record.
-
cite all of versions of a record.
How
does DOI versioning work?
When
you publish an upload on Zenodo for the first time, we register two
DOIs:
-
a DOI representing the specific version of your record.
-
a DOI representing all of the versions of your record.
Afterwards,
we register a DOI for every new version of your upload.
This
is best illustrated by an example of a software package. If the
software has been released in two versions
(v1.0 and v1.1) on Zenodo, then the following DOIs would have been
registered:
-
v1.0 (specific version): 10.5281/zenodo.60943
-
v1.1 (specific version): 10.5281/zenodo.800648
-
Concept (all versions): 10.5281/zenodo.705645
The
first two DOIs for versions v1.0 and
v.1.1 represent the
specific versions of the software. The last DOI represents all the
versions of the given software package, i.e. the concept of the
software package and the ensemble of versions. We therefore also call
the them Version DOIs and
Concept DOIs (note,
technically both are just normal DOIs).
You
may notice that the version DOIs do not include a “.v1”-suffix.
Read below to find out why.
Which
DOI should I use in citations?
You
should normally always use the DOI for the specific version
of your record in citations. This
is to ensure that other researchers can access the exact
research artifact you used for
reproducibility. By default, Zenodo uses the specific version to
generate citations.
You
can use the Concept DOI representing all versions in citations when
it is desirable to cite an evolving research artifact, without being
specific about the version.
Where
does the Concept DOI resolve to?
Currently
the Concept DOI resolves to the landing page of the latest
version of your record. This is
not fully correct, and in the future we will change this to create a
landing page specifically representing all of the versions.
Do
you support versioning for already existing records?
Yes.
However, for uploads published before the 30th of May 2017, you have
to first upgrade your record to support versioning. This is done by
clicking the “Upgrade to versioned record” button on the record
page.
IMPORTANT
If
you have previously uploaded multiple versions of an upload as
individual records on Zenodo, then DO NOT click the button to upgrade
your record with versioning support. Please contact us on
info@zenodo.org
so
we can link the records under one versioning scheme.
Clicking
the “Upgrade to versioned record” button on any of the records
you would like to link, will irreversibly register them as
individually-versioned records.
If
you used the GitHub integration to archive your software on Zenodo,
then we have already migrated and linked your records to support
versioning.
Do
you support DOI versioning for DOIs from providers other than Zenodo?
No,
we only support DOI versioning for records with Zenodo DOIs (i.e.
DOIs starting with the prefix 10.5281).
I
only want to change the title of my upload, do I still get a new DOI?
No,
as before you can continue to edit the metadata of your upload
without creating a new version of a record. You should only create a
new version if you want to update the files of your record.
Why
don’t the DOIs have a version number suffix like “.v1”?
Including
semantic information such as the version number in a DOI is bad
practice, because this information may change over time, while DOIs
must remain persistent and should not change.
Moveover,
Zenodo DOI versioning is linear, which means that the Zenodo version
number may in fact not be the real version number of the resource.
Take for instance software, where it is common practice to have dot
versions and make new releases in a non-linear order (e.g. first
v1.0, then v1.1, then v2.0, then v1.2).
The
versioning suffix is also not a functionality of the DOI system, i.e.
adding .v2 to DOI will not resolve to version 2 of a resource for any
DOI from any provider. Different providers also uses different
patterns such as e.g. .v2, .2, /2.
Most
importantly, version suffixes are not machine readable. A discovery
system that understands DOIs, will not know that .v1 and .v2 of a DOI
are in fact two versions of the same resource.
A
better solution to this problem is to semantically link two DOIs in
the metadata of a DOI. This ensures that discovery systems have a
machine readable way to discover that two DOIs are versions of the
same resource.
See
also “Cool DOIs”, a blog post by Martin Fenner, DataCite
Technical Director: https://doi.org/10.5438/55E5-T5C0
Why
do you include “zenodo” in the DOI?
Currently
DOIs registered by Zenodo follows the pattern
“10.5281/zenodo.” where 10.5281 is the Zenodo DOI
prefix and is a sequentially assigned integer. The
word “zenodo” is semantic information, and as mentioned in the
previous question it is a bad idea to include semantic information in
DOIs as it may change over time. The current practice was introduced
when Zenodo was launched in May 2013, and while it is not ideal we
did not want to change the existing practice.
Do
you duplicate all the files for every new version of a record?
No,
if you change a 10kb README file in 50GB dataset we do not duplicate
the entire 50GB dataset. Invenio v3, the underlying digital
repository platform that powers Zenodo, efficiently handles the file
storage so we only store the new extra 10kb.
Lars Holm Nielsen
I
am currently Software Engineer at CERN — where I've launched
ZENODO, an innovative research data management service for long-tail
science. My specialities includes bringing innovative web-based
products from the initial thought to successful launch in short time.
Dịch:
Lê Trung Nghĩa
Không có nhận xét nào:
Đăng nhận xét
Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.