Thứ Ba, 27 tháng 6, 2017

Zenodo bây giờ hỗ trợ tạo phiên bản mã định danh đối tượng số DOI!

Zenodo now supports DOI versioning!
By Lars Holm Nielsen, 2017-05-30
Bài được đưa lên Internet ngày: 30/05/2017


Chúng tôi vui mừng thông báo khởi xướng hỗ trợ tạo phiên bản mã định danh đối tượng số - DOI (Digital Object Identifier) trong Zenodo - kho nghiên cứu mở từ OpenAIRE và CERN. Tính năng mới này cho phép những người sử dụng cập nhật các tập hồ sơ sau khi họ dã đưa ra công khai và các nhà nghiên cứu dễ dàng trích dẫn các phiên bản nhất định của hồ sơ hoặc để trích dẫn, thông qua DOI mức đỉnh, tất cả các phiên bản của hồ sơ.
Hỗ trợ tạo phiên bản DOI từng là một trong những tính năng được mong đợi nhất đối với Zenodo, và nó đã được đội Zenodo của OpenAIRE và đội B2SHARE của EUDAT cùng hợp tác phát triển như một module mở rộng cho nền tảng kho số Invenio của CERN, nó trang bị cho cả Zenodo và B2SHARE.
Đây là những thời điểm thú vị cho các Zenodo và OpenAIRE. Bản cập nhật này tới ngay trước thềm tái khởi tạo gần đây đã làm cho Zenodo nhanh hơn, tích hợp GitHub được cải thiện, hỗ trợ có tích hợp cho thông tin được trao của Horizon2020, và đã cho phép tải dữ liệu lên tới 50 GB!
Về Zenodo: Zenodo từng được các nhà nghiên cứu xây dựng và phát triển, để đảm bảo tính tiên phong của các phong trào truy cập mở và dữ liệu mở ở châu Âu từng được EC ủy quyền để hỗ trợ cho chính sách Dữ liệu Mở mới mẻ của họ bằng việc cung cấp một kho thu thập tất cả cho nghiên cứu được EC cấp vốn. CERN, và OpenAIRE đối tác và tiên phong trong nguồn mở, truy cập mở và dữ liệu mở, đã cung cấp khả năng này và Zenodo từng được khởi xướng vào tháng 5/2013. Để hỗ trợ chương trình nghiên cứu của mình, CERN đã phát triển các công cụ cho quản lý Dữ liệu Lớn và đã mở rộng các khả năng Thư viện Số cho Dữ liệu Mở. Thông qua Zenodo, các công cụ Khoa học Lớn (Big Science) đó có thể được chia sẻ có hiệu quả với cái đuôi dài của nghiên cứu.
Ở đây chúng tôi giải thích nhiều hơn về tính năng mới thú vị này:
Tạo ra phiên bản DOI là gì?
Tạo ra phiên bản DOI cho phép bạn:
  • sửa đổi/cập nhật các tệp hồ sơ sau khi chúng đã được xuất bản.
  • trích dẫn phiên bản hồ sơ nhất định.
  • trích dẫn tất cả các phiên bản hồ sơ.
Việc tạo ra phiên bản DOI làm việc như thế nào?
Khi bạn xuất bản một bản tải lên Zenodo lần đầu, chúng tôi đăng ký 2 DOI:
  • một DOI đại diện cho phiên bản cụ thể hồ sơ của bạn.
  • một DOI đại diện cho tất cả các phiên bản hồ sơ của bạn.
Sau đó, chúng tôi đăng ký DOI cho từng phiên bản mới bản tải lên của bạn.
Điều này được minh họa tốt nhất bằng ví dụ của một gói phần mềm. Nếu phần mềm đó đã được phát hành theo 2 phiên bản (v1.0 và v1.1) trên Zenodo, thì các DOI sau đây có thể được đăng ký:
  • v1.0 (phiên bản cụ thể): 10.5281/zenodo.60943
  • v1.1 (phiên bản cụ thể): 10.5281/zenodo.800648
  • Khái niệm (tất cả các phiên bản): 10.5281/zenodo.705645
2 DOI đầu tiên cho các phiên bản v1.0v.1.1 đại diện cho các phiên bản cụ thể của phần mềm. DOI cuối cùng đại diện cho tất cả các phiên bản của gói phần mềm được đưa ra, nghĩa là khái niệm gói phần mềm và sự tập hợp các phiên bản đó. Chúng tôi vì thế cũng gọi chúng là các DOI phiên bản (Version DOIs) và các DOI khái niệm (Concept DOIs) (lưu ý, về mặt kỹ thuật cả 2 loại đó đều chỉ là các DOI thông thường).
Bạn có lẽ lưu ý thấy rằng các phiên bản DOI không bao gồm tiền tố “.v1”. Hãy đọc bên dưới để tìm hiểu vì sao.
DOI nào tôi nên sử dụng trong các trích dẫn?
Thường thì bạn nên luôn sử dụng DOI cho phiên bản cụ thể hồ sơ của bạn trong các trích dẫn. Điều này đảm bảo rằng các nhà nghiên cứu khác có thể truy cập chế tác nghiên cứu chính xác mà bạn đã sử dụng để tái tạo lại. Mặc định, Zenodo sử dụng phiên bản cụ thể để sinh ra các trích dẫn.
Bạn có thể sử dụng DOI khái niệm (Concept DOI) đại diện cho tất cả các phiên bản trong các trích dẫn nếu điều đó là mong muốn trích dẫn một chế tác nghiên cứu có liên quan, không cần chắc chắn về phiên bản.
DOI khái niệm phân giải ở đâu?
Hiện hành DOI khái niệm phân giải trang đích của phiên bản mới nhất hồ sơ của bạn. Điều này chưa hoàn toàn đúng, và trong tương lai chúng tôi sẽ thay đổi điều này để tạo ra trang đích đại diện đặc biệt cho tất cả các phiên bản.
Bạn có hỗ trợ việc tạo phiên bản cho các hồ sơ đang tồn tại rồi hay không?
Có. Tuy nhiên, đối với các bản tải lên được xuất bản trước ngày 30/05/2017, bạn trước hết phải nâng cấp hồ sơ của bạn để hỗ trợ cho việc tạo ra phiên bản. Điều này được thực hiện bằng việc nhấn vào núm “Upgrade to versioned record” (Nâng cấp lên hồ sơ có phiên bản) tên trang hồ sơ.
QUAN TRỌNG
Nếu bạn đã tải lên trước đó nhiều phiên bản của một bản tải lên như là các hồ sơ riêng rẽ trên Zenodo, thì ĐỪNG CÓ nhấn vào núm nâng cấp hồ sơ của bạn với hỗ trợ tạo ra phiên bản. Xin hãy liên hệ với chúng tôi tại info@zenodo.org sao cho chúng tôi có thể liên kết các hồ sơ đó theo một lược đồ tạo phiên bản.
Việc nhấn vào núm “Upgrade to versioned record” (Nâng cấp lên hồ sơ có phiên bản) trên bất kỳ hồ sơ nào bạn muốn liên kết, sẽ đăng ký không thể đảo ngược chúng như các hồ sơ có phiên bản riêng rẽ.
Nếu bạn đã sử dụng tích hợp của GitHub để lưu trữ phần mềm của bạn trên Zenodo, thì chúng tôi đã chuyển đổi rồi và đã liên kết các hồ sơ của bạn để hỗ trợ việc tạo ra phiên bản.
Bạn có hỗ trợ tạo ra phiên bản DOI cho các DOI từ các nhà cung cấp khác với Zenodo hay không?
Không, chúng tôi chỉ hỗ trợ việc tạo ra phiên bản DOI cho các hồ sơ với các DOI của Zenodo (nghĩa là các DOI bắt đầu với tiền tố 10.5281).
Tôi chỉ muốn thay đổi tiêu đề bản tải lên của tôi, liệu tôi có còn được DOI mới hay không?
Không, như trước đó bạn có thể tiếp tục sửa siêu dữ liệu bản tải lên của bạn mà không cần tạo ra phiên bản hồ sơ mới. Bạn chỉ nên tạo ra phiên bản mới nếu bạn muốn cập nhật các tệp hồ sơ của bạn.
Vì sao các DOI không có tiền tố số phiên bản giống như “.v1”?
Việc thêm thông tin ngữ nghĩa như số phiên bản vào DOI là thực hành tồi, vì thông tin này có thể thay đổi theo thời gian, trong khi các DOI phải giữ luôn ổn định và không nên thay đổi.
Hơn nữa, việc tạo ra phiên bản DOI của Zenodo là tuyến tính, điều ngụ ý là số phiên bản của Zenodo trên thực tế có thể không phải là số phiên bản thực tế của tài nguyên. Lấy ví dụ từ phần mềm, nơi thực hành phổ biến để có các phiên bản có dấu chấm và tạo ra các phiên bản mới theo một trật tự phi tuyến tính (như ban đầu là v1.0, rồi sau đó v1.1, sau đó là v2.0, rồi sau đó là v1.2).
Hậu tố của việc tạo ra phiên bản cũng không là chức năng của hệ thống DOI, nghĩa là việc thêm .v2 vào DOI sẽ không phân giải phiên bản 2 của tài nguyên cho bất kỳ DOI nào từ bất kỳ nhà cung cấp nào. Các nhà cung cấp khác nhau cũng sử dụng các mẫu khác nhau như .v2, .2, /2.
Quan trọng nhất, các hậu tố phiên bản là các hậu tố máy không đọc được. Hệ thống phát hiện mà hiểu được các DOI, sẽ không biết rằng .v1 và .v2 của một DOI trên thực tế là 2 phiên bản của cùng một tài nguyên.
Giải pháp tốt hơn cho vấn đề này là liên kết ngữ nghĩa 2 DOI trong siêu dữ liệu của DOI. Điều này đảm bảo rằng các hệ thống phát hiện có cách máy đọc được để phát hiện rằng 2 DOI là các phiên bản của cùng một tài nguyên.
Xem thêm “Cool DOIs” (Các DOI hay), bài viết của Martin Fenner, Giám đốc Kỹ thuật của DataCite: https://doi.org/10.5438/55E5-T5C0
Vì sao bạn đưa “zenodo” vào DOI?
Hiện hành các DOI được Zenodo đăng ký tuân theo mẫu “10.5281/zenodo.”, trong đó 10.5281 là tiền tố của Zenodo DOI và là số nguyên được chỉ định theo dãy số. Từ “zenodo” là thông tin ngữ nghĩa, và như được nêu trong câu hỏi trước đó là ý tưởng tồi để đưa thông tin ngữ nghĩa vào các DOI khi nó có thể thay đổi theo thời gian. Thực hành hiện nay đã được giới thiệu khi Zenodo từng được tung ra vào tháng 5/2013, và trong khi nó không là lý tưởng thì chúng tôi đã không muốn thay đổi thực hành đang tồn tại đó.
Bạn có đúp bản tất cả các tệp cho từng phiên bản mới của hồ sơ?
Không, nếu bạn thay đổi một tệp README kích thước 10KB trong một tập hợp dữ liệu 50GB thì chúng tôi không đúp bản toàn bộ tập hợp dữ liệu 50GB đó. Invenio v3, nền tảng kho số nằm bên dưới mà trang bị cho Zenodo, thao tác có hiệu quả kho lưu trữ các tệp nên chúng tôi chỉ lưu trữ phần thêm mới 10KB đó.


Lars Holm Nielsen

Tôi hiện là kỹ sư phần mềm tại CERN — nơi tôi đã tung ra ZENODO, một dịch vụ quản lý dữ liệu nghiên cứu có tính đổi mới cho khoa học đuôi dài. Chuyên môn của tôi bao gồm việc mang các sản phẩm dựa vào web có tính đổi mới từ tư duy ban đầu tới khởi xướng thành công trong khoảng thời gian ngắn.
We are pleased to announce the launch of DOI versioning support in Zenodo – the open research repository from OpenAIRE and CERN. This new feature enables users to update the record’s files after they have been made public and researchers to easily cite either specific versions of a record or to cite, via a top-level DOI, all the versions of a record.
DOI versioning support was one of our most requested features for Zenodo, and it has been co-developed by OpenAIRE’s Zenodo team and EUDAT’s B2SHARE team as an extension module for CERN’s Invenio digital repository platform, which powers both Zenodo and B2SHARE.
These are exciting times for  Zenodo and OpenAIRE. This update comes hot on the heels of the recent relaunch which made Zenodo faster,  improved GitHub integration, integrated support for Horizon2020 grant information, and enabled 50 gigabyte uploads!
About Zenodo: Zenodo was built and developed by researchers, to ensure that everyone can join in Open Science. The OpenAIRE project, in the vanguard of the open access and open data movements in Europe was commissioned by the EC to support their nascent Open Data policy by providing a catch-all repository for EC funded research. CERN, an OpenAIRE partner and pioneer in open source, open access and open data, provided this capability and Zenodo was launched in May 2013. In support of its research programme CERN has developed tools for Big Data management and extended Digital Library capabilities for Open Data. Through Zenodo these Big Science tools could be effectively shared with the long­-tail of research.
We here explain more about this new exciting feature:
What is DOI versioning?
DOI versioning allows you to:
  • edit/update the record’s files after they have been published.
  • cite a specific version of a record.
  • cite all of versions of a record.
How does DOI versioning work?
When you publish an upload on Zenodo for the first time, we register two DOIs:
  • a DOI representing the specific version of your record.
  • a DOI representing all of the versions of your record.
Afterwards, we register a DOI for every new version of your upload.
This is best illustrated by an example of a software package. If the software has been released in two versions (v1.0 and v1.1) on Zenodo, then the following DOIs would have been registered:
  • v1.0 (specific version): 10.5281/zenodo.60943
  • v1.1 (specific version): 10.5281/zenodo.800648
  • Concept (all versions): 10.5281/zenodo.705645
The first two DOIs for versions v1.0 and v.1.1 represent the specific versions of the software. The last DOI represents all the versions of the given software package, i.e. the concept of the software package and the ensemble of versions. We therefore also call the them Version DOIs and Concept DOIs (note, technically both are just normal DOIs).
You may notice that the version DOIs do not include a “.v1”-suffix. Read below to find out why.
Which DOI should I use in citations?
You should normally always use the DOI for the specific version of your record in citations. This is to ensure that other researchers can access the exact research artifact you used for reproducibility. By default, Zenodo uses the specific version to generate citations.
You can use the Concept DOI representing all versions in citations when it is desirable to cite an evolving research artifact, without being specific about the version.
Where does the Concept DOI resolve to?
Currently the Concept DOI resolves to the landing page of the latest version of your record. This is not fully correct, and in the future we will change this to create a landing page specifically representing all of the versions.
Do you support versioning for already existing records?
Yes. However, for uploads published before the 30th of May 2017, you have to first upgrade your record to support versioning. This is done by clicking the “Upgrade to versioned record” button on the record page.
IMPORTANT
If you have previously uploaded multiple versions of an upload as individual records on Zenodo, then DO NOT click the button to upgrade your record with versioning support. Please contact us on info@zenodo.org so we can link the records under one versioning scheme.
Clicking the “Upgrade to versioned record” button on any of the records you would like to link, will irreversibly register them as individually-versioned records.
If you used the GitHub integration to archive your software on Zenodo, then we have already migrated and linked your records to support versioning.
Do you support DOI versioning for DOIs from providers other than Zenodo?
No, we only support DOI versioning for records with Zenodo DOIs (i.e. DOIs starting with the prefix 10.5281).
I only want to change the title of my upload, do I still get a new DOI?
No, as before you can continue to edit the metadata of your upload without creating a new version of a record. You should only create a new version if you want to update the files of your record.
Why don’t the DOIs have a version number suffix like “.v1”?
Including semantic information such as the version number in a DOI is bad practice, because this information may change over time, while DOIs must remain persistent and should not change.
Moveover, Zenodo DOI versioning is linear, which means that the Zenodo version number may in fact not be the real version number of the resource. Take for instance software, where it is common practice to have dot versions and make new releases in a non-linear order (e.g. first v1.0, then v1.1, then v2.0, then v1.2).
The versioning suffix is also not a functionality of the DOI system, i.e. adding .v2 to DOI will not resolve to version 2 of a resource for any DOI from any provider. Different providers also uses different patterns such as e.g. .v2, .2, /2.
Most importantly, version suffixes are not machine readable. A discovery system that understands DOIs, will not know that .v1 and .v2 of a DOI are in fact two versions of the same resource.
A better solution to this problem is to semantically link two DOIs in the metadata of a DOI. This ensures that discovery systems have a machine readable way to discover that two DOIs are versions of the same resource.
See also “Cool DOIs”, a blog post by Martin Fenner, DataCite Technical Director: https://doi.org/10.5438/55E5-T5C0
Why do you include “zenodo” in the DOI?
Currently DOIs registered by Zenodo follows the pattern “10.5281/zenodo.” where 10.5281 is the Zenodo DOI prefix and is a sequentially assigned integer. The word “zenodo” is semantic information, and as mentioned in the previous question it is a bad idea to include semantic information in DOIs as it may change over time. The current practice was introduced when Zenodo was launched in May 2013, and while it is not ideal we did not want to change the existing practice.
Do you duplicate all the files for every new version of a record?
No, if you change a 10kb README file in 50GB dataset we do not duplicate the entire 50GB dataset. Invenio v3, the underlying digital repository platform that powers Zenodo, efficiently handles the file storage so we only store the new extra 10kb.

Lars Holm Nielsen

I am currently Software Engineer at CERN — where I've launched ZENODO, an innovative research data management service for long-tail science. My specialities includes bringing innovative web-based products from the initial thought to successful launch in short time.
Dịch: Lê Trung Nghĩa

Không có nhận xét nào:

Đăng nhận xét

Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.