Thứ Sáu, 15 tháng 6, 2018

6 dòng hành động của Đám mây Khoa học Mở châu Âu và gợi ý về cơ hội cho Việt Nam


(Bài được đăng trên tạp chí Tia Sáng trên trực tuyến ngày 09/06/2018 tại địa chỉ: http://tiasang.com.vn/-khoa-hoc-cong-nghe/Dam-may-Khoa-hoc-Mo-chau-Au-va-goi-y-cho-Viet-Nam-12458)
Trong giai đoạn 2018-2020, Đám mây Khoa học Mở châu Âu – EOSC (European Open Science Cloud) có các hoạt động triển khai để hiện thực hóa nó sẽ diễn ra cùng một lúc theo 6 dòng hành động gồm: (1) Kiến trúc; (2) Dữ liệu; (3) Các dịch vụ; (4) Truy cập & giao diện; (5) Các quy tắc; (6) Điều hành. Bạn có thể mong chờ học được gì từ những công việc đó? Bài viết này có thể đưa ra một vài gợi ý.
Mục đích của Đám mây Khoa học Mở châu Âu – EOSC (European Open Science Cloud) là để trao cho Liên minh châu Âu sự dẫn dắt toàn cầu trong quản lý dữ liệu nghiên cứu và đảm bảo các nhà khoa học châu Âu gặt hái được đầy đủ các lợi ích của khoa học do dữ liệu dẫn dắt1’.
Hình 1 - Các dòng hành động của mô hình EOSC2
Trong khuôn khổ của một bài báo sẽ không có cách gì để có thể chuyển tải hết được chi tiết các dòng hành động đó. Vì vậy, bài viết có ý định nêu lên được những điểm khái quát nhất của chúng.


1. Kiến trúc
Kiến trúc theo liên đoàn ngụ ý EOSC sẽ là liên đoàn các hạ tầng dữ liệu nghiên cứu hiện đang có nhưng được lên kế hoạch, được bổ sung thêm một lớp phủ mềm để kết nối chúng và làm cho chúng vận hành trơn tru như thể là một hạ tầng dữ liệu nghiên cứu duy nhất của châu Âu.
Theo cách này, EOSC sẽ gồm lõi liên đoàn EOSC và các hạ tầng dữ liệu nghiên cứu có sẵn khác được kết nối với lõi liên đoàn EOSC theo một khung tuân thủ với các quy tắc tham gia được xây dựng để đảm bảo sự vận hành trơn tru như được nêu ở trên.
Tất cả các hạ tầng dữ liệu nghiên cứu liên đoàn và các nhà cung cấp dịch vụ thương mại có thể tuân thủ với các quy tắc tham gia. Quan trọng, họ có thể đồng ý triển khai các nguyên tắc dữ liệu FAIR (ghép các ký tự đầu của các từ tiếng Anh: Findable, Accessible, Interoperable, Reusable, có nghĩa là [dữ liệu phải] tìm thấy được, truy cập được, tương hợp được và sử dụng lại được) một cách đầy đủ. Điều này có thể đóng góp cho tính bền vững lâu dài của họ, khi các nhà cấp vốn nghiên cứu của EU đang dần ràng buộc việc cấp vốn của họ vào các bổn phận truy cập mở và sử dụng các kho được thừa nhận/được chứng thực FAIR. Qua thời gian, EOSC có thể với tới được các tài nguyên từ các đối tác nghiên cứu toàn cầu của EU, để tạo ra sân chơi bình đẳng về dữ liệu mở cho các nhà khoa học toàn cầu3.
Hình 2. Các hoạt động triển khai theo dòng hành động kiến trúc
Bình diện quốc tế4
Các đơn vị dịch vụ của Ủy ban châu Âu đã làm việc trong ngữ cảnh của G7, G20 và trong sự cộng tác với Diễn đàn Khoa học Toàn cầu của OECD5 để đảm bảo sự triển khai EOSC là phù hợp với các ưu tiên của Ủy ban trong các chương trình nghị sự quốc tế và phát triển, trong ngữ cảnh của các Mục tiêu Phát triển Bền vững của Liên hiệp quốc. Việc đạt được các mục tiêu đó đòi hỏi tri thức toàn cầu và việc chia sẻ dữ liệu FAIR, đặc biệt bao gồm trong các lĩnh vực khoa học và nghiên cứu. Các nhà lãnh đạo G7 và Ủy ban đã kêu gọi để ‘tất cả các nhà nghiên cứu [sẽ] có khả năng ký gửi, truy cập và phân tích dữ liệu khoa học xuyên khắp các lĩnh vực và ở phạm vi toàn cầu, và dữ liệu nghiên cứu nên gắn với các nguyên tắc FAIR có nghĩa là tìm thấy được, truy cập được, tương hợp được và sử dụng lại được6’.
Gợi ý: Điểm này có lẽ là đặc biệt quan trọng trong việc định hướng khoa học mở trong tương lai ở Việt Nam, khi mà các quốc gia của cả G7, G20, OECD và có lẽ của cả thế giới khoa học sẽ đi theo khoa học mở, khi các nhà nghiên cứu Việt Nam có khả năng ký gửi, truy cập và phân tích dữ liệu khoa học xuyên khắp các lĩnh vực và ở phạm vi toàn cầu, với dữ liệu nghiên cứu được gắn với các nguyên tắc FAIR. Các bên liên quan tới khoa học mở ở Việt Nam có thể cần đặt ra câu hỏi, liệu Việt Nam có khả năng xây dựng hạ tầng như hạ tầng lõi liên đoàn EOSC, hay Việt Nam sẽ chọn cho mình cách để xây dựng hạ tầng dữ liệu nghiên cứu khoa học có khả năng kết nối được với hạ tầng lõi liên đoàn EOSC? Hơn thế, điều này có thể sẽ gợi ý cho Việt Nam để có được quyết tâm phải chuyển dịch sang khoa học mở càng sớm càng tốt để có thể hưởng lợi và cùng tồn tại được với thế giới.


2. Dữ liệu
Triển khai các biện pháp cần thiết để nuôi dưỡng sự phát triển các thực hành chuyên nghiệp về quản lý và quản trị dữ liệu nghiên cứu ở châu Âu7, đặc biệt:
  1. Phát triển văn hóa quản lý dữ liệu nghiên cứu và các kỹ năng thực hành tốt hơn giữa các nhà khoa học và các nhà cách tân của EU, gồm hành động và các ưu đãi, các phần thưởng, các kỹ năng và chương trình giảng dạy có liên quan tới dữ liệu nghiên cứu và khoa học dữ liệu;
  2. Phát triển các công cụ, đặc tả, catalog và các tiêu chuẩn dữ liệu FAIR, và các dịch vụ phía cung để hỗ trợ cho các nhà khoa học và các nhà cách tân, và
  3. Khuyến khích nhu cầu về dữ liệu FAIR qua các chỉ thị dữ liệu FAIR nhất quán và các ưu đãi để mở dữ liệu từ các nhà cấp vốn nghiên cứu và các cơ sở khắp châu Âu.
Ngắn gọn, dòng các hành động kết hợp này có thể cung cấp một tập hợp các tài nguyên được chia sẻ của EOSC cho quản lý dữ liệu, điều có thể được các nhà nghiên cứu có hiểu biết về dữ liệu sử dụng, được tất cả các hạ tầng dữ liệu triển khai, được tất cả các nhà cấp vốn nghiên cứu mặc định và được các cơ sở địa phương ủng hộ.
Các tài nguyên được chia sẻ của EOSC có thể được phát triển để bao trùm tất cả các khía cạnh dữ liệu FAIR:
  • Tìm thấy được, qua các catalog/các dịch vụ dữ liệu và siêu dữ liệu;
  • Truy cập được, qua các mã nhận diện duy nhất vĩnh viễn, kế hoạch quản lý dữ liệu;
  • Tương hợp được, qua các tiêu chuẩn tương hợp và các siêu dữ liệu chung;
  • Sử dụng lại được, qua các quyền sở hữu trí tuệ (IPR) và các điều khoản pháp lý chung (như việc sử dụng các giấy phép Creative Commons)
Hình 3. Các hoạt động triển khai theo dòng hành động dữ liệu
Gợi ý: Tất cả các hoạt động và lưu ý nêu trên giải thích ngắn gọn cho chúng ta thấy dữ liệu FAIR là gì, cần phải làm gì để đạt được nó và sắp tới có những tài liệu chỉ dẫn nào được viết ra về các vấn đề liên quan tới nó mà chúng ta có thể học tập được để các dữ liệu được xuất bản ở Việt Nam cũng có khả năng tuân thủ FAIR nếu Việt Nam chuyển hướng sang khoa học mở, bao gồm cả việc cấp vốn nghiên cứu.


3. Các dịch vụ
EOSC chào 5 dạng chính các dịch vụ cho các nhà nghiên cứu, sẵn sàng theo bất kể lĩnh vực nào hoặc xuyên bất kể các đường biên giới quốc gia nào, gồm:
  1. Dịch vụ xác thực và nhận diện duy nhất và điểm truy cập và hệ thống định tuyến hướng tới các tài nguyên của EOSC.
  2. Môi trường/không gian làm việc được bảo vệ và cá nhân hóa (như, sổ lưu ký [logbook], các thiết lập, hồ sơ tuân thủ và các vấn đề còn để treo).
  3. Truy cập tới thông tin dịch vụ thích hợp (tình trạng của EOSC, danh sách các hạ tầng dữ liệu, thông tin có liên quan tới chính sách, mô tả khung tuân thủ) và các chỉ dẫn đặc thù (cách để tạo dữ liệu FAIR, để chứng nhận kho hoặc dịch vụ, để mua sắm các dịch vụ chung)
  4. Các dịch vụ để tìm kiếm, truy cập, sử dụng lại và phân tích dữ liệu nghiên cứu được những người khác tạo ra, truy cập được qua các catalog thích hợp các tập hợp dữ liệu và các dịch vụ dữ liệu (như phân tích, tổng hợp, khai phá, xử lý).
  5. Các dịch vụ để làm cho dữ liệu của riêng họ thành FAIR, để lưu trữ chúng và đảm bảo sự bảo tồn lâu dài.
Hình 4. Các hoạt động triển khai theo dòng hành động dịch vụ
Về bản chất, Đám mây Khoa học Mở châu Âu (EOSC) sẽ xây dựng cả 3 thành phần8 của một hạ tầng điện toán đám mây là: (1) Hạ tầng như một dịch vụ - IaaS (Infrastructure as a Service); (2) Nền tảng như một dịch vụ - PaaS (Platform as a Service); và (3) Phần mềm như một dịch vụ - SaaS (Software as a Service). Điều khác biệt ở đây là các dịch vụ này đều có mục đích để phục vụ cho các nhà khoa học và xoay quanh dữ liệu FAIR.
Gợi ý: Là thực tế để cá nhân các nhà nghiên cứu khoa học và các cơ sở viện - trường đại học nghiên cứu của Việt Nam tập trung vào khả năng và điều kiện khai thác các dịch vụ hạ tầng EOSC vì lợi ích của chính mình thông qua các đối tác châu Âu.


4. Truy cập & giao diện
Mục đích của dòng hành động này là để tạo ra giao diện để người sử dụng truy cập được tới các dịch vụ EOSC dễ dàng nhất có thể. Hiện có 2 dự án với mục đích này đã được bắt đầu rồi theo chương trình làm việc của Horizon 2020 cho các năm 2016-2017 là: (1) EOSC-hub sẽ thí điểm nền tảng chung và sự truy cập tới các dịch vụ EOSC; và (2) dự án eInfraCentral cung cấp catalog đầu tiên và sự truy cập tới các dịch vụ hạ tầng điện tử. Trong giai đoạn 2018-2020, theo lời gọi INFRAEOSC-06-2020, EOSC còn muốn có khả năng truy cập được tới những người sử dụng qua các giao diện giữa máy - với – máy và chào sự truy cập tới các tài nguyên được chia sẻ của EOSC và dải đầy đủ các dịch vụ của EOSC.
Gợi ý: Đây có lẽ là công việc chỉ của các bên tham gia phát triển các ứng dụng và dịch vụ truy cập và giao diện của châu Âu và các đối tác của họ.


5. Các quy tắc tham gia
Các bên tham gia đóng góp của châu Âu cho EOSC đã nhìn thấy trước là EOSC có thể hưởng lợi lớn từ sự phát triển các quy tắc tham gia. Hiện dự án EOSCPilot đang xây dựng các quy tắc như vậy.
Hơn nữa, các quy tắc đó có thể áp dụng khác nhau cho những người tham gia EOSC khác nhau, phụ thuộc vào độ chín và vai trò của họ (các nhà nghiên cứu so với những người sử dụng, các nhà khoa học hoặc các nhà cách tân), vị trí (các đối tác nghiên cứu của Liên minh châu Âu so với toàn cầu), và có thể cần tôn trọng các đặc tính của các lĩnh vực khoa học khác nhau.
Hình 5. Các hoạt động triển khai theo dòng hành động về các quy tắc tham gia
Gợi ý: Chúng ta có lẽ sẽ chờ xem các nguyên tắc tham gia EOSC điều chỉnh sự tham gia của các đối tác nghiên cứu ngoài châu Âu sẽ như thế nào.


6. Điều hành
Khung điều hành EOSC rõ ràng là cần thiết và dự kiến sẽ hỗ trợ các chức năng được định nghĩa tốt, gồm chiến lược (như việc thiết lập đường hướng và các ưu tiên dài hạn và quyết định về sự tuân thủ), triển khai (như đường hướng ngân sách), giám sát (như thiết lập các chỉ số hiệu năng chính) và báo cáo, được thực thi trong phạm vi rõ ràng và có giới hạn, bao quanh các hành động cần thiết cho sự phối hợp và liên đoàn các hạ tầng dữ liệu nghiên cứu ở châu Âu như được nêu ở các phần trên. Khung điều hành dự kiến được triển khai ở 2 pha: (1) Pha đầu trong các năm 2018-2020; và (2) Pha 2 - sau năm 2020.
Hình 6. Các hoạt động triển khai theo dòng hành động điều hành
Gợi ý: Đây có lẽ là công việc chỉ liên quan tới các bên tham gia phát triển khung điều hành EOSC của châu Âu và các đối tác của họ.


Kết luận
Khả năng để Việt Nam có thể xây dựng cho mình các hạ tầng khoa học mở như đám mây khoa học mở châu Âu (EOSC) trong điều kiện hiện nay và trong tương lai vài chục năm tới là không tưởng, cho dù khoa học mở và các thành phần của nó, đặc biệt là dữ liệu FAIR sẽ là những gì toàn bộ thế giới khoa học từ nay trở đi sẽ hướng tới.
Trong bối cảnh như vậy, sẽ là thức thời nếu Việt Nam chọn cho mình một tiếp cận ‘ngách’ phù hợp, vừa có khả năng giúp cho khoa học của Việt Nam dịch chuyển tốt nhất và nhanh nhất theo khoa học mở, vừa có thể ‘đứng được trên vai của những người khổng lồ’ để không bị vứt sang bên lề của cuộc cách mạng sản xuất thế hệ tiếp sau – NPR (Next Production Revolution9).
Muộn còn hơn không’ có lẽ là lời nhắc nhở dành cho toàn bộ cộng đồng khoa học ở Việt Nam về sự tồn tại và ngự trị của khoa học mở bây giờ và trong tương lai, đặc biệt cho những ai được giao trọng trách quản lý và tạo thuận lợi cho khoa học phát triển ở Việt Nam.


------------------------------
1. Được tùy biến từ ‘Lộ trình triển khai đám mây khoa học mở châu Âu - Tài liệu làm việc của các nhân viên Ủy ban’: https://www.dropbox.com/s/z5abev46id2m0yq/swd_2018_83_f1_staff_working_paper_en_Vi-04042018.pdf?dl=0, tr 16.
2. Lộ trình triển khai đám mây khoa học mở châu Âu - Tài liệu làm việc của các nhân viên Ủy ban, trang 4, xem tại: https://www.dropbox.com/s/z5abev46id2m0yq/swd_2018_83_f1_staff_working_paper_en_Vi-04042018.pdf?dl=0
3. Tuyên bố EOSC - Đám mây Khoa học Mở châu Âu: Các cơ hội mới nghiên cứu và cách tân, trang 12, xem tại: https://www.dropbox.com/s/0txrq8row8vdq2l/eosc_declaration_Vi_23022018.pdf?dl=0
4. Lộ trình triển khai đám mây khoa học mở châu Âu - Tài liệu làm việc của các nhân viên Ủy ban, trang 21, xem tại: https://www.dropbox.com/s/z5abev46id2m0yq/swd_2018_83_f1_staff_working_paper_en_Vi-04042018.pdf?dl=0
6. Thông cáo của các Bộ trưởng Khoa học các nước G7 ngày 28/09/2017 tại Turin, Ý. Xem các đoạn 19 và 20: https://www.dropbox.com/s/ywum8nfcgw7c6jz/G7%20Science%20Communiqu%C3%A9_Vi_25022018.pdf?dl=0
7. Lộ trình triển khai đám mây khoa học mở châu Âu - Tài liệu làm việc của các nhân viên Ủy ban, trang 22, xem tại: https://www.dropbox.com/s/z5abev46id2m0yq/swd_2018_83_f1_staff_working_paper_en_Vi-04042018.pdf?dl=0
8. Xem thêm: ‘Danh sách hành động của tuyên bố EOSC’, trang 4, phần ‘Triển khai dịch vụ’: https://www.dropbox.com/s/lipf9nrhjsm22hb/eosc_declaration-action_list_Vi_24022018.pdf?dl=0
9. OECD, 2017: Cách mạng Sản xuất Tiếp sau. Báo cáo cho G20, các trang 15 và 52 nói các chính sách cần tạo thuận lợi cho khoa học mở và dữ liệu mở: https://www.dropbox.com/s/ccxckrn1sfyetbl/the-next-production-revolution-G20-report_Vi_27042018.pdf?dl=0


Giấy phép: CC BY 4.0 Quốc tế
Lê Trung Nghĩa

Không có nhận xét nào:

Đăng nhận xét

Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.