(Bài
được đăng trên tạp chí Tia Sáng trên trực tuyến ngày
09/06/2018 tại địa chỉ:
http://tiasang.com.vn/-khoa-hoc-cong-nghe/Dam-may-Khoa-hoc-Mo-chau-Au-va-goi-y-cho-Viet-Nam-12458)
Trong
giai đoạn 2018-2020, Đám mây Khoa học Mở châu Âu – EOSC
(European Open Science Cloud) có các hoạt động triển khai để
hiện thực hóa nó sẽ diễn ra cùng một lúc theo 6 dòng
hành động gồm: (1) Kiến trúc; (2) Dữ liệu; (3) Các dịch
vụ; (4) Truy cập & giao diện; (5) Các quy tắc; (6) Điều
hành. Bạn có thể mong chờ học được gì từ những
công việc đó? Bài viết này có thể đưa ra một vài gợi
ý.
‘Mục
đích của Đám mây Khoa học Mở châu Âu – EOSC (European
Open Science Cloud) là để trao cho Liên minh châu Âu sự dẫn
dắt toàn cầu trong quản lý dữ liệu nghiên cứu và đảm
bảo các nhà khoa học châu Âu gặt hái được đầy đủ
các lợi ích của khoa học do dữ liệu dẫn dắt1’.
Hình
1 - Các dòng hành động của mô hình EOSC2
Trong
khuôn khổ của một bài báo sẽ không có cách gì để có
thể chuyển tải hết được chi tiết các dòng hành động
đó. Vì vậy, bài viết có ý định nêu lên được những
điểm khái quát nhất của chúng.
1.
Kiến trúc
Kiến
trúc theo liên đoàn ngụ ý EOSC sẽ là liên đoàn các hạ
tầng dữ liệu nghiên cứu hiện đang có nhưng được lên
kế hoạch, được bổ sung thêm một lớp phủ mềm
để kết nối chúng và làm cho chúng vận hành trơn tru
như thể là một hạ tầng dữ liệu nghiên cứu duy nhất
của châu Âu.
Theo
cách này, EOSC sẽ gồm lõi liên đoàn EOSC và các hạ tầng
dữ liệu nghiên cứu có sẵn khác được kết nối với
lõi liên đoàn EOSC theo một khung tuân thủ với các quy
tắc tham gia được xây dựng để đảm bảo sự vận
hành trơn tru như được nêu ở trên.
Tất
cả các hạ tầng dữ liệu nghiên cứu
liên đoàn và các nhà cung cấp dịch vụ thương mại có
thể tuân thủ với các quy tắc tham gia. Quan trọng, họ
có thể đồng ý triển khai các nguyên tắc dữ liệu FAIR
(ghép các ký tự đầu của các
từ tiếng Anh: Findable,
Accessible,
Interoperable,
Reusable,
có nghĩa là [dữ liệu phải] tìm thấy được, truy cập
được, tương hợp được và sử dụng lại được)
một cách đầy đủ. Điều này có thể đóng góp cho tính
bền vững lâu dài của họ, khi
các nhà cấp vốn nghiên cứu của EU đang dần ràng buộc
việc cấp vốn của họ vào các bổn phận truy cập mở
và sử dụng các kho được thừa nhận/được chứng thực
FAIR. Qua thời gian, EOSC có thể với tới được các tài
nguyên từ các đối tác nghiên cứu toàn cầu của EU, để
tạo ra sân chơi bình đẳng về dữ liệu mở cho
các nhà khoa học toàn cầu3.
Hình
2. Các hoạt động triển khai theo dòng hành động
kiến trúc
Bình
diện quốc tế4
Các
đơn vị dịch vụ của Ủy ban châu Âu đã làm việc
trong ngữ cảnh của G7, G20 và trong sự cộng tác với
Diễn đàn Khoa học Toàn cầu của OECD5 để đảm
bảo sự triển khai EOSC là phù hợp với các ưu tiên của
Ủy ban trong các chương trình nghị sự quốc tế và phát
triển, trong ngữ cảnh của các Mục tiêu Phát triển Bền
vững của Liên hiệp quốc. Việc đạt được các mục
tiêu đó đòi hỏi tri thức toàn cầu và việc chia sẻ dữ
liệu FAIR, đặc biệt bao gồm trong các lĩnh vực khoa học
và nghiên cứu. Các nhà lãnh đạo G7 và Ủy ban đã kêu
gọi để ‘tất cả các nhà nghiên cứu [sẽ] có khả
năng ký gửi, truy cập và phân tích dữ liệu khoa học
xuyên khắp các lĩnh vực và ở phạm vi toàn cầu, và dữ
liệu nghiên cứu nên gắn với các nguyên tắc FAIR có
nghĩa là tìm thấy được, truy cập được, tương hợp
được và sử dụng lại được6’.
Gợi
ý: Điểm
này có lẽ là đặc
biệt quan trọng trong việc định hướng khoa học mở
trong tương lai ở Việt Nam, khi mà các quốc gia của cả
G7, G20, OECD và có lẽ của cả thế giới khoa học sẽ đi
theo khoa học mở, khi các nhà nghiên cứu Việt Nam có khả
năng ký gửi, truy cập và phân tích dữ liệu khoa học
xuyên khắp các lĩnh vực và ở phạm vi toàn cầu, với
dữ liệu nghiên cứu được gắn với các nguyên tắc
FAIR. Các bên liên quan tới khoa học mở ở Việt Nam có
thể cần đặt ra câu hỏi, liệu Việt Nam có khả năng
xây dựng hạ tầng như hạ tầng lõi liên đoàn EOSC, hay
Việt Nam sẽ chọn cho mình cách để xây dựng hạ tầng
dữ liệu nghiên cứu khoa học có khả năng kết nối được
với hạ tầng lõi liên đoàn EOSC? Hơn thế, điều này có
thể sẽ gợi ý cho Việt Nam để có được quyết tâm
phải chuyển dịch sang khoa học mở càng sớm càng tốt
để có thể hưởng lợi và cùng tồn tại được với
thế giới.
2.
Dữ liệu
Triển
khai các biện pháp cần thiết để nuôi dưỡng sự phát
triển các thực hành chuyên nghiệp về quản lý và quản
trị dữ liệu nghiên cứu ở châu Âu7,
đặc biệt:
-
Phát triển văn hóa quản lý dữ liệu nghiên cứu và các kỹ năng thực hành tốt hơn giữa các nhà khoa học và các nhà cách tân của EU, gồm hành động và các ưu đãi, các phần thưởng, các kỹ năng và chương trình giảng dạy có liên quan tới dữ liệu nghiên cứu và khoa học dữ liệu;
-
Phát triển các công cụ, đặc tả, catalog và các tiêu chuẩn dữ liệu FAIR, và các dịch vụ phía cung để hỗ trợ cho các nhà khoa học và các nhà cách tân, và
-
Khuyến khích nhu cầu về dữ liệu FAIR qua các chỉ thị dữ liệu FAIR nhất quán và các ưu đãi để mở dữ liệu từ các nhà cấp vốn nghiên cứu và các cơ sở khắp châu Âu.
Ngắn
gọn, dòng các hành động kết hợp này có thể cung cấp
một tập hợp các tài nguyên được chia sẻ của EOSC
cho quản lý dữ liệu, điều có
thể được các nhà nghiên cứu có hiểu biết về dữ
liệu sử dụng, được tất cả các hạ tầng dữ liệu
triển khai, được tất cả
các nhà cấp vốn nghiên cứu mặc định và được các
cơ sở địa phương ủng hộ.
Các
tài nguyên được chia sẻ của EOSC có thể được phát
triển để bao trùm tất cả các khía cạnh dữ liệu
FAIR:
-
Tìm thấy được, qua các catalog/các dịch vụ dữ liệu và siêu dữ liệu;
-
Truy cập được, qua các mã nhận diện duy nhất vĩnh viễn, kế hoạch quản lý dữ liệu;
-
Tương hợp được, qua các tiêu chuẩn tương hợp và các siêu dữ liệu chung;
-
Sử dụng lại được, qua các quyền sở hữu trí tuệ (IPR) và các điều khoản pháp lý chung (như việc sử dụng các giấy phép Creative Commons)
Hình
3. Các hoạt động triển khai theo dòng hành động
dữ liệu
Gợi
ý: Tất cả các hoạt động và lưu ý nêu trên giải
thích ngắn gọn cho chúng ta thấy dữ liệu FAIR là gì,
cần phải làm gì để đạt được nó và sắp tới có
những tài liệu chỉ dẫn nào được viết ra về các vấn
đề liên quan tới nó mà chúng ta có thể học tập được
để các dữ liệu được xuất bản ở Việt Nam cũng có
khả năng tuân thủ FAIR nếu Việt Nam chuyển hướng sang
khoa học mở, bao gồm cả việc cấp vốn nghiên cứu.
3.
Các dịch vụ
EOSC
chào 5 dạng chính các dịch vụ cho các nhà nghiên cứu,
sẵn sàng theo bất kể lĩnh vực nào hoặc xuyên bất kể
các đường biên giới quốc gia nào, gồm:
-
Dịch vụ xác thực và nhận diện duy nhất và điểm truy cập và hệ thống định tuyến hướng tới các tài nguyên của EOSC.
-
Môi trường/không gian làm việc được bảo vệ và cá nhân hóa (như, sổ lưu ký [logbook], các thiết lập, hồ sơ tuân thủ và các vấn đề còn để treo).
-
Truy cập tới thông tin dịch vụ thích hợp (tình trạng của EOSC, danh sách các hạ tầng dữ liệu, thông tin có liên quan tới chính sách, mô tả khung tuân thủ) và các chỉ dẫn đặc thù (cách để tạo dữ liệu FAIR, để chứng nhận kho hoặc dịch vụ, để mua sắm các dịch vụ chung)
-
Các dịch vụ để tìm kiếm, truy cập, sử dụng lại và phân tích dữ liệu nghiên cứu được những người khác tạo ra, truy cập được qua các catalog thích hợp các tập hợp dữ liệu và các dịch vụ dữ liệu (như phân tích, tổng hợp, khai phá, xử lý).
-
Các dịch vụ để làm cho dữ liệu của riêng họ thành FAIR, để lưu trữ chúng và đảm bảo sự bảo tồn lâu dài.
Hình
4. Các hoạt động triển khai theo dòng hành động
dịch vụ
Về
bản chất, Đám mây Khoa học Mở châu Âu (EOSC) sẽ xây
dựng cả 3 thành phần8 của một hạ tầng điện
toán đám mây là: (1) Hạ tầng như một dịch vụ - IaaS
(Infrastructure as a Service); (2) Nền tảng như một dịch vụ
- PaaS (Platform as a Service); và (3) Phần mềm như một dịch
vụ - SaaS (Software as a Service). Điều khác biệt ở đây
là các dịch vụ này đều có mục đích để phục vụ
cho các nhà khoa học và xoay quanh dữ liệu FAIR.
Gợi
ý: Là thực tế để cá nhân các nhà
nghiên cứu khoa học và các cơ sở viện - trường đại
học nghiên cứu của Việt Nam tập trung vào khả năng và
điều kiện khai thác các dịch vụ hạ tầng EOSC vì lợi
ích của chính mình thông qua các đối tác châu Âu.
4.
Truy cập & giao diện
Mục
đích của dòng hành động này là để tạo ra giao diện
để người sử dụng truy cập được tới các dịch vụ
EOSC dễ dàng nhất có thể. Hiện có 2 dự án với mục
đích này đã được bắt đầu rồi theo chương trình làm
việc của Horizon 2020 cho các năm 2016-2017 là: (1) EOSC-hub
sẽ thí điểm nền tảng chung và sự truy cập tới các
dịch vụ EOSC; và (2) dự án eInfraCentral cung cấp
catalog đầu tiên và sự truy cập tới các dịch vụ hạ
tầng điện tử. Trong giai đoạn 2018-2020, theo lời gọi
INFRAEOSC-06-2020, EOSC còn muốn có khả năng truy cập được
tới những người sử dụng qua các giao diện giữa máy -
với – máy và chào sự truy cập tới các tài nguyên được
chia sẻ của EOSC và dải đầy đủ các dịch vụ của
EOSC.
Gợi
ý: Đây có lẽ là
công việc chỉ của các bên tham gia phát triển các ứng
dụng và dịch vụ truy cập và giao diện của châu Âu và
các đối tác của họ.
5.
Các quy tắc tham gia
Các
bên tham gia đóng góp của châu Âu cho
EOSC đã nhìn thấy trước là EOSC
có thể hưởng lợi lớn từ sự phát triển các quy
tắc tham
gia. Hiện
dự án EOSCPilot đang xây dựng các quy tắc như vậy.
Hơn
nữa, các quy tắc đó có thể áp dụng khác nhau cho những
người tham gia EOSC khác nhau, phụ thuộc vào độ chín và
vai trò của họ (các nhà nghiên cứu so với những người
sử dụng, các nhà khoa học hoặc các nhà cách tân), vị
trí (các đối tác nghiên cứu của Liên
minh châu Âu so với toàn cầu), và có
thể cần tôn trọng các đặc tính của các lĩnh vực
khoa học khác nhau.
Hình
5. Các hoạt động triển khai theo dòng hành động
về các quy tắc tham gia
Gợi
ý: Chúng ta có lẽ sẽ chờ xem các nguyên tắc tham gia
EOSC điều chỉnh sự tham gia của các đối tác nghiên cứu
ngoài châu Âu sẽ như thế nào.
6.
Điều hành
Khung
điều hành EOSC rõ ràng là cần thiết và dự kiến sẽ
hỗ trợ các chức năng được định nghĩa tốt, gồm
chiến lược (như việc thiết lập đường hướng và các
ưu tiên dài hạn và quyết định về sự tuân thủ),
triển khai (như đường hướng ngân sách), giám sát (như
thiết lập các chỉ số hiệu năng chính) và báo cáo,
được thực thi trong phạm vi rõ ràng và có giới hạn,
bao quanh các hành động cần thiết cho sự phối hợp và
liên đoàn các hạ tầng dữ liệu nghiên cứu ở châu Âu
như được nêu ở các phần trên. Khung điều hành dự
kiến được triển khai ở 2 pha: (1) Pha đầu trong các năm
2018-2020; và (2) Pha 2 - sau năm 2020.
Hình
6. Các hoạt động triển khai theo dòng hành
động điều hành
Gợi
ý: Đây có lẽ là
công việc chỉ liên quan tới các
bên tham gia phát triển khung điều hành EOSC
của châu Âu và các đối tác của họ.
Kết
luận
Khả
năng để Việt Nam có thể xây dựng cho mình các hạ tầng
khoa học mở như đám mây khoa học mở châu Âu (EOSC)
trong điều kiện hiện nay và trong tương lai vài chục năm
tới là không tưởng, cho dù khoa học mở và các thành
phần của nó, đặc biệt là dữ liệu FAIR sẽ là những
gì toàn bộ thế giới khoa học từ nay trở đi sẽ hướng
tới.
Trong
bối cảnh như vậy, sẽ là thức thời nếu Việt Nam chọn
cho mình một tiếp cận ‘ngách’ phù hợp, vừa có khả
năng giúp cho khoa học của Việt Nam dịch chuyển tốt
nhất và nhanh nhất theo khoa học mở, vừa có thể ‘đứng
được trên vai của những người khổng lồ’ để không
bị vứt sang bên lề của cuộc cách mạng sản xuất thế
hệ tiếp sau – NPR (Next Production Revolution9).
‘Muộn
còn hơn không’ có lẽ là lời nhắc nhở dành cho toàn
bộ cộng đồng khoa học ở Việt Nam về sự tồn tại
và ngự trị của khoa học mở bây giờ và trong tương
lai, đặc biệt cho những ai được giao trọng trách quản
lý và tạo thuận lợi cho khoa học phát triển ở Việt
Nam.
------------------------------
1.
Được
tùy biến từ ‘Lộ trình triển khai đám mây khoa học mở
châu Âu - Tài liệu làm việc của các nhân viên Ủy ban’:
https://www.dropbox.com/s/z5abev46id2m0yq/swd_2018_83_f1_staff_working_paper_en_Vi-04042018.pdf?dl=0,
tr 16.
2.
Lộ trình
triển khai đám mây khoa học mở châu Âu - Tài liệu làm
việc của các nhân viên Ủy ban, trang 4, xem tại:
https://www.dropbox.com/s/z5abev46id2m0yq/swd_2018_83_f1_staff_working_paper_en_Vi-04042018.pdf?dl=0
3.
Tuyên
bố EOSC - Đám mây Khoa học Mở châu Âu: Các cơ hội mới
nghiên cứu và cách tân, trang 12, xem tại:
https://www.dropbox.com/s/0txrq8row8vdq2l/eosc_declaration_Vi_23022018.pdf?dl=0
4.
Lộ
trình triển khai đám mây khoa học mở châu Âu - Tài liệu
làm việc của các nhân viên Ủy ban, trang 21, xem tại:
https://www.dropbox.com/s/z5abev46id2m0yq/swd_2018_83_f1_staff_working_paper_en_Vi-04042018.pdf?dl=0
5.
Xem:
https://www.innovationpolicyplatform.org/open-data-science-oecd-project
và
http://www.codata.org/working-groups/oecd-gsf-sustainable-business-models
hoặc
tài liệu của OECD, 2015: Making Open Science a Reality.
6.
Thông
cáo của các Bộ trưởng Khoa học các nước G7 ngày
28/09/2017 tại Turin, Ý. Xem các đoạn 19 và 20:
https://www.dropbox.com/s/ywum8nfcgw7c6jz/G7%20Science%20Communiqu%C3%A9_Vi_25022018.pdf?dl=0
7.
Lộ trình triển khai đám mây khoa học mở châu Âu - Tài
liệu làm việc của các nhân viên Ủy ban, trang 22, xem
tại:
https://www.dropbox.com/s/z5abev46id2m0yq/swd_2018_83_f1_staff_working_paper_en_Vi-04042018.pdf?dl=0
8.
Xem thêm: ‘Danh sách hành động của tuyên bố EOSC’,
trang 4, phần ‘Triển khai dịch vụ’:
https://www.dropbox.com/s/lipf9nrhjsm22hb/eosc_declaration-action_list_Vi_24022018.pdf?dl=0
9.
OECD, 2017: Cách mạng Sản xuất Tiếp sau. Báo cáo cho G20,
các trang 15 và 52 nói các chính sách cần tạo thuận lợi
cho khoa học mở và dữ liệu mở:
https://www.dropbox.com/s/ccxckrn1sfyetbl/the-next-production-revolution-G20-report_Vi_27042018.pdf?dl=0
Giấy
phép: CC BY
4.0 Quốc tế
Lê
Trung Nghĩa
Không có nhận xét nào:
Đăng nhận xét
Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.