Additional
Resources
Open Research
Overview
Nghiên
cứu Mở là một tập hợp các nguyên tắc và thực hành
nhằm mục đích làm cho các kết quả nghiên cứu tự do
truy cập được và sử dụng được, từ đó tối đa hóa
khả năng mang lại lợi ích cho cộng đồng.
Nó
được mô tả là "nghiên cứu học thuật mang tính
cộng tác, minh bạch và có thể tái tạo, và các kết quả
nghiên cứu là có sẵn công khai"
(Lời khuyên tích hợp của Nền
tảng Chính sách Khoa học Mở). Nó
dựa trên nguyên tắc rằng kiến thức sẽ mang lại lợi
ích lớn nhất nếu được chia sẻ rộng rãi nhất có
thể.
Nghiên
cứu Mở
Nghiên cứu
Mở có liên quan đến tất cả các nhà nghiên cứu và tất
cả các lĩnh vực, mặc dù các ứng dụng sẽ khác nhau
tùy thuộc vào lĩnh vực và bối cảnh nghiên cứu. Có
nhiều định nghĩa khác nhau về Nghiên cứu Mở, nhưng có
thể xác định một số chủ đề (không phải tất cả
đều phù hợp trong mọi trường hợp):
Làm
cho các kết quả nghiên cứu, bao gồm các ấn phẩm, dữ
liệu, phần mềm và các tài liệu nghiên cứu khác tự
do truy cập được;
Giấy
phép mở hoặc tiêu chuẩn cung cấp quyền sử dụng lại;
Sử
dụng các công cụ và dịch vụ trực tuyến để tăng
tính minh bạch của các quy trình và phương pháp nghiên
cứu;
Làm
cho nghiên cứu khoa học dễ tái tạo lại hơn bằng cách
tăng số lượng và chất lượng thông tin được công
khai;
Sử
dụng các mô hình xuất bản và đánh giá ngang hàng (peer
review) thay thế để đẩy nhanh và minh bạch hóa việc
phổ biến và chứng nhận nghiên cứu;
Sử
dụng các phương pháp cộng tác mở để tăng hiệu quả
và mở rộng sự tham gia vào nghiên cứu.
Các
nguyên tắc của Nghiên cứu Mở được phản ánh trong
chính sách của nhiều nhà tài trợ công và tổ chức
nghiên cứu thúc đẩy quyền truy cập công khai rộng rãi
hơn tới nghiên cứu, và trong các mô hình truyền thông
học thuật đang phát triển. Sự thay đổi cũng được
thúc đẩy bởi nhu cầu của cộng đồng học thuật và
các bên liên quan trong công chúng nói chung, trong ngành công
nghiệp và ở các nước đang phát triển.
Trong bối
cảnh này, Tuyên
bố về Khoa học Mở của UNESCO là một tài liệu
chiến lược quan trọng. Tuyên bố này nêu ra nhiều lý do
cho chương trình nghị sự mở, bao gồm giải quyết vấn
đề nghèo đói và bất bình đẳng; tiềm năng chuyển đổi
của một cách tiếp cận khoa học mang tính tham gia nhiều
hơn; hòa nhập giáo dục; tiến bộ khoa học; và tầm quan
trọng của cơ sở hạ tầng. Các quốc gia thành viên
UNESCO được kỳ vọng sẽ thực hiện tuyên bố này thông
qua chính sách và luật pháp quốc gia khi cần thiết.
Ở châu
Âu, Khoa học Mở (Open
Science) thường được áp dụng cho nghiên cứu trong
tất cả các lĩnh vực. Nhưng
thuật ngữ này cũng thường được sử dụng để chỉ
cụ thể các ngành khoa học thực nghiệm, nơi các vấn đề
về khả năng tiếp cận, tính minh bạch và khả năng tái
tạo là cấp thiết nhất.
Mặc dù quyền truy cập tới các kết quả nghiên cứu rất
quan trọng bất kể ngành học hay bản chất của nghiên
cứu, nhưng nhiều thực hành mở chủ yếu hoặc chỉ liên
quan đến khoa học. Các nhà nghiên cứu trong tất cả các
lĩnh vực có thể chia sẻ dữ liệu và tài liệu gốc của
họ để tối đa hóa giá trị của chúng và cho phép tái
sử dụng chúng.
Vì vậy,
Nghiên cứu Mở là có thể truy cập được, minh bạch và
có thể tái tạo lại. Nhưng, để diễn giải lại lời
của một tác giả, đó
chẳng phải chỉ là nghiên cứu sao? Nói cách khác, vấn
đề gì với nghiên cứu khiến mọi người cứ khăng
khăng đòi hỏi nó phải được mở?
Trên thực
tế, nghiên cứu có một số vấn đề:
Hai
phần ba hồ sơ học thuật bị che giấu sau các bức
tường phí. Trong số 2 triệu bài báo được đánh
giá ngang hàng xuất bản năm 2018, hơn 1,4 triệu bài không
thể tiếp cận được đối với nhiều nhà nghiên cứu
cũng như công chúng rộng rãi, với những người bên
ngoài mạng lưới học thuật của thế giới phát triển
bị từ chối quyền truy cập vào các tài liệu khoa học
quan trọng một cách không cân xứng. Tình trạng này
không chỉ làm trầm trọng thêm sự bất bình đẳng toàn
cầu, mà còn gây lãng phí vô số cơ hội tạo ra lợi
ích công cộng và kinh tế từ nghiên cứu.
Nhiều
sản phẩm có giá trị của quá trình nghiên cứu, đặc
biệt là dữ liệu nghiên cứu và phần mềm, bị đánh
giá thấp trong văn hóa học thuật và hệ thống khen
thưởng, và không
được cung cấp để người khác sử dụng lại:
chúng có thể hoàn toàn không được chia sẻ, hoặc được
chia sẻ với chú thích và tài liệu kém cỏi, và ở các
định dạng (như PDF) không cho phép dễ dàng sử dụng
lại. Lucas-Dominguez và cộng sự (2021) nhận thấy rằng
mặc dù các trường hợp khẩn cấp về sức khỏe cộng
đồng thường được coi là động lực thúc đẩy thực
hành Nghiên cứu Mở (ví dụ: sự gia tăng các nhanh các
bài báo trước xuất bản [preprints] về Covid), nhưng bức
tranh thực tế phức tạp hơn. Trong số 5.905 bài báo liên
quan đến COVID-19 được xuất bản từ ngày 1/12/2019 đến
ngày 30/4/2020, chỉ có 13,6% công bố dữ liệu nghiên cứu
cơ bản và 75% là tài liệu PDF hoặc Word, điều này có
thể cản trở việc sử dụng lại.
Nghiên
cứu thực nghiệm có đặc điểm là tỷ
lệ tái tạo thấp, do nhiều nguyên nhân khác nhau, bao
gồm những điểm yếu có thể tránh được trong thiết
kế và phương pháp nghiên cứu, sự thiếu thông tin chi
tiết về giả thuyết và phương pháp trong các kết quả
đã công bố, và việc không chia sẻ dữ liệu hỗ trợ
và mã nguồn được sử dụng trong phân tích kết quả.
Một
cuộc
khảo sát do tạp chí Nature thực hiện năm 2016
cho thấy
hơn 70% nhà khoa học không thể tái tạo công trình của
người khác, và hơn 50% không thể tái tạo thí nghiệm
của chính họ!
Điều này thể hiện sự lãng phí nguồn lực khổng lồ,
và trong các lĩnh vực như nghiên cứu y học và dược
phẩm, nó làm suy giảm nghiêm trọng sự phát triển của
các phương pháp điều trị hiệu quả. Năm 2015, người
ta ước tính rằng nghiên
cứu sinh học không thể tái tạo gây thiệt hại 28 tỷ
USD mỗi năm.
Việc
chứng nhận và công bố nghiên cứu cho công chúng phần
lớn vẫn gắn liền với một quy trình đánh giá ngang
hàng đóng kín (a closed process of peer review), dễ
bị ảnh hưởng bởi phán xét của một số ít người
đánh giá ngang hàng (thường là ẩn danh), không chịu
trách nhiệm trước công chúng, và
bị ảnh hưởng nặng nề bởi hiện tượng
thiên
vị xuất bản – xu hướng
áp đảo là công bố các báo cáo về nghiên cứu mới và
có hiệu quả đáng kể, bỏ qua các nghiên cứu không có
kết quả hoặc có kết quả tiêu cực. Điều này dẫn
đến việc kìm hãm một lượng lớn nghiên cứu dựa
trên các đánh giá hạn chế, thiếu minh bạch và các yếu
tố khác không liên quan đến chất lượng nghiên cứu.
Việc
truyền đạt các kết quả nghiên cứu có giá trị có
thể bị
trì hoãn kéo dài khi các bài báo trải qua hệ thống
nộp bài và đánh giá ngang hàng đóng kín của nhà xuất
bản, làm chậm tốc độ năng suất cá nhân và tiến bộ
khoa học. Các tác giả có thể bị mắc kẹt trong quy
trình nộp bài nối tiếp kéo dài hàng tháng, thậm chí
hàng năm khi họ tìm cách đảm bảo bài báo được chấp
nhận. Kết quả thực tế là kìm hãm nghiên cứu do sự
chậm trễ.
Các thực
hành mở
Các thực
hành mở sau đây có thể hỗ trợ nghiên cứu mở:
sử
dụng việc xuất bản theo một giấy phép mở để truyền
đạt các kết quả nghiên cứu, có thể bao gồm các ấn
phẩm, dữ liệu, mã phần mềm và các tài liệu khác;
phổ
biến kết quả nghiên cứu bằng cách sử dụng các máy
chủ hoặc tạp chí tiền ấn phẩm;
gửi
bài báo đến một tạp chí theo quy trình đánh giá ngang
hàng mở (open peer review process) chính thức do nhà xuất
bản quản lý, hoặc đóng vai trò là người đánh giá
ngang hàng theo hệ thống đánh giá ngang hàng mở do nhà
xuất bản quản lý;
tạo
ra một bảncông khai trước đăng ký về thiết kế
nghiên cứu hoặc xuất bản nghiên cứu dưới dạng báo
cáo đã đăng ký;
xuất
bản một mô tả các nguồn tài nguyên nghiên cứu được
đánh giá ngang hàng chính thức, chẳng hạn như bài báo
về dữ liệu hoặc bài báo về phần mềm;
kết
hợp các phương pháp mở và có sự tham gia vào thiết kế
và tiến hành nghiên cứu, ví dụ: bằng cách sử dụng
các phương pháp dựa trên các ghi chép mở hoặc tạo ra
dự án bằng cách sử dụng nền tảng khoa học công dân
(citizen science) trực tuyến;
giới
thiệu các khái niệm, thực hành và nguồn tài nguyên
Nghiên cứu Mở vào giảng dạy và học tập;
tạo
ra các công cụ hoặc công nghệ để hỗ trợ các thực
hành Nghiên cứu Mở, ví dụ: để kết hợp hoặc tái sử
dụng các tập dữ liệu và các kết quả nghiên cứu
khác từ các địa điểm hoặc lĩnh vực khác nhau, hoặc
để khai thác nội dung; sử dụng phần cứng mở (open
hardware)
thực
hiện các hoạt động để phát triển môi trường cho
Nghiên cứu Mở, ví dụ: bằng cách tham gia vào các hoạt
động truyền thông cấp cao, bằng cách khiến một tạp
chí áp dụng các chính sách ủng hộ Nghiên cứu Mở,
hoặc bằng cách tham gia vào các sáng kiến cộng đồng
để phát triển các tiêu chuẩn dữ liệu hoặc siêu dữ
liệu.
Giấy
phép Mở
Quyền truy
cập và sử dụng một hạng mục, để làm cơ sở mà
người dùng khác có thể dựa vào, cần phải được nêu
rõ ràng, được cấp không thể thu hồi và được pháp
luật công nhận. Các điều kiện này được đáp ứng
bằng cách cung cấp cho một hạng mục để khả dụng
theo một giấy phép.
Giấy phép
trong ngữ cảnh này là sự cho phép chính thức để sử
dụng tài liệu được chỉ định. Nó cho người dùng
tiềm năng biết họ được phép và không được phép làm
gì với một tài sản trí tuệ. Một hạng mục không có
giấy phép có thể không sử dụng được cho một số mục
đích thực tế. Một nhà nghiên cứu không sử dụng được
tập dữ liệu nếu họ không được phép sửa đổi hoặc
phân phối lại nó; Một công ty sẽ không dựa vào phần
mềm của bên thứ ba để vận hành hoạt động thương
mại nếu không có sự đảm bảo rằng phần mềm đó có
thể được sử dụng cho mục đích cần thiết.
Giấy phép
cũng cung cấp sự bảo vệ cho người sáng tạo và chủ
sở hữu tài sản trí tuệ. Kèm theo tuyên bố về quyền,
giấy phép thiết lập quyền sở hữu hợp pháp đối với
hạng mục được cấp phép và khẳng định quyền của
người sáng tạo được công nhận là người sáng tạo.
Điều kiện ghi công, phổ biến trong nhiều giấy phép mở,
là cơ sở pháp lý cho quyền của bạn được ghi nhận là
người sáng tạo ra tài liệu được cấp phép. Nhiều
giấy phép cũng bao gồm các tuyên bố từ chối trách
nhiệm chính thức đối với bất kỳ thiệt hại nào có
thể phát sinh từ việc người khác sử dụng tài liệu
đó.
Các giấy
phép mở đã được sử dụng rộng rãi để cấp phép
cho các kết quả nghiên cứu (cũng như các tài liệu có
bản quyền khác) nhằm tối đa hóa tiềm năng tái sử
dụng của chúng. Các ví dụ về giấy phép mở bao gồm:
Tất cả
các giấy phép mở đều có một số đặc điểm chung:
Giấy
phép về cơ bản là cho phép (trái ngược với các giấy
phép bản quyền giữ lại tất cả các quyền [all rights
reserved] và giấy phép sở hữu độc quyền [proprietary
license], vốn mang tính hạn chế). Mục đích của nó là
cho phép người khác sử dụng tài liệu được cấp
phép. Giấy phép mở cuối cùng cho phép bất kỳ ai cũng
có thể tự do truy cập, sử dụng, sửa đổi và chia sẻ
một hạng mục vì bất kỳ mục đích nào. Giấy
phép cấm sử dụng cho mục đích thương mại hoặc cấm
phân phối các tài liệu phái sinh không đáp ứng đầy
đủ định nghĩa của giấy phép mở, vì những hạn chế
mà các điều khoản này đặt ra đối với việc tái sử
dụng, nhưng nó vẫn nằm trong phạm vi mở. Có thể
có những lý do chính đáng để xuất bản theo giấy phép
mở với một số hạn chế, chẳng hạn như để bảo vệ
lợi ích thương mại hoặc ngăn chặn việc lạm dụng
các tác phẩm được tạo ra trong lĩnh vực nhân văn, nơi
hình thức biểu đạt là yếu tố không thể thiếu đối
với giá trị của chúng.
Giấy
phép thường bao gồm các biện pháp bảo vệ cho người
sáng tạo và chủ sở hữu của tài liệu được cấp
phép, dưới hình thức tuyên bố miễn trừ trách nhiệm
và yêu cầu ghi công. Việc Hiến tặng
vào Phạm vi công cộng (như CC0) không bao gồm yêu cầu
ghi công, vì theo định nghĩa, đó là sự khước từ
quyền đối với tài liệu, nhưng vẫn có thể bao gồm
tuyên bố miễn trừ trách nhiệm.
Bộ giấy
phép Creative Commons bao gồm các phiên bản với các điều
khoản Phi thương mại (Non-Commercial) và Không phái sinh
(No-Derivatives). Những giấy phép này có thể được coi là
mở, ở chỗ chúng cho phép truy cập tài liệu một cách
tự do, mặc dù chúng không mở theo nghĩa đầy đủ nhất
vì những hạn chế mà chúng đặt ra đối với việc tái
sử dụng. Nếu không thể cung cấp tài liệu theo giấy
phép mở hoàn toàn, thì việc xuất bản theo giấy phép
tiêu chuẩn gần nhất vẫn là một lựa chọn khôn ngoan.
Giấy phép CC BY-NC có thể không phải là giấy phép mở
nhất, nhưng nó cho phép sử dụng rộng rãi trong nghiên
cứu, giảng dạy và các hoạt động phi thương mại khác.
Dữ liệu
Mở (Open Data)
Việc chia
sẻ dữ liệu nghiên cứu ngày càng trở thành một kỳ
vọng của các nhà tài trợ. Điều này thường được
thực hiện để hỗ trợ việc chứng minh bằng chứng
nghiên cứu hoặc để cho phép tái tạo các kết quả khoa
học. Dữ liệu nghiên cứu ngày càng được coi là một
sản phẩm nghiên cứu có giá trị riêng và việc làm
thành dữ liệu mở là một con đường tốt để tạo ra
tác động và khả năng tái sử dụng lớn hơn.
Có nhiều
tùy chọn cấp phép cho dữ liệu mở, và người tạo ra
các tập dữ liệu có nhiều quyền tự do hơn trong việc
lựa chọn giấy phép phù hợp. Điều này là do các tập
dữ liệu có thể phức tạp: chúng có thể bao gồm tài
sản trí tuệ từ nhiều nguồn khác nhau và có thể phải
tuân theo nhiều hạn chế của bên thứ ba, ví dụ, liên
quan đến việc tái sử dụng cho mục đích thương mại.
Theo nguyên
tắc, bạn nên chọn tùy chọn giấy phép mở nhất, và
chỉ đưa ra các hạn chế khi những hạn chế này được
biện minh bởi bản chất của tài liệu hoặc bởi bất
kỳ yêu cầu nào của bên thứ ba. (Ví dụ, nếu một tập
dữ liệu là sản phẩm của nghiên cứu được thực hiện
với một đối tác thương mại, đối tác đó có thể
yêu cầu phát hành tập dữ liệu theo giấy phép phi thương
mại để bảo vệ đặc quyền thương mại của họ.)
Theo
Định nghĩa Mở (Open
Definition),
dữ liệu mở 'có thể được bất kỳ ai tự do sử dụng,
sửa đổi và chia sẻ vì bất kỳ mục đích nào'.
Nhưng chỉ riêng sự cho phép thôi là
chưa đủ nếu không có phương tiện để tìm kiếm, truy
cập và sử dụng dữ liệu. Dữ liệu mở cũng phải
đáp ứng các điều kiện sau:
được
xác định rõ ràng và được ghi chép chính thức trong hồ
sơ công khai trên trực tuyến, để có thể trích dẫn và
tìm thấy một cách chính xác chúng;
có thể
truy cập được, để có thể mở, đọc và xử lý
chúng;
được
trình bày và ghi chép theo cách dễ hiểu và dễ sử dụng
chúng.
Những điều
kiện về khả năng sử dụng này được thể hiện trong
Nguyên tắc Dữ liệu FAIR (FAIR
Data Principles), theo đó dữ liệu phải có thể Tìm
thấy được, Truy cập được, Tương hợp được và Tái
sử dụng được (Findable, Accessible, Interoperable,
Re-usable). Nguyên tắc FAIR lần đầu tiên được một nhóm
các bên liên quan từ giới học thuật, công nghiệp, các
cơ quan tài trợ và các nhà xuất bản học thuật đưa ra
vào năm 2016. Các Nguyên tắc này đặc biệt nhấn mạnh
khả năng của máy móc trong việc tự động tìm kiếm và
sử dụng dữ liệu và/hoặc siêu dữ liệu liên quan,
ngoài việc hỗ trợ các cá nhân tái sử dụng. Dữ liệu
FAIR không nhất thiết phải là dữ liệu mở, và có thể
có những lý do chính đáng khiến chúng không thể là dữ
liệu mở (pháp lý, đạo đức, thương mại). Trong những
trường hợp như vậy, FAIR vẫn hỗ trợ tái sử dụng.
Tìm thấy
được và Truy cập được (Findable and Accessible)
FAIR có
nghĩa là gì trong thực tế? Chúng ta hãy xem xét các Nguyên
tắc FAIR một cách chi tiết hơn. Khá phổ biến đối với
các bài báo báo cáo kết quả dựa trên việc thu thập và
phân tích dữ liệu sơ bộ là nói rằng: "Dữ liệu
hỗ trợ cho những phát hiện này có thể được cung cấp
theo yêu cầu". Quyền truy cập dữ liệu đã được
cho phép, nhưng liệu chúng có thể tìm thấy và truy cập
được không?
Dữ liệu
không có trong hồ sơ công khai - không có mô tả rõ ràng
về dữ liệu hoặc trích dẫn chính thức, vì vậy tập
dữ liệu không thể được xác định chính xác. Sự tồn
tại của dữ liệu không được xác minh độc lập, và
không có gì đảm bảo rằng chúng và thông tin về chúng
sẽ tiếp tục tồn tại và có sẵn. Việc truy cập dữ
liệu phụ thuộc vào việc người yêu cầu có thể tìm
thấy tác giả (người có thể đã chuyển đi, nghỉ hưu
hoặc qua đời), vào việc tác giả sẵn lòng cung cấp dữ
liệu kịp thời, vào việc tác giả có thể đối chiếu
dữ liệu được cung cấp với dữ liệu đã được mô
tả trước đó và hiện đang được yêu cầu, và vào
việc tác giả có thể truy xuất dữ liệu và dữ liệu
đó không bị hư hỏng. Với chuỗi phụ thuộc này, xác
suất dữ liệu trở nên không thể tìm thấy và không thể
truy cập được sẽ tăng dần theo thời gian. Một nghiên
cứu được công bố năm 2014 cho thấy tỷ lệ truy cập
được dữ liệu liên quan đến các nghiên cứu đã công
bố giảm 17% mỗi năm, với địa chỉ email không hợp lệ
và thiết bị lưu trữ lỗi thời là nguyên nhân chính gây
ra lỗi truy cập.
Để dữ
liệu có thể Tìm thấy và Truy cập được, cần phải
công bố đầy đủ thông tin để có thể xác định, định
vị và truy cập chúng một cách rõ ràng; thông tin này, và
bản thân các tập dữ liệu, cần phải được duy trì
theo thời gian; và phương thức cung cấp quyền truy cập
cần được quản lý về mặt tổ chức và được xác
định theo quy trình thủ tục, để chúng không bị phụ
thuộc vào một điểm lỗi duy nhất.
Tương
hợp được (Interoperable)
Điều này
có nghĩa là thông tin về dữ liệu phải được công bố
ở định dạng máy đọc được, tức là dưới dạng bản
ghi siêu dữ liệu có cấu trúc trực tuyến sử dụng các
từ vựng hoặc bản thể học (ontologies) tiêu chuẩn để
ghi lại các phần tử siêu dữ liệu. Khả năng máy đọc
được nên mở rộng đến chính bản thân đối tượng
dữ liệu càng nhiều càng tốt. Điều này có thể bao gồm
việc lưu trữ dữ liệu ở các định dạng tệp mở và
có thể chỉnh sửa với việc mã hóa ngữ nghĩa, chứ
không phải các định dạng sở hữu độc quyền với
việc mã hóa không minh bạch hoặc không có ngữ nghĩa. Ví
dụ: dữ liệu đồ họa và bảng thường được cung cấp
dưới dạng thông tin bổ sung cùng với các bài báo tạp
chí ở định dạng PDF. Đây là định dạng gần như vô
dụng để lưu trữ dữ liệu định lượng có cấu trúc,
vì nó không cho phép dữ liệu được trích xuất, chỉnh
sửa và phân tích một cách dễ dàng.
Một ví dụ
khác: mặc dù các tệp Microsoft Excel có thể được mở
trong nhiều ứng dụng phần mềm và có thể được xuất
sang định dạng XML, nhưng việc định dạng và công thức
được nhúng có thể bị mất trong quá trình chuyển đổi.
Tốt hơn hết là nên bảo tồn dữ liệu ở các định
dạng mở, chẳng hạn như CSV cho dữ liệu dạng bảng, có
thể truy cập được phổ biến và không chứa các thành
phần được nhúng có thể không hoạt động trong một số
ứng dụng.
Tái sử
dụng được (Re-usable)
Ngay cả
khi giả sử một tệp dữ liệu có thể được truy xuất
và truy cập được về mặt kỹ thuật, nó vẫn có thể
không sử dụng được.
Hãy tưởng
tượng một bảng các giá trị, với các hàng dành cho
người tham gia nghiên cứu và các cột dành cho các biến
số. Người dùng có thể xác định rõ ràng biến số từ
tiêu đề cột không? Đơn vị đo lường có được chỉ
định không? Các giá trị thiếu được ghi lại như thế
nào? Các giá trị đã được làm tròn lên hay được tính
trung bình từ nhiều phép đo? Đây có phải là tất cả
dữ liệu hay các bất thường và ngoại lệ đã được
loại bỏ, và nếu vậy, theo tiêu chí nào? Các giao thức
nào đã được tuân theo để thu thập dữ liệu? Những
công cụ nào đã được sử dụng? Những biến ngữ cảnh
bổ sung nào có thể liên quan? (ví dụ: dữ liệu được
thu thập ở đâu? vào thời điểm nào trong năm? thời
gian trong ngày? thời tiết? đối tượng nghiên cứu còn
được nuôi hay là không?) Dữ liệu được thu thập để
trả lời câu hỏi nghiên cứu nào và dữ liệu đã được
phân tích như thế nào?
Chúng ta có
thể thấy rằng xung quanh dữ liệu thô là nhiều cấp độ
thông tin khác nhau, điều này cho phép bạn và những người
dùng khác hiểu dữ liệu theo nhiều cách khác nhau. Đối
với bạn, phần lớn thông tin này sẽ là ngầm định và
có thể không cần phải ghi lại, nhưng đối với người
dùng khác, những người không có kinh nghiệm về bối
cảnh hoặc phương pháp nghiên cứu, thông tin cần phải
được làm rõ.
Do đó, dữ
liệu phải được cung cấp đầy đủ thông tin và tài
liệu hỗ trợ để có thể hiểu và sử dụng được.
Để là mở
và tuân thủ nguyên tắc FAIR, dữ liệu nên được lưu
trữ trong một kho dữ liệu. Đây là một dịch vụ tồn
tại để bảo tồn và cung cấp quyền truy cập tới dữ
liệu nghiên cứu. Kho dữ liệu là một phương tiện đảm
bảo tính bền vững trong tương lai, giúp đảm bảo dữ
liệu vẫn có thể truy cập và sử dụng được trong thời
gian dài. Nó được ưu tiên hơn so với việc chia sẻ dữ
liệu dưới dạng các tệp bổ sung cùng với một bài báo
đã xuất bản, hoặc thông qua các dịch vụ lưu trữ tệp
dựa trên đám mây, hoặc duy trì dữ liệu trong bộ nhớ
riêng và chỉ chia sẻ theo yêu cầu.
Không nên
nhầm lẫn kho dữ liệu (data repository) với các dịch vụ
dựa trên đám mây cung cấp lưu trữ và chia sẻ tệp,
chẳng hạn như Google Drive hoặc Open Science Framework. Kho dữ
liệu thực hiện một số chức năng cụ thể:
Nó chủ
động bảo tồn dữ liệu, ví dụ: sao chép và xác thực
các tập dữ liệu, chuyển đổi sang các định dạng lưu
trữ;
Công
bố siêu dữ liệu để cho phép tìm kiếm trực tuyến;
Gán mã
định danh thường trực duy nhất (persistent unique
identifier) (ví dụ: DOI) cho các tập dữ liệu và làm cho
chúng có thể trích dẫn được;
Nó
kiểm soát chất lượng các tập dữ liệu và cải thiện
siêu dữ liệu, ví dụ: bằng cách áp dụng các từ vựng
chuẩn (không phải tất cả các kho lưu trữ đều làm
vậy);
Nó
quản lý quyền truy cập dữ liệu để người khác có
thể sử dụng;
Nó áp
dụng các thông báo cấp phép, để làm rõ các điều
khoản sử dụng và yêu cầu ghi công.
Ví dụ về
các kho lưu trữ dữ liệu bao gồm: các trung tâm dữ liệu
chuyên ngành và các cơ sở dữ liệu thành phần của
chúng, chẳng hạn như các
trung tâm dữ liệu NERC và các cơ sở dữ liệu của
Viện Tin sinh học Châu Âu;
các kho lưu trữ dữ liệu của các tổ chức; và các dịch
vụ chia sẻ dữ liệu đa năng, chẳng hạn như Zenodo
và figshare.
Khi dữ
liệu được thu thập từ các tổ chức thương mại, hoặc
khi nghiên cứu được thực hiện hợp tác với các công
ty, người ta có thể cho rằng dữ liệu không thể được
chia sẻ. Điều này không nhất thiết đúng.
Không phải
tất cả thông tin do các tổ chức thương mại cung cấp
đều là thông tin bí mật thương mại, và các công ty có
thể sẵn sàng cho phép dữ liệu do họ cung cấp được
làm thành sẵn sàng mở - với việc biên tập lại nếu
cần thiết.
Việc xuất
bản mở dữ liệu không nhất thiết là kẻ thù của các
mục tiêu thương mại, và trên thực tế có thể thúc đẩy
chúng. Các tập đoàn mà mở dữ liệu của họ ra, và có
liên kết với các tổ chức nghiên cứu uy tín, sẽ thu
được lợi ích về danh tiếng. Việc mở ra có thể là
một chiến lược có giá trị để xây dựng lòng tin và
là nền tảng cho sự cộng tác lâu dài. Nhiều doanh nghiệp
thương mại thành công dựa trên mô
hình kinh doanh Phần mềm Nguồn mở. Trong một số lĩnh
vực - ví dụ như ngành dược phẩm - tiềm
năng chuyển đổi của Nghiên cứu Mở đã và đang
được tích cực thảo luận và khám phá.
Việc hạn
chế quyền truy cập dữ liệu là chấp nhận được nếu
chúng là thông tin bí mật thương mại hoặc có hướng đi
thương mại cho nghiên cứu, ví dụ như liên quan đến một
đối tác công nghiệp đã được xác định. Nếu cần
bảo hộ sở hữu trí tuệ, cần phải cho phép công bố
dữ liệu sau khi việc bảo hộ được xác nhận.
Một số
tập dữ liệu có thể tự thân là kết quả nghiên cứu
có giá trị. Ví dụ, điều này có thể xảy ra với các
quan sát môi trường hoặc dữ liệu khảo sát, vốn dĩ là
độc nhất và không thể thay thế.
Nếu bạn
đã tạo ra một tập dữ liệu mở có giá trị trong quá
trình làm việc, bạn có thể quảng bá rộng rãi tập dữ
liệu đó và nhận được sự ghi nhận học thuật với
tư cách là người tạo ra nó bằng cách xuất bản một
bài báo dữ liệu. Đây là một bài báo được đánh giá
ngang hàng, được xuất bản trong một tạp chí học
thuật, mô tả một tập dữ liệu được tạo ra trong bối
cảnh nghiên cứu.
Một bài
báo dữ liệu có thể là một phương tiện hiệu quả để
quảng bá một tập dữ liệu có giá trị và khuyến khích
người khác sử dụng và trích dẫn nó. Một bài báo dữ
liệu cũng là một kết quả có thể trích dẫn được,
và là một phương tiện để đảm bảo rằng sự ghi nhận
thích đáng được dành cho những người tham gia tạo ra
tập dữ liệu đó. Một bài báo dữ liệu cũng có thể
cung cấp cho người dùng tiềm năng của dữ liệu đó
thông tin có giá trị về cách thức và lý do tại sao tập
dữ liệu được tạo ra, cách nó đã được sử dụng và
cách nó có thể được sử dụng hoặc phát triển hơn
nữa.
Cần
lưu ý rằng mục đích chính của bài báo dữ liệu là
thúc đẩy việc tái sử dụng, và nhiều tạp chí sẽ yêu
cầu tập dữ liệu được mô tả phải được cung cấp
theo giấy phép mở. Một số hạn
chế của giấy phép tiêu chuẩn, chẳng hạn như điều
khoản sử dụng phi thương mại, có thể không được
chấp nhận.
Một ví dụ
về bài báo phần mềm được các thành viên của trường
đại học xuất bản được cung cấp bên dưới.
Có nhiều
tạp chí sẽ xuất bản các bài báo dữ liệu, bao gồm
các tạp chí chuyên về dữ liệu và các tạp chí "hỗn
hợp", sẽ xuất bản cả bài báo dữ liệu và các
bài báo nghiên cứu thông thường.
Ví dụ về
các tạp chí chuyên về dữ liệu là: Data
in Brief, Earth
System Science Data, Journal
of Open Archaeology Data, Nature
Scientific Data, Open
Health Data và Polar Data
Journal.
Đây là ví
dụ về các tạp chí/nền tảng cũng sẽ xuất bản các
bài báo về dữ liệu: F1000Research,
GigaScience, PLOS
ONE và Wellcome
Open Research.
Đánh
giá ngang hàng mở (Open Peer Review)
Theo truyền
thống, đánh giá ngang hàng đối với các kết quả đầu
ra nghiên cứu hoạt động theo mô hình đóng kín, trong đó
tác giả của sản phẩm không biết danh tính của người
đánh giá. Điều này được gọi là đánh giá ngang hàng
"mù" (blind) hoặc đóng kín (closed). Có các biến
thể của mô hình này - đánh giá ngang hàng mù đôi
(double blind peer review) là khi danh tính của tác giả được
giấu kín với người đánh giá và danh tính của người
đánh giá được giấu kín với tác giả. Trên thực tế,
do lĩnh vực nghiên cứu hẹp của một số nhà nghiên cứu,
cả người đánh giá và tác giả thường có thể đoán
được danh tính của nhau.
Ưu
điểm của mô hình truyền thống
|
Nhược
điểm của mô hình truyền thống
|
Người
đánh giá có thể cởi mở và thẳng thắn trong bài
đánh giá của họ.
|
Người
đánh giá có thể thô lỗ và tiêu cực trong nhận xét
về kết quả đầu ra vì họ sẽ không bị/được tiết
lộ danh tính cho tác giả.
|
Đánh
giá ngang hàng mù đôi có thể giảm thiểu sự thiên vị
của người đánh giá
|
Người
đánh giá có thể có sự thiên vị
|
Các
nhà nghiên cứu trẻ có thể bình luận ẩn danh về
công trình của các nhà nghiên cứu có kinh nghiệm hơn
mà không sợ bị trả đũa.
|
Người
đánh giá có thể cố tình trì hoãn việc xuất bản
nếu công trình đang được xem xét có thể vượt mặt
công trình của họ.
|
|
Người
đánh giá có thể bị ảnh hưởng bởi vị thế của
tác giả trong cộng đồng.
|
Để làm
cho quá trình đánh giá ngang hàng công bằng hơn, minh bạch
hơn và ít bị thiên vị hơn, nhiều mô hình đánh giá
ngang hàng mở đã được phát triển. Trong một số trường
hợp, danh tính của người bình duyệt chỉ được tiết
lộ khi quyết định về kết quả nghiên cứu đã được
đưa ra. Trong những trường hợp khác, danh tính của người
bình duyệt và nội dung bài đánh giá được công bố
cùng với bài báo cuối cùng đã được xuất bản để
người đọc có thể tự đánh giá chất lượng, tính
chặt chẽ và tính công bằng của bài đánh giá. Có rất
nhiều biến thể của mô hình đánh giá ngang hàng mở;
Một nghiên cứu năm 2017 đã xác định 22 sự kết hợp
khác nhau của 7 yếu tố cơ bản của đánh giá ngang hàng
mở:
Minh
bạch về danh tính của người đánh giá và/hoặc tác
giả
Công
bố nội dung của các bài đánh giá ngang hàng (đôi khi
được kết hợp hoặc chỉnh sửa)
Mở
rộng đánh giá ngang hàng cho cộng đồng độc giả quan
tâm rộng lớn hơn
Cho
phép tương tác giữa tác giả, biên tập viên và người
đánh giá để làm cho đánh giá ngang hàng mang tính cộng
tác và xây dựng hơn
Đánh
giá ngang hàng mở trước khi xuất bản bằng cách sử
dụng bản thảo trước khi xuất bản (preprints)
Cho
phép bình luận sau khi xuất bản để độc giả có thể
đưa ra nhận xét và tác giả/độc giả khác có thể
phản hồi
Một
số nền tảng cho phép xuất bản trước khi đánh giá
ngang hàng
Ưu điểm của mô hình
mở
|
Nhược điểm của mô
hình mở
|
Xung đột lợi ích sẽ
dễ dàng nhận thấy đối với cả tác giả và độc
giả.
|
Người đánh giá có
thể không quá khắt khe hoặc nghiêm túc vì nhận xét
của họ sẽ được mọi người nhìn thấy.
|
Độc giả có thể thấy
sự tiến bộ của tác phẩm thông qua đánh giá ngang
hàng bằng cách đọc nhận xét của người đánh giá
và phản hồi của tác giả.
|
Các nhà nghiên cứu trẻ
có thể lo sợ bị trả đũa nếu họ đưa ra đánh giá
không thuận lợi cho một nhà nghiên cứu có thâm
niên/có ảnh hưởng hơn.
|
Người đánh giá phải
chịu trách nhiệm nhiều hơn về những bình luận của
họ.
|
Một số nhà nghiên cứu
sẽ từ chối lời mời đánh giá công khai vì họ không
muốn ý kiến hoặc danh tính của mình bị công khai.
|
Những đánh giá thiên
vị hoặc không chính xác sẽ dễ dàng bị/được nhận
ra đối với người đọc và các tác giả của sản
phẩm nghiên cứu.
|
|
Các đánh giá mở có
thể được sử dụng làm tài liệu đào tạo cho thế
hệ người đánh giá ngang hàng tiếp theo – điều cần
thiết để duy trì chất lượng đánh giá ngang hàng
cao.
|
|
Giao tiếp trực tiếp
giữa tác giả và người đánh giá ngang hàng có thể
giảm thiểu sự nhầm lẫn hoặc hiểu lầm và dẫn đến
việc sửa đổi mang tính xây dựng và nhanh chóng hơn.
|
|
Người đánh giá có
thể nhận được tín nhiệm và sự công nhận cho những
đóng góp của họ vào quá trình đánh giá ngang hàng.
Nếu các bản đánh giá được công bố và được cấp
DOI, chúng có thể được thêm vào hồ sơ ORCID và sơ
yếu lý lịch.
|
|
Khả
năng tái tạo
Thảo luận
về "khủng hoảng khả năng tái tạo" trong nghiên
cứu khoa học đã làm nổi bật tỷ lệ thất bại cao
trong việc tái tạo kết quả của các nghiên cứu đã
được công bố. Một cuộc
khảo sát các nhà nghiên cứu được công bố trên tạp
chí Nature năm 2016 cho
thấy hơn 70% nhà nghiên cứu đã cố gắng và thất bại
trong việc tái tạo thí nghiệm của một nhà khoa học
khác, và hơn một nửa đã thất bại trong việc tái tạo
thí nghiệm của chính họ. Nghiên
cứu mà kết quả không thể tái tạo được là không
đáng tin cậy và lãng phí. Năm
2015, người ta ước tính rằng nghiên
cứu sinh học không thể tái tạo gây thiệt hại 28 tỷ
đô la Mỹ mỗi năm.
Nhiều lý
do đã được đưa ra cho tỷ lệ tái tạo thấp, bao gồm
việc báo cáo phương pháp nghiên cứu kém, điểm yếu
trong thiết kế nghiên cứu và phân tích thống kê, và
việc không cung cấp quyền truy cập vào dữ liệu và mã
phần mềm hỗ trợ các kết quả đã được công bố.
Các
nhà phê bình cũng cáo buộc những thiếu sót cơ bản
trong hệ thống khen thưởng học thuật, vốn quá coi trọng
việc công bố nhanh chóng các kết quả mới trên các tạp
chí có ảnh hưởng cao, và thiếu các tiêu chuẩn tái tạo
nghiêm ngặt, được áp dụng một cách có hệ thống.
Các nhà nghiên cứu được khuyến khích đi theo con đường
ngắn nhất để công bố, báo cáo quá mức về ý nghĩa
và đánh giá thấp kết quả. Người ta lập luận rằng
nếu hệ thống khen thưởng đặt trọng tâm cao hơn vào
tính khả kiểm chứng, và nếu các nhà nghiên cứu có
động lực hơn để công khai các giả thuyết, phương
pháp và dữ liệu hỗ trợ các phát hiện khoa học, thì
họ sẽ có nhiều hơn khả năng tạo ra các nghiên cứu có
thể tái tạo và đáng tin cậy, và mức độ lãng phí
cũng như nguy cơ gian lận sẽ giảm.
Nhiều nhà
nghiên cứu trong các ngành khoa học thực nghiệm đang tích
cực thúc đẩy cải cách. Trong bản
tuyên ngôn về khoa học có thể tái tạo, một nhóm
các nhà nghiên cứu quan tâm đề xuất một loạt các biện
pháp mà các bên liên quan trong nghiên cứu khoa học, bao
gồm các nhà nghiên cứu, tổ chức nghiên cứu, nhà tài
trợ và nhà xuất bản, có thể thực hiện để cải
thiện hiệu quả nghiên cứu và tính vững chắc của các
phát hiện khoa học.
Khả năng
tái tạo bắt đầu từ việc lập kế hoạch. Việc viết
Kế hoạch Quản lý Dữ liệu - DMP (Data Management Plan) ngay
từ đầu dự án có thể giúp bạn tối đa hóa khả năng
tái tạo nghiên cứu của mình. Một số nhà tài trợ (bao
gồm hầu hết các Hội đồng Nghiên cứu, Ủy ban Châu
Âu, Hội Hoàng gia và Quỹ Wellcome Trust) sẽ yêu cầu các
nhà nghiên cứu nộp DMP như một phần của đơn xin tài
trợ. Ưu điểm của việc viết DMP là:
Nó
giúp bạn lập kế hoạch quản lý dữ liệu bạn thu thập
hoặc tạo ra trong suốt quá trình dự án và về lâu dài,
đồng thời xác định sớm các yêu cầu cần được
giải quyết, ví dụ như cần phải có được sự đồng
thuận để chia sẻ dữ liệu;
Khi dữ
liệu được quản lý trong một nhóm nghiên cứu hoặc
trong một quan hệ đối tác, nó giúp ghi lại vai trò và
trách nhiệm, để dữ liệu được quản lý hiệu quả
và nhất quán theo các tiêu chuẩn đã thỏa thuận;
Trong
các hoạt động nghiên cứu cộng tác, nó có thể giúp
thiết lập quyền sở hữu trí tuệ và quyền sở hữu
dữ liệu, cũng như cho phép những người khác sử dụng
dữ liệu, để tránh nhầm lẫn hoặc bất đồng về
quyền sở hữu và sử dụng dữ liệu;
Nó cho
phép bạn xác định chi phí của các hoạt động quản
lý dữ liệu, điều bạn có thể được chi trả thông
qua khoản tài trợ của mình.
Trong một
số lĩnh vực nghiên cứu, đặc biệt là trong khoa học
sức khỏe và tâm lý, các thực hành đang được thiết
lập để đăng ký giả thuyết
và giao thức nghiên cứu trước khi tiến hành nghiên
cứu. Lý do cho việc này là để đảm bảo tính minh bạch
về các phương pháp nghiên cứu được sử dụng, và để
loại bỏ những thực tiễn không tốt, chẳng hạn như
đưa ra giả thuyết sau khi đã biết kết quả (HARKing)
và lựa chọn kết quả một cách có chủ đích để "tạo
ra" hoặc phóng đại ý nghĩa. Việc đăng
ký thử nghiệm lâm sàng là bắt buộc ở nhiều quốc
gia, và ngày càng nhiều nhà nghiên cứu sử dụng các nền
tảng như Khung Khoa học Mở - OSF (Open
Science Framework) để đăng ký các đề cương nghiên
cứu.
Việc đăng
ký công khai các giả thuyết và đề cương nghiên cứu có
thể xác định thứ tự ưu tiên của một phương pháp
nghiên cứu và bảo vệ tính toàn vẹn của kết quả.
Nhiều mô hình để đưa việc đánh giá ngang hàng chính
thức các quy trình nghiên cứu vào các giai đoạn sớm hơn
của lộ trình nghiên cứu cũng đã xuất hiện. Điều này
có thể nâng cao chất lượng thiết kế nghiên cứu và độ
tin cậy/khả năng tái tạo của kết quả. Nó cũng cung
cấp một giải pháp cho hiện tượng thiên vị xuất bản
- trong đó quyết định công bố hoặc phổ biến nghiên
cứu dựa trên nhận thức về tầm quan trọng hoặc sự
quan tâm đến các kết quả. Một số nhà xuất bản hiện
nay cung cấp các tùy chọn báo cáo
được đăng ký, theo đó các nhà nghiên cứu có thể
gửi thiết kế nghiên cứu để được đánh giá ngang
hàng và khi được chấp nhận sẽ nhận được cam kết
từ tạp chí về việc xuất bản các kết quả cuối
cùng.
Để minh
bạch và có thể tái tạo, các phát hiện nghiên cứu đã
được công bố phải được dữ liệu và mã nguồn có
thể truy cập mở hỗ trợ. Các tài liệu hỗ trợ nên
được bảo quản và cung cấp bằng cách sử dụng các
kho lưu trữ phù hợp, và được tham chiếu từ các ấn
phẩm liên quan bằng cách sử dụng một trích dẫn DOI.
Cộng
tác mở (Open Collaboration)
Các công
cụ nghiên cứu và điện toán trực tuyến cho phép nhà
nghiên cứu cung cấp quyền truy cập trực tiếp cho công
chúng vào quy trình nghiên cứu. Các trang web, wiki và blog,
môi trường nghiên cứu trực tuyến và nền tảng khoa học
công dân đều có thể được sử dụng theo nhiều cách
khác nhau để ghi lại và công bố các quy trình và tài
liệu chính của nghiên cứu, đồng thời cho phép sự tham
gia trực tiếp vào các hoạt động nghiên cứu của nhiều
nhóm người dùng hơn.
Nhiều công
cụ trong số này tạo ra khả năng cho một loại hình
nghiên cứu mới, mở rộng vượt ra ngoài một nhóm đóng
kín đến công chúng rộng lớn hơn, và cho phép quy trình
nghiên cứu mang tính đồng sáng tạo, cộng tác quy mô lớn
và phát triển dựa trên phản hồi mang tính xây dựng.
Mô hình cơ
bản của nghiên cứu cộng tác mở trực tuyến có thể
áp dụng cho tất cả các lĩnh vực nghiên cứu, không chỉ
riêng khoa học. Có thể có nhiều công cụ chuyên biệt
hơn dành cho các nhà khoa học thực nghiệm, nhưng các nền
tảng như Zooniverse và các công cụ cộng tác cũng có thể
hiệu quả không kém trong các lĩnh vực nghệ thuật và
nhân văn hoặc nghiên cứu khoa học xã hội.
Ở dạng
cơ bản và phổ quát nhất, cộng tác mở trực tuyến
được xây dựng xung quanh các nền tảng trực tuyến
chung như blog và wiki, cho phép công chúng truy cập và tham
gia vào nghiên cứu.
Một trong
những ví dụ nền tảng là Dự
án Polymath do nhà toán học Tim Gowers của Đại học
Cambridge khởi xướng năm 2009, một ứng dụng dựa trên
blog theo nguyên tắc nguồn đám đông (crowdsourcing) cho việc
giải quyết các vấn đề toán học, chứng minh rằng các
vấn đề có thể được giải quyết nhanh chóng và hiệu
quả hơn nhiều nếu chúng được công bố và xử lý trực
tuyến, với nhiều người đóng góp mang đến những mảnh
ghép riêng của họ và cùng nhau hoàn thiện bức tranh.
Cách tiếp cận này để giải quyết các vấn đề khoa
học được thảo luận trong bài thuyết trình TEDx của
Michael Nielsen, "Khoa học Mở ngay bây giờ!" (Open
science now!).
Trang web,
blog và wiki tiếp tục là những công cụ mạnh mẽ để
thu hút các đối tượng và lôi kéo mọi người tham gia
nghiên cứu. Chúng rất phù hợp để quản lý các tương
tác đơn giản. Nhưng chúng không được xây dựng chuyên
dụng để hỗ trợ các quy trình nghiên cứu và có một
số hạn chế:
Chúng
có thể không đủ năng động hoặc linh hoạt để quản
lý quy trình nghiên cứu và các tương tác cộng tác phức
tạp giữa nhiều người tham gia;
Chúng
có thể thiếu tính năng kiểm soát phiên bản, khôi phục
trạng thái trước đó và xuất thông tin, gây khó khăn
trong việc lưu giữ hồ sơ quá trình nghiên cứu, điều
này có thể rất cần thiết cho việc xác thực và sao
chép kết quả;
Chúng
có thể thiếu các tính năng quan trọng như lưu trữ tài
liệu tập trung, chức năng quản lý nội dung và kiểm
soát truy cập, có nghĩa là chúng phải được sử dụng
kết hợp với các dịch vụ khác để cung cấp các thành
phần thiết yếu.
Khái niệm
khoa học sổ ghi chép mở (Open Notebook Science) được nhà
hóa học Jean-Claude Bradley giới thiệu vào năm 2006. Nó
liên quan rõ ràng đến mô hình Phần mềm Nguồn Mở (Open
Source Software) và được định nghĩa bởi sự tồn tại
của 'một URL đến sổ ghi chép của phòng thí nghiệm
được cung cấp miễn phí và được lập chỉ mục trên
các công cụ tìm kiếm phổ biến. Nó không nhất thiết
phải trông giống như một cuốn sổ ghi chép giấy nhưng
điều cần thiết là tất cả thông tin khả dụng mà các
nhà nghiên cứu có để đưa ra kết luận của họ đều
có sẵn cho toàn thế giới.'
Có rất
nhiều loại Sổ ghi chép phòng thí nghiệm điện tử - ELN
(Electronic Lab Notebook) khác nhau, từ các công cụ chung đến
những công cụ được thiết kế để hoạt động với
các loại thí nghiệm, thiết bị khoa học hoặc loại dữ
liệu cụ thể. Một số ELN này sẽ yêu cầu cài đặt
và/hoặc quản lý cục bộ, và có thể được cung cấp
dưới dạng sản phẩm miễn phí/nguồn mở hoặc dịch vụ
đăng ký, nhưng có một số dịch vụ hoàn toàn dựa trên
web và miễn phí cho người dùng cá nhân hoặc nhóm. Viện
Gurdon tại Đại học Cambridge cung cấp một cái
nhìn tổng quan tuyệt vời về các sản phẩm này.
Không giống
như sổ ghi chép thí nghiệm bằng giấy, ELN có thể được
sử dụng để làm cho tài liệu thí nghiệm thành truy cập
mở ở định dạng có cấu trúc và dễ sử dụng, hoặc
bằng cách xuất sang các định dạng tài liệu hoặc,
trong trường hợp một số dịch vụ trực tuyến, bằng
cách cung cấp quyền truy cập công khai trực tiếp. Hầu
hết các ELN được thiết kế dựa trên mô hình nhóm
nghiên cứu hoặc nhóm dự án khép kín, và do đó có thể
không cung cấp quy trình làm việc hiệu quả để làm cho
thông tin thành truy cập công khai hoặc cho phép cộng tác
mở. Ví dụ, ELN RSpace
cho phép chia sẻ tài liệu hoặc sổ ghi chép với các
thành viên của nhóm thí nghiệm và người dùng RSpace
khác, nhưng không cung cấp quyền truy cập cộng tác mở.
Nó tích hợp với nhiều dịch vụ lưu trữ đám mây phổ
biến như Dropbox và OneDrive, và với công cụ cộng tác
trực tuyến Slack,
nhưng không cho phép chia sẻ toàn bộ dự án như Open
Science Framework.
Công cụ
giao thức cộng tác protocols.io
áp dụng mô hình kiểm soát phiên bản của nền tảng kho
lưu trữ mã nguồn như GitHub cho giao thức thí nghiệm. Các
giao thức có thể được phát triển cộng tác trong một
nhóm đóng kín, sau đó được phát hành dưới dạng các
phiên bản công khai, được gán DOI để có thể trích dẫn
từ các ấn phẩm liên quan. Các phiên bản công khai có
thể được bình luận trực tiếp, nhưng cũng có thể
được rẽ nhánh (forked) (tức là tạo ra bản sao) và sửa
đổi, cho phép phát triển và tinh chỉnh các thí nghiệm
một cách lặp đi lặp lại và có kiểm soát phiên bản.
Khung Khoa
học Mở - OSF (Open Science Framework)
là một nền tảng quản lý nghiên cứu vòng đời đầy
đủ, được Trung tâm Khoa học Mở (Center
for Open Science), một tổ chức phi lợi nhuận điều
hành. Nền tảng này cung cấp:
Kho lưu
trữ tài liệu tập trung với tính năng chia sẻ tệp và
kiểm soát phiên bản;
Tích
hợp với Box, Dropbox, GoogleDrive và Amazon Web Services để
lưu trữ và tính toán trên đám mây, với GitHub để quản
lý mã nguồn, với figshare và Dataverse cho kho dữ liệu,
và với Mendeley để quản lý tài liệu tham khảo;
Chức
năng đăng ký trước để công bố các thiết kế nghiên
cứu có dấu thời gian;
Máy
chủ bản thảo trước xuất bản (preprint server) để
truyền đạt kết quả nhanh chóng.
OSF đã
khẳng định vị thế là một nền tảng phổ biến, đặc
biệt trong lĩnh vực sức khỏe, khoa học xã hội và hành
vi. Điều này là do cả tính khả dụng của nó như một
môi trường nghiên cứu toàn diện, và vai trò của Trung
tâm Khoa học Mở (COS) với tư cách là người tiên phong
trong Nghiên cứu Mở, đặc biệt thông qua các can thiệp
nổi bật như Dự án
Khả năng Tái tạo do người sáng lập COS, Brian Nosek
và các đồng nghiệp thực hiện, và thông qua việc phát
triển và ủng hộ các giải pháp cho khoa học hiệu quả
và có thể tái tạo hơn, bao gồm đăng
ký trước nghiên cứu và mô hình xuất bản báo
cáo đã đăng ký.
Khoa học
công dân được
định nghĩa trong Từ điển Tiếng Anh Oxford - OED
(Oxford English Dictionary) là "công việc khoa học được
các thành viên của công chúng thực hiện, thường là
cộng tác với hoặc dưới sự chỉ đạo của các nhà
khoa học và các tổ chức khoa học chuyên nghiệp".
Không có lý do gì để mô hình nghiên cứu này bị giới
hạn trong khoa học, mặc dù đây là lĩnh vực mà nó được
thiết lập vững chắc nhất. Chúng ta có thể mở rộng
định nghĩa của mình để bao gồm tất cả các ngành và
nói về nghiên cứu công dân hoặc học thuật công dân.
Việc sử
dụng các công nghệ trực tuyến để hỗ trợ các dự án
khoa học công dân và có sự tham gia của cộng đồng cũng
ngày càng tăng, chẳng hạn như các dự án do Zooniverse
tổ chức, nơi các dự án có lượng dữ liệu lớn cần
phân tích của con người có thể tận dụng sức mạnh xử
lý của cộng đồng trực tuyến. Mô hình nghiên cứu này
đặc biệt phù hợp với các dự án yêu cầu phân tích
cơ bản hoặc xử lý lượng lớn dữ liệu mà máy tính
không thể thực hiện được, ví dụ như xác định các
đặc điểm hoặc mẫu trong hình ảnh, hoặc chuyển đổi
hình ảnh của văn bản viết tay thành văn bản.
Các dự án
khoa học công dân trực tuyến có thể tạo điều kiện
thuận lợi cho khả năng tái tạo, mở ra những hướng
nghiên cứu mới và dẫn đến những hiểu biết mới.
Nguyên tắc "trí tuệ tập thể" có thể được
sử dụng để giảm thiểu sai sót của con người bằng
cách lấy giá trị trung bình và loại bỏ các giá trị
ngoại lệ bất thường. Các nhà khoa học công dân có thể
xác định các đặc điểm mới trong dữ liệu, hoặc được
truyền cảm hứng để đặt ra những câu hỏi mới và
hình thành những cách giải quyết vấn đề mới.
Văn hóa
Nghiên cứu Mở (Open Research Culture)
Mọi người,
từ sinh viên đến giáo sư, đều có thể đóng vai trò
trong việc thúc đẩy sự phát triển của văn hóa Nghiên
cứu Mở. Bạn có thể giúp thiết lập các chuẩn mực
thực hành tốt nhất bằng cách thể hiện chúng trong hành
vi của chính mình. Bạn có thể ảnh hưởng đến đồng
nghiệp, sinh viên và mạng lưới rộng lớn hơn của những
người cùng ngành. Bạn có thể lên tiếng ủng hộ các
tiêu chuẩn cao nhất của Nghiên cứu Mở.
Nếu
bạn là thành viên của một nhóm dự án hoặc nhóm
nghiên cứu, hãy bắt đầu (một cách lịch sự) đặt
câu hỏi: Chính sách của chúng ta về chia sẻ dữ liệu
là gì? Dự án của chúng ta có Kế hoạch Quản lý Dữ
liệu (DMP) không? Chúng ta quản lý và chia sẻ mã nguồn
như thế nào? Chúng ta có thể công bố kết quả nghiên
cứu dưới dạng bản thảo trước khi xuất bản không?
Chúng ta có thể đăng ký trước thiết kế nghiên cứu
hoặc gửi nó đến một tạp chí dưới dạng báo cáo đã
đăng ký không? Có lẽ bạn có thể đưa ra thảo luận
tại cuộc họp nhóm.
Nếu
bạn chịu trách nhiệm giảng dạy, hãy giới thiệu cho
sinh viên của mình – cả sinh viên đại học và sau đại
học – về các khái niệm và thực hành của Nghiên cứu
Mở. Ví dụ: giải thích tại sao Truy cập Mở (Open
Access), chia sẻ dữ liệu và mã nguồn lại quan trọng;
sử dụng dữ liệu mở trong giảng dạy và bài tập; yêu
cầu sinh viên thực hiện các dự án thí nghiệm đăng ký
trước giả thuyết và thiết kế nghiên cứu của họ;
dạy về khả năng tái tạo bằng cách giao bài tập sao
chép một nghiên cứu đã được công bố; hướng dẫn
sinh viên học lập trình thiết lập kho lưu trữ mã nguồn
trực tuyến trên GitHub; thành
lập câu lạc bộ bản thảo trước xuất bản (preprints)
và thực hiện bài tập đánh giá ngang hàng mở.
Sử
dụng mạng xã hội và các kênh truyền thông nghiên cứu
khác để công khai các kết quả nghiên cứu mở của bạn
và thảo luận về các vấn đề Nghiên cứu Mở. Đừng
chỉ đăng bài báo của bạn trên Twitter - hãy đăng cả
bộ dữ liệu mở và mã nguồn mở của bạn. Bắt đầu
hoặc đóng góp vào một cuộc thảo luận trong mạng lưới
của bạn về các vấn đề Nghiên cứu Mở.
Khi bạn
đọc một bài báo, hãy kiểm tra tuyên
bố về quyền truy cập dữ liệu/tính khả dụng của dữ
liệu: dữ liệu và mã nguồn hỗ trợ đã được
chia sẻ chưa? Nếu chưa, và dữ liệu hỗ trợ đó bạn
quan tâm, tại sao không (một cách lịch sự!) yêu cầu
tác giả tương ứng chia sẻ chúng với bạn; Hoặc, tốt
hơn nữa, hãy ký gửi lưu trữ chúng trong một kho lưu
trữ công cộng phù hợp? Hãy cho người khác biết rằng
việc chia sẻ dữ liệu và mã nguồn là một chuẩn mực
và được mong đợi.
Luôn
có cơ hội tham gia vào các dự án hoặc sáng kiến để
phát triển các tiêu chuẩn và công cụ mở hỗ trợ các
hoạt động thực hành mở trong lĩnh vực của bạn. Ví
dụ, bất kỳ ai cũng có thể tham gia Liên minh Dữ liệu
Nghiên cứu (Research
Data Alliance) và tham gia vào các nhóm quan tâm và nhóm
làm việc khác nhau để phát triển các tiêu chuẩn cộng
đồng cho dữ liệu và siêu dữ liệu trong các lĩnh vực
cụ thể.
Sử
dụng sự tham gia của bạn với các bên liên quan đến
nghiên cứu (chẳng hạn như các hội học thuật) để
thúc đẩy các hoạt động và chính sách Nghiên cứu Mở.
Nếu
bạn là thành viên ban biên tập của một tạp chí, hãy
xem xét đưa ra các vấn đề này để thảo luận nếu
các chính sách chưa được tranh luận hoặc thông qua:
Giới
thiệu chính sách về tính khả dụng của dữ liệu và
mã nguồn (xem ví dụ);
Giới
thiệu hệ thống nộp bài đánh giá ngang hàng mở và
chính sách thân thiện với bản thảo trước khi xuất
bản;
Cung
cấp tùy chọn báo cáo đã đăng
ký;
Chuyển
đổi tạp chí sang mô hình Truy cập Mở hoàn toàn,
nếu nó chỉ dành cho người đăng ký thuê bao hoặc là
Truy cập Mở lai (Hybrid Open Access).
Các tài
nguyên bổ sung
FORRT
cung cấp cơ sở hạ tầng sư phạm và nguồn tài liệu
giảng dạy được thiết kế để nhận biết và hỗ trợ
việc giảng dạy và hướng dẫn về khoa học mở và có
thể tái tạo.
Bộ
công cụ Khoa học Mở của UNESCO được thiết kế để
hỗ trợ việc thực hiện Khuyến nghị Khoa học Mở của
UNESCO. Bộ công cụ này là một tập hợp các hướng dẫn,
tóm tắt chính sách, bảng thông tin và chỉ mục.
Một
nguồn tài liệu trực tuyến miễn phí được thiết kế
để giúp trang bị cho sinh viên và nhà nghiên cứu những
kỹ năng cần thiết để thành công trong môi trường
nghiên cứu hiện đại. Đây là sản phẩm của sự cộng
tác quốc tế liên tục giữa hàng trăm nhà nghiên cứu và
chuyên gia thực hành, những người cam kết thúc đẩy sự
tiến bộ Nghiên cứu Mở.
Cổng
thông tin FOSTER là một nền tảng học tập điện tử tập
hợp các nguồn tài liệu đào tạo tốt nhất dành cho
những người cần tìm hiểu thêm về Khoa học Mở, hoặc
cần phát triển các chiến lược và kỹ năng để thực
hiện các hoạt động thực hành Khoa học Mở trong quy
trình làm việc hàng ngày của họ.
Một
khóa học trực tuyến mở đại chúng (MOOC) về Khoa học
Mở từ Đại học Kỹ thuật Delft (TU Delft), bao gồm các
nguyên tắc chung về khoa học mở, quản lý dữ liệu
nghiên cứu, xuất bản Truy cập Mở và sử dụng mạng xã
hội để tăng khả năng hiển thị của bạn.
Một
kho kiến thức toàn diện được thiết kế để phục vụ
như một nguồn tài liệu tham khảo và giới thiệu thực
hành, dễ hiểu cho các nhà khoa học mở mới vào nghề và
giàu kinh nghiệm.
---------------------------------------------------
Thừa nhận:
Nội
dung này được dịch từ tài liệu của các tác giả: Farrow, R. (ed.),
Weller, M., Pitt, R., Iniesto, F., Algers, A., Almousa, S., Baas, M.,
Bentley, P., Bozkurt, A., Butler, W., Cardoso, P., Chtena., N., Cox, G.,
Czerwonogora, A., Dabrowski, M.T., Derby, R., DeWaard, H., Elias, T.,
Essmiller, K., Funk, J., Hayman, J., Helton, E., Huth, K., Hutton, S.
C., Iyinolakan, O., Johnson, K. R., Jordan, K., Kuhn, C., Lambert, S.,
Mittelmeier, J., Nagashima, T., Nerantzi, C., O’Reilly, J., Paskevicius,
M., Peramunugamage, A., Pete, J., Power, V., Pulker, H., Rabin, E.,
Rets, I., Roberts, V., Rodés, V., Sousa, L., Spica, E., Vizgirda, V.,
Vladimirschi, V., & Witthaus, G. (2023). Sổ tay Nghiên cứu Mở của
GO-GN.
Mạng lưới Cao học Toàn cầu về Tài nguyên Giáo dục Mở / Trung tâm Nghiên cứu Giáo dục Mở.
https://go-gn.net/gogn_outputs/open-research-handbook/.
Giấy phép nội dung: CC BY 4.0 Quốc tế.
---------------------------------------------------
VỀ
TRANG MỤC LỤC
VỀ
TRANG CÁC TÀI NGUYÊN BỔ SUNG
---------------------------------------------------
Xem thêm: