Open
Source, Open Science, Open Source Science
26 October 2011, 16:05
by Glyn Moody
Theo:
http://www.h-online.com/open/features/Open-Source-Open-Science-Open-Source-Science-1365622.html
Bài được đưa lên
Internet ngày: 26/10/2011
Kỷ
nguyên số đã bổ sung thêm đáng kể các công cụ sẵn
sàng cho công việc khoa học, nhưng cũng đã đưa ra những
thách thức mới. Glyn Moody mô tả hiện trạng, và gợi ý
rằng chúng ta cần tính mở thực sự với sự tôn trọng
phần mềm khoa học.
The
digital age has added significantly to the tools available to
scientific work, but has also introduced new challenges. Glyn Moody
describes the present situation, and suggests that we need true
openness with respect to scientific software.
Lời
người dịch: Tính mở và sự chia sẻ nằm trong tim của
văn hóa khoa học, nó không phải là cách “Làm việc. Kết
thúc. Xuất bản”. Ngày nay, chúng ta cần cải cách văn
hóa khoa học, “bằng việc áp dụng 5 nguyên tắc sau: (1)
Mã nguồn: Tất cả mã nguồn được viết đặc
biệt cho dữ liệu qui trình đối với một tài liệu được
xuất bản phải sẵn sàng cho những người rà soát và
độc giả của tài liệu đó; (2) Bản quyền: Quyền
sở hữu và giấy phép bản quyền của bất kỳ mã nguồn
được tung ra nào cũng phải được tuyên bố một cách
rõ ràng; (3) Trích dẫn: Các nhà nghiên cứu mà sử
dụng hoặc thích nghi mã nguồn khoa học trong nghiên cứu
của họ phải công nhận những người tạo ra mã nguồn
trong các xuất bản phẩm kết quả; (4) Uy tín: Những
đóng góp cho phần mềm phải được đưa vào trong các hệ
thống đánh giá, uy tín, thừa nhận khoa học; (5) Bảo
hành bảo trì các tài sản số: Mã nguồn phải được
giữ cho sẵn sàng, được kết nối tới các tài liệu
liên quan, cho suốt vòng đời sử dụng của xuất bản
phẩm”.
Một trong những cảm
hứng chủ chốt cho phong trào phần mềm tự do từng là
truyền thống khoa học về chia sẻ thông tin và xây dựng
trên công việc của những người khác. Điều đó đã
nảy sinh vài trăm năm trước, ở thời điểm tiến bộ
khoa học nhanh:
Những tiến bộ
khoa học lớn vào thời của Hooke và Newton đã tạo động
lực cho những người bảo trợ lành mạnh như chính phủ
bắt đầu bao cấp cho khoa học như một nghề nghiệp.
Nhiều động lực tới từ lợi ích nhà nước được
phân bổ từ sự phát minh khoa học, và lợi ích đó từng
mạnh nhất nếu những phát minh được chia sẻ. Kết quả
là một văn hóa khoa học đối với ngày đó tưởng
thưởng cho sự chia sẻ những phát minh với các công việc
và uy tín đối với người phát minh.
Sự biến chuyển
văn hóa này chỉ bắt đầu trong thời kỳ của Hooke và
Newton, nhưng là ít qua một thế kỷ sau đó mà nhà vật
lý học Michael Faraday có thể khuyến cáo một đồng
nghiệp trẻ hơn hãy “Làm việc. Kết thúc. Xuất bản”.
Văn hóa khoa học này đã thay đổi sao cho một phát minh
mà không được xuất bản trong một tạp chí khoa học
thì chưa phải là hoàn tất được.
Chúng ta nắm lấy văn
hóa đó cho ngày hôm nay, giả dụ thế; và vâng, thật chớ
trêu, những khía cạnh cốt lõi của tính mở và chia sẻ
được cho là nằm trong tim của phương pháp khoa học đã
và đang bị xói mòn trong những năm gần đây.
Ví dụ, vai trò trung
tâm của xuất bản trong các phát minh khoa học đã làm
cho các tạp chí hàn lâm trở thành các điểm kiểm soát
chính. Vì thế, tới lượt nó, đã làm cho các nhà xuất
bản sở hữu chúng rất mạnh - và rất giàu có. Cho tới
gần đây, đó là các nhà xuất bản mà đã yêu sách
quyền sở hữu các tài liệu khoa học được xuất bản
theo tước danh của họ, và họ đã sử dụng tầm quan
trọng của những tài liệu này và sự kiểm soát của họ
đối với chúng để đẩy lên giá thành đối với các
tạp chí khoa học tới các mức độ lố bịch - thường
là hàng ngàn bảng Anh mỗi năm.
One
of the key inspirations for the free software movement was the
scientific tradition of sharing information and building on the work
of others. That arose a few hundred years ago, at a time of rapid
scientific
progress:
The
great scientific advances in the time of Hooke and Newton motivated
wealthy patrons such as the government to begin subsidising science
as a profession. Much of the motivation came from the public benefit
delivered by scientific discovery, and that benefit was strongest if
discoveries were shared. The result was a scientific culture which to
this day rewards the sharing of discoveries with jobs and prestige
for the discoverer.
This
cultural transition was just beginning in the time of Hooke and
Newton, but a little over a century later the great physicist Michael
Faraday could advise a younger colleague to "Work. Finish.
Publish." The culture of science had changed so that a discovery
not published in a scientific journal was not truly complete.
We
take that culture for granted today; and yet, ironically, the core
aspects of openness and sharing that supposedly lie at the heart of
the scientific method have been undermined in recent years.
For
example, the central role of publishing in scientific discoveries has
made academic journals key control points. That, in turn, has made
the publishers that own them very powerful – and very rich. Until
recently, it was the publishers who claimed ownership of the
scientific papers published in their titles, and they used the
importance of those papers and their control over them to push up the
prices for scientific journals to absurd levels – often thousands
of pounds a year.
Điều đó đã làm
cho ngày một khó để truy cập được tri thức khoa học
trừ phi bạn thuộc về một cơ quan được cấp vốn tốt.
Ý tưởng cũ về chia sẻ tri thức một cách tự do để
thúc đẩy sự tiến bộ tất cả đã và đang bị mất.
Như một phản ứng đối với điều này, phong trào truy
cập mở đã và đang đấu tranh ít nhất để làm cho
nghiên cứu được nhà nước cấp vốn - mà hầu hết là
như vậy - được sẵn sàng một cách tự do trên trực
tuyến. Các nhà xuất bản đương nhiên đã phản kháng
chống lại động thái này một cách dữ dội như các
công ty phần mềm sở hữu độc quyền đã phản kháng
lại nguồn mở, nhưng đã bị ép phải nhận thức được
tính hợp pháp của những yêu cầu truy cập mở. Kết quả
là, ngày càng nhiều tài liệu hàn lâm bắt đầu xuất
hiện trên trực tuyến một cách tự do.
Gần đây nhất, một
sự chuyển dịch chính khác đã diễn ra trong khoa học: sự
nổi lên của khoa học số. Dù nó đang gây ngạc nhiên
một cách khó khăn rằng các máy tính đã bắt đầu đóng
một vai trò ngày càng tăng trong dẫn dắt khoa học, khi
chúng có ở khắp mọi nơi, nó đã gõ vào những hệ quả
cho tính mở và chia sẻ mà chỉ tới bây giờ mới chỉ
đang được hiểu ra.
Đây là một giải
thích tốt cho vấn đề này:
Một trong những
tính năng chủ chốt của khoa học là tính có thể từ
chối: nếu bạn đưa ra một lý thuyết và ai đó đưa ra
được bằng chứng rằng nó là sai, thì nó đổ. Đây là
cách mà khoa học làm việc; bằng tính mở, bằng việc
xuất bản các chi tiết thực nghiệm trong các biên bản,
một số phương trình toán học hoặc một sự mô phỏng;
bằng việc làm điều này bạn ôm lấy tính có thể từ
chối. Điều này dường như không xảy ra trong nghiên cứu
về khí hậu. Nhiều nhà nghiên cứu đã từ chối đưa ra
các chương trình máy tính của họ - thậm chí dù chúng
vẫn còn tồn tại và không tuân theo các thỏa thuận
thương mại. Một ví dụ là sự từ chối ban đầu của
Giáo sư Mann đưa ra mã nguồn đã được sử dụng để
xây dựng mô hình “gậy cho môn khúc côn cầu” vào năm
1999, nó đã thể hiện rằng cảnh báo toàn cầu do con
người đưa ra là một sự giả tưởng duy nhất của vài
thập kỷ qua. (Ông ta cuối cùng đã đưa ra vào năm 2005).
That
made it increasingly hard to access scientific knowledge unless you
belonged to a well-funded establishment. The old ideal of sharing
knowledge freely in order to promote progress had been all but lost.
As a reaction to this, the open
access movement has been fighting to at least make
publicly-funded research – which is most of it – freely available
online. Publishers have naturally resisted this move as fiercely as
proprietary software companies have resisted open source, but have
been forced to recognise the legitimacy of open access's demands. As
a result, more and more academic papers are starting to appear online
for free.
More
recently, another major shift has taken place in science: the rise of
digital science. Although it is hardly surprising that computers have
started to play an increasing role in the conduct of science, as they
have elsewhere, it has had knock-on consequences for openness and
sharing that are only now being understood.
Here's
a good explanation
of the problem:
One
of the key features of science is deniability: if you erect a theory
and someone produces evidence that it is wrong, then it falls. This
is how science works: by openness, by publishing minute details of an
experiment, some mathematical equations or a simulation; by doing
this you embrace deniability. This does not seem to have happened in
climate research. Many researchers have refused to release their
computer programs – even though they are still in existence and not
subject to commercial agreements. An example is Professor Mann's
initial refusal to give up the code that was used to construct the
1999 "hockey stick" model that demonstrated that human-made
global warming is a unique artefact of the last few decades. (He did
finally release it in 2005.)
Tác giả của thứ đó
- Darrel Ince, giáo sư máy tính tại Đại học Mở - đã
nói chẻ hoe các từ của ông:
Thế thì, nếu bạn
đang xuất bản các bài báo nghiên cứu mà sử dụng các
chương trình máy tính, liệu bạn có muốn yêu sách rằng
bạn đang tham gia trong khoa học, các chương trình là trong
sự sở hữu của bạn và bạn sẽ không đưa chúng ra sau
đó tôi có thể cũng không công nhận bạn như một nhà
khoa học; Tôi cũng có thể coi bất kỳ tài liệu nào dựa
vào phần mềm bằng 0 và không có.
Chỉ như một sức
mạnh không hợp lý của các nhà xuất bản khoa học đã
dẫn tới sự ra đời của phong trào truy cập mở, vì thế
vấn đề đưa ra mã nguồn khoa học này đã nhắc nhở sự
thành lập của Tuyên ngôn Mã nguồn Khoa học của Nick
Barnes, người giải thích nền tảng như vậy:
Tôi là tác giả
của Tuyên ngôn Mã nguồn Khoa học, dù nhiều người khác
đã đóng góp những gợi ý. Tôi đã viết ó cho Quỹ Mã
nguồn Thời tiết, ban đầu như một sự trả lời và sự
đóng góp cho nghiên cứu chính sách Xã hội Hoàng gia về
“Khoa học như một Doanh nghiệp Nhà nước”. Một phần
được truyền cảm hứng bởi các nguyên tắc của Panton,
một tuyên bố nhấn mạnh về các ý tưởng trong việc
chia sẻ dữ liệu khoa học. Nó tinh lọc các ý tưởng mà
tôi đã đưa ra trong một bài về quan điểm cho tờ Nature
vào năm 2010.
Tuy
nhiên, tôi đã không khởi xướng những ý tưởng này.
Chúng đơn giản là những mở rộng của nguyên tắc cốt
lõi của khoa học: xuất bản phẩm. Xuất bản phẩm là
những gì phân biệt khoa học với thuật giả kim, và là
những gì đã đẩy tới khoa học - và xã hội loài người
- cho tới nay và quá nhanh trong 300 năm trở lại đây.
Tuyên ngôn này là ứng dụng tự nhiên của nguyên lý này
đối với lĩnh vực khá mới, và ngày một quan trọng,
phần mềm khoa học.
(Sự khước từ:
Tôi là thành viên không được trả tiền của Ban Cố vấn
Quỹ Mã nguồn Thời tiết).
The
author of that passage – Darrel Ince, professor of computing at the
Open University – doesn't mince his words:
So,
if you are publishing research articles that use computer programs,
if you want to claim that you are engaging in science, the programs
are in your possession and you will not release them then I would not
regard you as a scientist; I would also regard any papers based on
the software as null and void.
Just
as the unreasonable power of scientific publishers led to the birth
of the open access movement, so this issue of releasing scientific
code has prompted the formulation of the Science
Code Manifesto by Nick Barnes, who explains the background thus:
I
am the author of the Science Code Manifesto, although many others
have contributed suggestions. I wrote it for the Climate Code
Foundation, initially as a response and contribution to the Royal
Society’s policy study on “Science as a Public Enterprise”. It
is partly inspired by the Panton Principles, a bold statement of
ideals in scientific data sharing. It refines the ideas I laid out in
an opinion piece for Nature in 2010.
However,
I did not originate these ideas. They are simply extensions of the
core principle of science: publication. Publication is what
distinguishes science from alchemy, and is what has propelled science
– and human society – so far and so fast in the last 300 years.
The Manifesto is the natural application of this principle to the
relatively new, and increasingly important, area of science software.
Tuyên ngôn Mã nguồn
Khoa học
Các
điểm chính của Tuyên ngôn này là:
Phần
mềm là một hòn đá tảng của khoa học. Không có phần
mềm thì khoa học của thế kỷ 21 có lẽ là không thể.
Không có phần mềm tốt hơn, khoa học không thể tiến
bộ.
Nhưng
văn hóa và các cơ quan khoa học còn chưa điều chỉnh cho
thực tế này. Chúng ta cần cải cách chúng để giải
quyết thách thức này, bằng việc áp dụng 5 nguyên tắc
sau:
- Mã nguồn: Tất cả mã nguồn được viết đặc biệt cho dữ liệu qui trình đối với một tài liệu được xuất bản phải sẵn sàng cho những người rà soát và độc giả của tài liệu đó.
- Bản quyền: Quyền sở hữu và giấy phép bản quyền của bất kỳ mã nguồn được tung ra nào cũng phải được tuyên bố một cách rõ ràng.
- Trích dẫn: Các nhà nghiên cứu mà sử dụng hoặc thích nghi mã nguồn khoa học trong nghiên cứu của họ phải công nhận những người tạo ra mã nguồn trong các xuất bản phẩm kết quả.
- Uy tín: Những đóng góp cho phần mềm phải được đưa vào trong các hệ thống đánh giá, uy tín, thừa nhận khoa học.
- Bảo hành bảo trì các tài sản số: Mã nguồn phải được giữ cho sẵn sàng, được kết nối tới các tài liệu liên quan, cho suốt vòng đời sử dụng của xuất bản phẩm.
Science
Code Manifesto
Here
are the Manifesto's main points:
Software
is a cornerstone of science. Without software, twenty-first century
science would be impossible. Without better software, science cannot
progress.
But
the culture and institutions of science have not yet adjusted to this
reality. We need to reform them to address this challenge, by
adopting these five principles:
- Code: All source code written specifically to process data for a published paper must be available to the reviewers and readers of the paper.
- Copyright: The copyright ownership and licence of any released source code must be clearly stated.
- Citation: Researchers who use or adapt science source code in their research must credit the code’s creators in resulting publications.
- Credit: Software contributions must be included in systems of scientific assessment, credit, and recognition.
- Curation: Source code must remain available, linked to related materials, for the useful lifetime of the publication.
Một trang thảo luận
mở rộng về vấn đề bản quyền chính:
Các điều khoản
của bất kỳ giấy phép nào cũng là tùy vào những người
nắm giữ bản quyền. Một giấy phép nguồn mở khuyến
khích sử dụng lại và thích nghi rộng rãi, trong khi vẫn
cho phép các điều kiện như thẩm quyền được áp đặt.
Có nhiều giấy phép nguồn mở phổ biến: hãy sử dụng
một giấy phép đang tồn tại phổ biến được khuyến
cáo một cách mạnh mẽ.
Barnes
đi xa hơn:
Những ý tưởng
của riêng tôi, chịu ảnh hưởng từ phong trào Phần mềm
Tự do Nguồn mở, đi vượt ra khỏi những gì được nêu
trong Tuyên ngôn: Tôi tin tưởng rằng xuất bản phẩm
Nguồn Mở của tất cả các phần mềm khoa học sẽ là
một kết quả của cuộc cách mạng hiện nay trong các
phương pháp khoa học, một cuộc cách mạng trong đó tôi
hy vọng Tuyên ngôn này sẽ là một phần.
Như điều này gợi
ý, mục tiêu cuối cùng cho các nhà thực hành khoa học
phải là xuất bản phẩm của tất cả phần mềm khoa học
của họ như là nguồn mở. Điều đó có thể cho phép
các nhà khoa học khác kiểm tra và soi xét logic nằm bên
trong các chương trình đó - một phần sống còn của qui
trình khoa học. Nhưng hơn thế, nó có thể cho phép mọi
người xây dựng không chỉ trên các kết quả của những
người khác, mà còn các công cụ phần mềm thực sự.
Điều đó có lẽ là một cuộc cách mạng khoa học đúng
đắn ở một phạm vi của sự phát minh của bản thân
phương pháp khoa học hiện đại, vì nó có thể tránh sự
sao lục lại các nỗ lực và cho phép khoa học tiến lên
phía trước nhanh hơn.
Nhưng điều này không
chỉ là một chiến thắng tiềm tàng khổng lồ cho khoa
học. Nguồn mở trong khoa học cũng mở ra những khả năng
mới quan trọng cho các cao thủ. Một trong những động
lực chính của thế giới nguồn mở là tính sẵn sàng
của các dự án kích thích và truyền cảm hứng cho mọi
người tham gia và đóng góp. Một mối đe dọa thâm niên
cho sức khỏe của hệ sinh thái nguồn mở là việc nó
chạy khỏi các dự án “lớn” thúc đẩy mọi người
tham gia.
Việc mở ra phần mềm
khoa học có lẽ sẽ diễn ra trong những năm tới sẽ mang
theo cùng với nó cơ hội cho những người lập trình tham
gia vào với một số dự án thú vị nhất trên trái đất
- những thứ như việc nghiên cứu thay đổi khí hậu -
theo một cách thức mà trước đó là không thể.
Việc kết hôn nguồn
mở với khoa học mở để sản sinh ra một dạng mới của
khoa học nguồn mở có thể là một trong những thứ thú
vị nhất sẽ xảy ra đối với phần mềm tự do trong
nhiều năm. Một cách để giúp mang lại điều đó có thể
là phải phê chuẩn Tuyên ngôn Mã nguồn Khoa học bằng
việc bổ sung thêm tên của bạn vào danh sách những người
ủng hộ. Nó sẽ chỉ mất vài phút, nhưng có thể giúp
thay đổi thế giới.
A
discussion
page expands on the key issue of copyright:
The
terms of any license are up to the copyright owners. An open-source
license encourages wide re-use and adaptation, while still allowing
conditions such as attribution to be imposed. There are many
well-known open-source licenses: use of a well-known existing license
is strongly recommended.
Barnes
goes further:
My
own ideals, influenced by the Free and Open Source Software movement,
go beyond those stated in the Manifesto: I believe that Open Source
publication of all science software will be one outcome of the
current revolution in scientific methods, a revolution in which I
hope this Manifesto will play a part.
As
this suggests, the ultimate goal for science practitioners ought to
be the publication of all their scientific software as open source.
That would allow other scientists to examine and check the underlying
logic of those programs – a crucial part of the scientific process.
But more than that, it would allow people to build on not just the
results of others, but the actual software tools. That would be a
true scientific revolution on the scale of the invention of the
modern scientific method itself, because it would avoid duplication
of effort and allow science to move forward faster.
But
this is not just a huge potential win for science. Open source in
science also opens up important new possibilities for hackers. One of
the key drivers of the open source world is the availability of
projects that excite and inspire people to join and contribute. One
perennial threat to the health of the open source ecosystem is that
it runs out of "big" projects that motivate people to
participate.
The
opening up of scientific software that is likely to take place in the
coming years brings with it the opportunity for coders to get
involved with some of the most exciting projects on the planet –
things like investigating climate change – in a way that has not
previously been possible.
Marrying
open source with open science to produce a new kind of open source
science could be one of the most exciting things to happen to free
software in years. One way of helping to bring that about would be to
endorse
the Science Code Manifesto by adding your name to the list of
supporters. It will only take a couple of minutes, but could help
change the world.
Dịch tài liệu: Lê
Trung Nghĩa
Không có nhận xét nào:
Đăng nhận xét
Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.