Thứ Ba, 1 tháng 11, 2011

Nguồn mở, Khoa học mở, Khoa học nguồn mở


Open Source, Open Science, Open Source Science
26 October 2011, 16:05
by Glyn Moody
Bài được đưa lên Internet ngày: 26/10/2011
Kỷ nguyên số đã bổ sung thêm đáng kể các công cụ sẵn sàng cho công việc khoa học, nhưng cũng đã đưa ra những thách thức mới. Glyn Moody mô tả hiện trạng, và gợi ý rằng chúng ta cần tính mở thực sự với sự tôn trọng phần mềm khoa học.
The digital age has added significantly to the tools available to scientific work, but has also introduced new challenges. Glyn Moody describes the present situation, and suggests that we need true openness with respect to scientific software.
Lời người dịch: Tính mở và sự chia sẻ nằm trong tim của văn hóa khoa học, nó không phải là cách “Làm việc. Kết thúc. Xuất bản”. Ngày nay, chúng ta cần cải cách văn hóa khoa học, “bằng việc áp dụng 5 nguyên tắc sau: (1) Mã nguồn: Tất cả mã nguồn được viết đặc biệt cho dữ liệu qui trình đối với một tài liệu được xuất bản phải sẵn sàng cho những người rà soát và độc giả của tài liệu đó; (2) Bản quyền: Quyền sở hữu và giấy phép bản quyền của bất kỳ mã nguồn được tung ra nào cũng phải được tuyên bố một cách rõ ràng; (3) Trích dẫn: Các nhà nghiên cứu mà sử dụng hoặc thích nghi mã nguồn khoa học trong nghiên cứu của họ phải công nhận những người tạo ra mã nguồn trong các xuất bản phẩm kết quả; (4) Uy tín: Những đóng góp cho phần mềm phải được đưa vào trong các hệ thống đánh giá, uy tín, thừa nhận khoa học; (5) Bảo hành bảo trì các tài sản số: Mã nguồn phải được giữ cho sẵn sàng, được kết nối tới các tài liệu liên quan, cho suốt vòng đời sử dụng của xuất bản phẩm”.
Một trong những cảm hứng chủ chốt cho phong trào phần mềm tự do từng là truyền thống khoa học về chia sẻ thông tin và xây dựng trên công việc của những người khác. Điều đó đã nảy sinh vài trăm năm trước, ở thời điểm tiến bộ khoa học nhanh:
Những tiến bộ khoa học lớn vào thời của Hooke và Newton đã tạo động lực cho những người bảo trợ lành mạnh như chính phủ bắt đầu bao cấp cho khoa học như một nghề nghiệp. Nhiều động lực tới từ lợi ích nhà nước được phân bổ từ sự phát minh khoa học, và lợi ích đó từng mạnh nhất nếu những phát minh được chia sẻ. Kết quả là một văn hóa khoa học đối với ngày đó tưởng thưởng cho sự chia sẻ những phát minh với các công việc và uy tín đối với người phát minh.
Sự biến chuyển văn hóa này chỉ bắt đầu trong thời kỳ của Hooke và Newton, nhưng là ít qua một thế kỷ sau đó mà nhà vật lý học Michael Faraday có thể khuyến cáo một đồng nghiệp trẻ hơn hãy “Làm việc. Kết thúc. Xuất bản”. Văn hóa khoa học này đã thay đổi sao cho một phát minh mà không được xuất bản trong một tạp chí khoa học thì chưa phải là hoàn tất được.
Chúng ta nắm lấy văn hóa đó cho ngày hôm nay, giả dụ thế; và vâng, thật chớ trêu, những khía cạnh cốt lõi của tính mở và chia sẻ được cho là nằm trong tim của phương pháp khoa học đã và đang bị xói mòn trong những năm gần đây.
Ví dụ, vai trò trung tâm của xuất bản trong các phát minh khoa học đã làm cho các tạp chí hàn lâm trở thành các điểm kiểm soát chính. Vì thế, tới lượt nó, đã làm cho các nhà xuất bản sở hữu chúng rất mạnh - và rất giàu có. Cho tới gần đây, đó là các nhà xuất bản mà đã yêu sách quyền sở hữu các tài liệu khoa học được xuất bản theo tước danh của họ, và họ đã sử dụng tầm quan trọng của những tài liệu này và sự kiểm soát của họ đối với chúng để đẩy lên giá thành đối với các tạp chí khoa học tới các mức độ lố bịch - thường là hàng ngàn bảng Anh mỗi năm.
One of the key inspirations for the free software movement was the scientific tradition of sharing information and building on the work of others. That arose a few hundred years ago, at a time of rapid scientific progress:
The great scientific advances in the time of Hooke and Newton motivated wealthy patrons such as the government to begin subsidising science as a profession. Much of the motivation came from the public benefit delivered by scientific discovery, and that benefit was strongest if discoveries were shared. The result was a scientific culture which to this day rewards the sharing of discoveries with jobs and prestige for the discoverer.
This cultural transition was just beginning in the time of Hooke and Newton, but a little over a century later the great physicist Michael Faraday could advise a younger colleague to "Work. Finish. Publish." The culture of science had changed so that a discovery not published in a scientific journal was not truly complete.
We take that culture for granted today; and yet, ironically, the core aspects of openness and sharing that supposedly lie at the heart of the scientific method have been undermined in recent years.
For example, the central role of publishing in scientific discoveries has made academic journals key control points. That, in turn, has made the publishers that own them very powerful – and very rich. Until recently, it was the publishers who claimed ownership of the scientific papers published in their titles, and they used the importance of those papers and their control over them to push up the prices for scientific journals to absurd levels – often thousands of pounds a year.
Điều đó đã làm cho ngày một khó để truy cập được tri thức khoa học trừ phi bạn thuộc về một cơ quan được cấp vốn tốt. Ý tưởng cũ về chia sẻ tri thức một cách tự do để thúc đẩy sự tiến bộ tất cả đã và đang bị mất. Như một phản ứng đối với điều này, phong trào truy cập mở đã và đang đấu tranh ít nhất để làm cho nghiên cứu được nhà nước cấp vốn - mà hầu hết là như vậy - được sẵn sàng một cách tự do trên trực tuyến. Các nhà xuất bản đương nhiên đã phản kháng chống lại động thái này một cách dữ dội như các công ty phần mềm sở hữu độc quyền đã phản kháng lại nguồn mở, nhưng đã bị ép phải nhận thức được tính hợp pháp của những yêu cầu truy cập mở. Kết quả là, ngày càng nhiều tài liệu hàn lâm bắt đầu xuất hiện trên trực tuyến một cách tự do.
Gần đây nhất, một sự chuyển dịch chính khác đã diễn ra trong khoa học: sự nổi lên của khoa học số. Dù nó đang gây ngạc nhiên một cách khó khăn rằng các máy tính đã bắt đầu đóng một vai trò ngày càng tăng trong dẫn dắt khoa học, khi chúng có ở khắp mọi nơi, nó đã gõ vào những hệ quả cho tính mở và chia sẻ mà chỉ tới bây giờ mới chỉ đang được hiểu ra.
Đây là một giải thích tốt cho vấn đề này:
Một trong những tính năng chủ chốt của khoa học là tính có thể từ chối: nếu bạn đưa ra một lý thuyết và ai đó đưa ra được bằng chứng rằng nó là sai, thì nó đổ. Đây là cách mà khoa học làm việc; bằng tính mở, bằng việc xuất bản các chi tiết thực nghiệm trong các biên bản, một số phương trình toán học hoặc một sự mô phỏng; bằng việc làm điều này bạn ôm lấy tính có thể từ chối. Điều này dường như không xảy ra trong nghiên cứu về khí hậu. Nhiều nhà nghiên cứu đã từ chối đưa ra các chương trình máy tính của họ - thậm chí dù chúng vẫn còn tồn tại và không tuân theo các thỏa thuận thương mại. Một ví dụ là sự từ chối ban đầu của Giáo sư Mann đưa ra mã nguồn đã được sử dụng để xây dựng mô hình “gậy cho môn khúc côn cầu” vào năm 1999, nó đã thể hiện rằng cảnh báo toàn cầu do con người đưa ra là một sự giả tưởng duy nhất của vài thập kỷ qua. (Ông ta cuối cùng đã đưa ra vào năm 2005).
That made it increasingly hard to access scientific knowledge unless you belonged to a well-funded establishment. The old ideal of sharing knowledge freely in order to promote progress had been all but lost. As a reaction to this, the open access movement has been fighting to at least make publicly-funded research – which is most of it – freely available online. Publishers have naturally resisted this move as fiercely as proprietary software companies have resisted open source, but have been forced to recognise the legitimacy of open access's demands. As a result, more and more academic papers are starting to appear online for free.
More recently, another major shift has taken place in science: the rise of digital science. Although it is hardly surprising that computers have started to play an increasing role in the conduct of science, as they have elsewhere, it has had knock-on consequences for openness and sharing that are only now being understood.
Here's a good explanation of the problem:
One of the key features of science is deniability: if you erect a theory and someone produces evidence that it is wrong, then it falls. This is how science works: by openness, by publishing minute details of an experiment, some mathematical equations or a simulation; by doing this you embrace deniability. This does not seem to have happened in climate research. Many researchers have refused to release their computer programs – even though they are still in existence and not subject to commercial agreements. An example is Professor Mann's initial refusal to give up the code that was used to construct the 1999 "hockey stick" model that demonstrated that human-made global warming is a unique artefact of the last few decades. (He did finally release it in 2005.)
Tác giả của thứ đó - Darrel Ince, giáo sư máy tính tại Đại học Mở - đã nói chẻ hoe các từ của ông:
Thế thì, nếu bạn đang xuất bản các bài báo nghiên cứu mà sử dụng các chương trình máy tính, liệu bạn có muốn yêu sách rằng bạn đang tham gia trong khoa học, các chương trình là trong sự sở hữu của bạn và bạn sẽ không đưa chúng ra sau đó tôi có thể cũng không công nhận bạn như một nhà khoa học; Tôi cũng có thể coi bất kỳ tài liệu nào dựa vào phần mềm bằng 0 và không có.
Chỉ như một sức mạnh không hợp lý của các nhà xuất bản khoa học đã dẫn tới sự ra đời của phong trào truy cập mở, vì thế vấn đề đưa ra mã nguồn khoa học này đã nhắc nhở sự thành lập của Tuyên ngôn Mã nguồn Khoa học của Nick Barnes, người giải thích nền tảng như vậy:
Tôi là tác giả của Tuyên ngôn Mã nguồn Khoa học, dù nhiều người khác đã đóng góp những gợi ý. Tôi đã viết ó cho Quỹ Mã nguồn Thời tiết, ban đầu như một sự trả lời và sự đóng góp cho nghiên cứu chính sách Xã hội Hoàng gia về “Khoa học như một Doanh nghiệp Nhà nước”. Một phần được truyền cảm hứng bởi các nguyên tắc của Panton, một tuyên bố nhấn mạnh về các ý tưởng trong việc chia sẻ dữ liệu khoa học. Nó tinh lọc các ý tưởng mà tôi đã đưa ra trong một bài về quan điểm cho tờ Nature vào năm 2010.
Tuy nhiên, tôi đã không khởi xướng những ý tưởng này. Chúng đơn giản là những mở rộng của nguyên tắc cốt lõi của khoa học: xuất bản phẩm. Xuất bản phẩm là những gì phân biệt khoa học với thuật giả kim, và là những gì đã đẩy tới khoa học - và xã hội loài người - cho tới nay và quá nhanh trong 300 năm trở lại đây. Tuyên ngôn này là ứng dụng tự nhiên của nguyên lý này đối với lĩnh vực khá mới, và ngày một quan trọng, phần mềm khoa học.
(Sự khước từ: Tôi là thành viên không được trả tiền của Ban Cố vấn Quỹ Mã nguồn Thời tiết).
The author of that passage – Darrel Ince, professor of computing at the Open University – doesn't mince his words:
So, if you are publishing research articles that use computer programs, if you want to claim that you are engaging in science, the programs are in your possession and you will not release them then I would not regard you as a scientist; I would also regard any papers based on the software as null and void.
Just as the unreasonable power of scientific publishers led to the birth of the open access movement, so this issue of releasing scientific code has prompted the formulation of the Science Code Manifesto by Nick Barnes, who explains the background thus:
I am the author of the Science Code Manifesto, although many others have contributed suggestions. I wrote it for the Climate Code Foundation, initially as a response and contribution to the Royal Society’s policy study on “Science as a Public Enterprise”. It is partly inspired by the Panton Principles, a bold statement of ideals in scientific data sharing. It refines the ideas I laid out in an opinion piece for Nature in 2010.
However, I did not originate these ideas. They are simply extensions of the core principle of science: publication. Publication is what distinguishes science from alchemy, and is what has propelled science – and human society – so far and so fast in the last 300 years. The Manifesto is the natural application of this principle to the relatively new, and increasingly important, area of science software.
(Disclaimer: I am an unpaid member of the Climate Code Foundation's Advisory Board.)
Tuyên ngôn Mã nguồn Khoa học
Các điểm chính của Tuyên ngôn này là:
Phần mềm là một hòn đá tảng của khoa học. Không có phần mềm thì khoa học của thế kỷ 21 có lẽ là không thể. Không có phần mềm tốt hơn, khoa học không thể tiến bộ.
Nhưng văn hóa và các cơ quan khoa học còn chưa điều chỉnh cho thực tế này. Chúng ta cần cải cách chúng để giải quyết thách thức này, bằng việc áp dụng 5 nguyên tắc sau:
  • Mã nguồn: Tất cả mã nguồn được viết đặc biệt cho dữ liệu qui trình đối với một tài liệu được xuất bản phải sẵn sàng cho những người rà soát và độc giả của tài liệu đó.
  • Bản quyền: Quyền sở hữu và giấy phép bản quyền của bất kỳ mã nguồn được tung ra nào cũng phải được tuyên bố một cách rõ ràng.
  • Trích dẫn: Các nhà nghiên cứu mà sử dụng hoặc thích nghi mã nguồn khoa học trong nghiên cứu của họ phải công nhận những người tạo ra mã nguồn trong các xuất bản phẩm kết quả.
  • Uy tín: Những đóng góp cho phần mềm phải được đưa vào trong các hệ thống đánh giá, uy tín, thừa nhận khoa học.
  • Bảo hành bảo trì các tài sản số: Mã nguồn phải được giữ cho sẵn sàng, được kết nối tới các tài liệu liên quan, cho suốt vòng đời sử dụng của xuất bản phẩm.
Science Code Manifesto
Here are the Manifesto's main points:
Software is a cornerstone of science. Without software, twenty-first century science would be impossible. Without better software, science cannot progress.
But the culture and institutions of science have not yet adjusted to this reality. We need to reform them to address this challenge, by adopting these five principles:
  • Code: All source code written specifically to process data for a published paper must be available to the reviewers and readers of the paper.
  • Copyright: The copyright ownership and licence of any released source code must be clearly stated.
  • Citation: Researchers who use or adapt science source code in their research must credit the code’s creators in resulting publications.
  • Credit: Software contributions must be included in systems of scientific assessment, credit, and recognition.
  • Curation: Source code must remain available, linked to related materials, for the useful lifetime of the publication.
Một trang thảo luận mở rộng về vấn đề bản quyền chính:
Các điều khoản của bất kỳ giấy phép nào cũng là tùy vào những người nắm giữ bản quyền. Một giấy phép nguồn mở khuyến khích sử dụng lại và thích nghi rộng rãi, trong khi vẫn cho phép các điều kiện như thẩm quyền được áp đặt. Có nhiều giấy phép nguồn mở phổ biến: hãy sử dụng một giấy phép đang tồn tại phổ biến được khuyến cáo một cách mạnh mẽ.
Barnes đi xa hơn:
Những ý tưởng của riêng tôi, chịu ảnh hưởng từ phong trào Phần mềm Tự do Nguồn mở, đi vượt ra khỏi những gì được nêu trong Tuyên ngôn: Tôi tin tưởng rằng xuất bản phẩm Nguồn Mở của tất cả các phần mềm khoa học sẽ là một kết quả của cuộc cách mạng hiện nay trong các phương pháp khoa học, một cuộc cách mạng trong đó tôi hy vọng Tuyên ngôn này sẽ là một phần.
Như điều này gợi ý, mục tiêu cuối cùng cho các nhà thực hành khoa học phải là xuất bản phẩm của tất cả phần mềm khoa học của họ như là nguồn mở. Điều đó có thể cho phép các nhà khoa học khác kiểm tra và soi xét logic nằm bên trong các chương trình đó - một phần sống còn của qui trình khoa học. Nhưng hơn thế, nó có thể cho phép mọi người xây dựng không chỉ trên các kết quả của những người khác, mà còn các công cụ phần mềm thực sự. Điều đó có lẽ là một cuộc cách mạng khoa học đúng đắn ở một phạm vi của sự phát minh của bản thân phương pháp khoa học hiện đại, vì nó có thể tránh sự sao lục lại các nỗ lực và cho phép khoa học tiến lên phía trước nhanh hơn.
Nhưng điều này không chỉ là một chiến thắng tiềm tàng khổng lồ cho khoa học. Nguồn mở trong khoa học cũng mở ra những khả năng mới quan trọng cho các cao thủ. Một trong những động lực chính của thế giới nguồn mở là tính sẵn sàng của các dự án kích thích và truyền cảm hứng cho mọi người tham gia và đóng góp. Một mối đe dọa thâm niên cho sức khỏe của hệ sinh thái nguồn mở là việc nó chạy khỏi các dự án “lớn” thúc đẩy mọi người tham gia.
Việc mở ra phần mềm khoa học có lẽ sẽ diễn ra trong những năm tới sẽ mang theo cùng với nó cơ hội cho những người lập trình tham gia vào với một số dự án thú vị nhất trên trái đất - những thứ như việc nghiên cứu thay đổi khí hậu - theo một cách thức mà trước đó là không thể.
Việc kết hôn nguồn mở với khoa học mở để sản sinh ra một dạng mới của khoa học nguồn mở có thể là một trong những thứ thú vị nhất sẽ xảy ra đối với phần mềm tự do trong nhiều năm. Một cách để giúp mang lại điều đó có thể là phải phê chuẩn Tuyên ngôn Mã nguồn Khoa học bằng việc bổ sung thêm tên của bạn vào danh sách những người ủng hộ. Nó sẽ chỉ mất vài phút, nhưng có thể giúp thay đổi thế giới.
A discussion page expands on the key issue of copyright:
The terms of any license are up to the copyright owners. An open-source license encourages wide re-use and adaptation, while still allowing conditions such as attribution to be imposed. There are many well-known open-source licenses: use of a well-known existing license is strongly recommended.
Barnes goes further:
My own ideals, influenced by the Free and Open Source Software movement, go beyond those stated in the Manifesto: I believe that Open Source publication of all science software will be one outcome of the current revolution in scientific methods, a revolution in which I hope this Manifesto will play a part.
As this suggests, the ultimate goal for science practitioners ought to be the publication of all their scientific software as open source. That would allow other scientists to examine and check the underlying logic of those programs – a crucial part of the scientific process. But more than that, it would allow people to build on not just the results of others, but the actual software tools. That would be a true scientific revolution on the scale of the invention of the modern scientific method itself, because it would avoid duplication of effort and allow science to move forward faster.
But this is not just a huge potential win for science. Open source in science also opens up important new possibilities for hackers. One of the key drivers of the open source world is the availability of projects that excite and inspire people to join and contribute. One perennial threat to the health of the open source ecosystem is that it runs out of "big" projects that motivate people to participate.
The opening up of scientific software that is likely to take place in the coming years brings with it the opportunity for coders to get involved with some of the most exciting projects on the planet – things like investigating climate change – in a way that has not previously been possible.
Marrying open source with open science to produce a new kind of open source science could be one of the most exciting things to happen to free software in years. One way of helping to bring that about would be to endorse the Science Code Manifesto by adding your name to the list of supporters. It will only take a couple of minutes, but could help change the world.
Dịch tài liệu: Lê Trung Nghĩa

Không có nhận xét nào:

Đăng nhận xét

Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.