Thứ Ba, 26 tháng 7, 2011

Chúng ta nên giải phóng tri thức như thế nào?

How Should We Liberate Knowledge?

Published 11:14, 20 July 11, by Glyn Moody

Theo: http://blogs.computerworlduk.com/open-enterprise/2011/07/the-art-of-liberating-knowledge/index.htm

Bài được đưa lên Internet ngày: 20/07/2011

Lời người dịch: Qua một vụ kiện được cho là có sự ăn cắp dữ liệu số, tác giả nói lên sự vô lý khi tri thức bị ngăn trở phổ biến. Thế giới cần sự truy cập mở tới các kết quả của nghiên cứu và đổi mới sáng tạo. Truy cập mở, được định nghĩa như là sự truy cập tự do tới nội dung hàn lâm qua Internet, có thể giúp truy cập được điều này. Neelie Kroes, người vẫn là hiểu biết nhất của Ủy ban châu Âu khi nói về các công nghệ số, được trích đã nói: “Các kết quả của nghiên cứu được nhà nước cấp vốn nên được lưu hành càng rộng rãi càng tốt như một vấn đề về nguyên tắc. Sự phổ biến tri thức rộng rãi, bên trong các lĩnh vực nghiên cứu của châu Âu và bên ngoài nó, là một động lực chủ chốt của sự tiến bộ trong nghiên cứu và đổi mới sáng tạo, và vì thế cho những công việc và sự tăng trưởng tai châu Âu. Tầm nhìn của chúng ta là Truy cập Mở đối với các thông tin khoa học sao cho tất cả chúng ta hưởng lợi được càng nhiều càng tốt từ những đầu tư trong khoa học. Để tăng tốc sự tiến bộ khoa học, nhưng cũng vì sự giáo dục, vì đổi mới sáng tạo và vì sự sử dụng lại sáng tạo khác. Vì lý do y hệt chúng ta phải gìn giữ các hồ sơ khoa học cho các thế hệ tương lai”. Bạn sẽ hiểu tại sao các đề tài khoa học có liên quan tới phần mềm phải mang giấy phép của phần mềm tự do nguồn mở và tài liệu mở mới là hợp lý, vì chúng đã được những người đóng thuế trả tiền rồi.

Đây là một tình huống thú vị trong kho hàn lâm trực tuyến tại JSTOR:

Mùa thu đông năm ngoái, JSTOR đã trải nghiệm một việc sử dụng sai đáng kể cơ sở dữ liệu của chúng tôi. Một phần đáng kể của nội dung đối tác xuất bản đã được tải về theo một cách thức không được phép có sử dụng mạng tại Viện Công nghệ Massachusetts, một trong những viện tham gia của chúng tôi. Nội dung được lấy từng được tairi về thường xuyên có sử dụng một tiếp cận được thiết kế để tránh sự dò tìm ra bằng các hệ thống giám sát của chúng tôi.

Nội dung được tải về hơn 4 triệu bài báo, rà soát sách, và các nội dung khác từ các tạp chí và các xuất bản phẩm khác của hàn lâm đối tác xuất bản của chúng tôi. nó đã không đưa vào bất kỳ thông tin xác định cá nhân nào về những người sử dụng JSTOR.

Chúng tôi đã dừng hoạt động tải về này, và trách nhiệm cá nhân, ông Swartz, đã được xác định. Chúng tôi đã đã bảo an ninh từ ông Swartz cho nội dung mà đã được lấy, và đã nhận được sự khẳng định rằng nội dung chưa từng và không được sử dụng, sao chép, truyền hoặc phân phối.

Sự điều tra tội phạm và truy tố ngày nay đối với ông Swartz đã được ra lệnh từ Văn phòng Chưởng lý của nước Mỹ.

Đó là những gì JSTOR đã nói. Đây là một bên khác của câu chuyện:

Thời gian trước đó, Aaron Swartz, cựu giám đốc điều hành và người sáng lập ra Demand Progress, bị chính phủ Mỹ buộc tội. Tốt nhất chúng tôi có thể nói, ông đang chịu tội với việc tải về quá nhiều bài báo các tạp chí uyên bác từ Web. Chính phủ tranh luận rằng các bài báo được nói tải về là thực sự việc đạo tặc các máy tính tội lỗi và nên bị trừng phạt ngồi tù.

Here's an interesting situation at the online academic repository JSTOR:

Last fall and winter, JSTOR experienced a significant misuse of our database. A substantial portion of our publisher partners’ content was downloaded in an unauthorized fashion using the network at the Massachusetts Institute of Technology, one of our participating institutions. The content taken was systematically downloaded using an approach designed to avoid detection by our monitoring systems.

The downloaded content included over 4 million articles, book reviews, and other content from our publisher partner’s academic journals and other publications; it did not include any personally identifying information about JSTOR users.

We stopped this downloading activity, and the individual responsible, Mr. Swartz, was identified. We secured from Mr. Swartz the content that was taken, and received confirmation that the content was not and would not be used, copied, transferred, or distributed.

The criminal investigation and today’s indictment of Mr. Swartz has been directed by the United States Attorney’s Office.

That's what JSTOR said. Here's the other side of the story:

Moments ago, Aaron Swartz, former executive director and founder of Demand Progress, was indicted by the US government. As best as we can tell, he is being charged with allegedly downloading too many scholarly journal articles from the Web. The government contends that downloading said articles is actually felony computer hacking and should be punished with time in prison.

“Điều này không có ý nghĩa gì”, Giám đốc điều hành David Segal của Demand Progress nói: “Nó giống như bắt ai đó vào tù vì cho là kiểm tra quá nhiều sách ra ngoài thư viện vậy”. “Thậm chí nó còn kỳ lạ hơn vì nạn nhân được cho là đã dàn xếp mọi khiếu nại chống lại Aaron, đã giải thích họ đã không chịu phải tổn thất hay mất mát gì, và đã yêu cầu chính phủ không bắt tội”, Segal bổ sung.

James Jacobs, người thủ thư các tài liệu của chính phủ tại Đại học Stanford, cũng phản đối vụ bắt giữ: “Việc kết tội Aaron làm xói mòn các nguyên tắc dân chủ và đòi hỏi hàn lâm”, Jacobs nói. “Không thể tin nổi rằng chính phủ lại có thể cố khóa ai đó vì được cho là tra các bài báo tại một thư viện”.

Nên hãy lùi lại một bước và nhìn vào các vấn đề bên trong.

Đây là JSTOR tự nói về bản thân:

Nhiệm vụ của chúng tôi tại JSTOR là hỗ trợ công việc hàn lâm và truy cập tới tri thức khắp thế giới. Khoa, các giáo viên và sinh viên ở hơn 7.000 viện tại 153 quốc gia dựa vào chúng tôi để có được sự truy cập có thể kham được và trong một số trường hợp là tự do đối với nội dung trong JSTOR. Kể từ ngày thành lập năm 1995, chúng tôi đã số hóa hoàn toàn gần 1,400 tạp chí hàn lâm từ hơn 800 nhà xuất bản. Mục đích cuối cùng của chúng tôi là cung cấp sự truy cập có thể kham được đối với nội dung hàn lâm cho bất kỳ ai cần nó.

Lưu ý sự nhấn mạnh vào từ “có thể kham được”. Hãy nhớ rằng đây là công việc hàn lâm, không phải công việc được viết cho cấc mục tiêu thương mại với dự kiến để sinh lợi nhuận. Nhiều, nếu không nói là hầu hết, công việc này được thực hiện từ các nhà thông thái được cấp tiền từ bạn và tôi thông qua sự tài trợ của chính phủ. Vì thế JSTOR đang cung cấp “sự truy cập có thể kham được” đối với những thứ mà chúng tôi đã trả tiền rồi. Tất nhiên, đây là vấn đề rằng sự truy cập mở đang cố gắng giải quyết bằng việc đảm bảo rằng các bản sao số của công việc hàn lâm đã được nhà nước cấp tiền sẽ là sẵn sàng một cách tự do.

"This makes no sense," said Demand Progress Executive Director David Segal; "it's like trying to put someone in jail for allegedly checking too many books out of the library."
"It's even more strange because the alleged victim has settled any claims against Aaron, explained they've suffered no loss or damage, and asked the government not to prosecute," Segal added.

James Jacobs, the Government Documents Librarian at Stanford University, also denounced the arrest: "Aaron's prosecution undermines academic inquiry and democratic principles," Jacobs said. "It's incredible that the government would try to lock someone up for allegedly looking up articles at a library."

So let's step back and look at the underlying issues.

Here's what JSTOR says about itself:

Our mission at JSTOR is supporting scholarly work and access to knowledge around the world. Faculty, teachers, and students at more than 7,000 institutions in 153 countries rely upon us for affordable and in some cases free access to content on JSTOR. Since our founding in 1995, we have digitized the complete back runs of nearly 1,400 academic journals from over 800 publishers. Our ultimate objective is to provide affordable access to scholarly content to anyone who needs it.

Note the emphasis on the word “affordable”. Remember that this is scholarly work, not work written for commercial purposes with the intent to generate profits. Much, if not most, of this work is produced by scholars who are funded by you and me through government grants. Thus JSTOR is providing “affordable access” to stuff that we have already paid for. This, of course, is the problem that open access is trying to solve by ensuring that digital copies of publicly-funded academic work are freely available.

Đúng là cùng với sự ra đời của các giấy tờ số hàn lâm, JSTOR cũng quét và số hóa các bài báo cũ hơn mà trước đó chỉ sẵn sàng ở dạng giấy. Nhưng khi mà những sáng kiến khác như Dự án Gutenberg đã chỉ ra, thì bạn không cần bỏ hàng triệu USD ra để làm thế: nguồn đám đông rất hiệu quả ở đây. Hoặc nếu có thể nếu mọi người được phép làm cho tri thức bị khóa trói thành sẵn sàng theo cách này, nhưng tất nhiên là họ không thể.

Dù JSTOR là thứ gì đó chắc chắn của một con khổng long trong một thế giới chuyển động tới sự truy cập mở, thì nó dường như sẽ không dẫn tới sự kết tội này, khi mà các bình luận của nó ở trên chỉ ra. Thay vào đó, văn phòng chưởng lý Mỹ dường như là đứng đằng sau các động thái này. Nó đã đưa ra một thông cáo báo chí về trường hợp này, với đầu đề phóng đại “Tin tặc bị kết tội ăn cắp hơn 4 triệu tài liệu từ mạng của MIT”. Tham chiếu tới “ăn cắp” không phải là sự trượt chân của trình xử lý văn bản, vì nó đi tiếp và nói:

Cáo buộc cho rằng Swartz đã khai thác hệ thống máy tính của MIT để ăn cắp hơn 4 triệu bài báo từ JSTOR, thậm chí Swartz đã không có liên quan gì với MIT như một sinh viên, thành viên khoa, hoặc nhân viên. Trên thực tế, trong các sự kiện này, Swrartz từng được coi là một hội viên tại đại học vùng Boston, thông qua đó ông có thể đã truy cập được vào các dịch vụ và kho lưu trữ của JSTOR cho việc nghiên cứu hợp pháp.

Chưởng lý Carmen M. Ortiz của Mỹ nói, “Việc ăn cắp là ăn cắp bất kể bạn sử dụng một lệnh máy tính hay một cái xà beng, và bất kể bạn lấy các dữ liệu tài liệu hay tiền. Tai hại là như nhau đối với nạn nhân bất kể bạn bán những gì bạn đâ ăn cắp hay vứt nó đi”.

It's true that alongside born-digital academic papers, JSTOR also scans and digitises older articles that were previously only available as hard copy. But as other initiatives like Project Gutenberg have shown, you don't need to spend millions of dollars to do that: crowdsourcing is very effective here. Or rather it would be if people were allowed to make the locked-up knowledge available in this way, but of course they aren't.

Although JSTOR is certainly something of a dinosaur in a world moving to open access, it doesn't seem to be driving this prosecution, as its comments above indicate. Instead, the US Attorney’s office appears to be behind the moves. It has issued a press release on the case [.pdf], which bears the hyperbolic headline “Alleged Hacker Charged with Stealing over Four Million Documents from MIT Network”. That reference to “stealing” was no slip of the word processor, since it goes on to say:

The indictment alleges that Swartz exploited MIT’s computer system to steal over four million articles from JSTOR, even though Swartz was not affiliated with MIT as a student, faculty member, or employee. In fact, during these events, Swartz was allegedly a fellow at a Boston-area university, through which he could have accessed JSTOR’s services and archive for legitimate research.

United States Attorney Carmen M. Ortiz said, “Stealing is stealing whether you use a computer command or a crowbar, and whether you take documents, data or dollars. It is equally harmful to the victim whether you sell what you have stolen or give it away.”

Tất nhiên, điều này là vô nghĩa khủng khiếp. Bạn không thể “ăn cắp” các tệp số (vâng, không trừ phi bạn ăn cắp vật trung chuyển vật lý trong đó chúng được lưu trữ). Bạn có thể thực hiện sao chép không được phép, nhưng đó không phải là kẻ trộm, đó là vi phạm bản quyền (quả thực, kỳ dị rằng đây là một thứ mà Swartz không bị kết tội). Chưởng lý Mỹ sau đó đã tổng hợp lỗi này bằng một bình luận nực cười đặc biệt rằng “Việc ăn cắp là ăn cắp bất kể bạn sử dụng một lệnh máy tính hay một cái xà beng, và bất kể bạn lấy các dữ liệu tài liệu hay tiền”: nếu bà ta thực sự tin điều này, thì bà ta rõ ràng không có năng lực để dẫn dắt điều tra trong dạng vụ kiện này.

Quan điểm sai đầu nước lạ thường này, cùng với sự thực rằng “nếu bị kết án có tội, Swartz đối mặt 35 năm từ, sau đó là 3 năm giám sát, bồi thường, tước đoạt và một hình phạt tới 1 triệu USD”, gợi ý cho tôi rằng các nhà chức trách tuân thủ pháp luật đang cố gắng làm cho ví dụ về Swartz, giả thiết rằng “để khuyến khích những người khác”.

Không chỉ không có gì bị ăn cắp, không có gì thậm chí được chia sẻ. Và thậm chí nếu nó đũ được chia sẻ, thì một số tư liệu từng nằm trong miền công cộng. Đa số lớn điều đó đã không, đã được nhà nước trả tiền, và vì thế thuộc về mọi người một cách tranh cãi. Đối với những ai mà những khoản đã không được trả tiền theo cách này, thì nó đã chưa bao giờ được chỉ ra với nghiên cứu độc lập rằng việc chia sẻ chúng có thể thực sự làm hại cho các nhà xuất bản: trên thực tế, có nhiều nghiên cứu làm điều ngược lại (như tôi đã lưu ý trước đó).

Of course, this is utter nonsense. You can't “steal” digital files (well, not unless you steal the physical medium on which they are stored). You can make unauthorised copies, but that's not theft, it's copyright infringement (indeed, it's odd that this is one thing that Swartz is not being charged with.) The US Attorney then compounds this error by a particularly ridiculous comment that “stealing is stealing whether you use a computer command or a crowbar, and whether you take documents, data or dollars”: if she really believes this, then she is clearly not competent to lead investigations into this kind of case.

This extraordinarily wrong-headed view, along with the fact that “if convicted on these charges, SWARTZ faces up to 35 years in prison, to be followed by three years of supervised release, restitution, forfeiture and a fine of up to $1 million,” suggests to me that the law enforcement authorities are trying to make an example of Swartz, presumably “pour encourager les autres”.

For not only was nothing stolen, nothing was even shared. And even if it had been shared, some of the material was in the public domain. The vast majority that wasn't, was paid for by the public, and therefore arguably belonged to everyone anyway. For those items that were not paid for in this way, it has still never been shown by independent research that sharing them would actually harm the publishers: in fact, there is plenty of research to the contrary (as I've noted before.)

Vì thế, tất cả điều này xem như là một câu trả lời không tương xứng hoàn toàn đối với các hành động bị kết tội - và phải nói rằng sự mô tả các hành động đó trong cáo buộc chính thức làm cho toàn bộ vụ kiện sặc mùi. Tôi đoán trước rằng có nhiều hơn câu chuyện này hơn là nhìn thấy, và rằng chúng ta sẽ được nghe thấy nhiều hơn trong quá trình xử.

Một cách trùng khớp, vấn đề tự do truy cập đối với các nghiên cứu được cấp vốn nhà nước cũng đang được thảo luận tại châu Âu:

Một tham vấn công khai về truy cập tới, và lưu giữ của, thông tin khoa học số đã được tung ra bởi Ủy ban châu Âu trong sáng kiến của Phó chủ tịch về Chương trình nghị sự số Neelie Kroes và Ủy viên hội đồng về Nghiên cứu và Đổi mới sáng tạo, Máire Geoghegan-Quinn. Các nhà nghiên cứu, các kỹ sư và doanh nhân châu Âu phải có sự truy cập dễ dàng và nhanh chóng tới các thông tin khoa học, để cạnh tranh bình đẳng với các đối tác khắp trên thế giới. Các hạ tầng số hiện đại có thể đóng một vai trò chính trong việc tạo điều kiện cho sự truy cập. Tuy nhiên, một số thách thức vẫn còn, như giá thành thuê bao cao và gia tăng đối với các xuất bản phẩm khoa học, một số lượng lớn chưa từng thấy các dữ liệu khoa học, và nhu cầu để chọn và lưu trữ các kết quả nghiên cứu.

Truy cập mở, được định nghĩa như là sự truy cập tự do tới nội dung hàn lâm qua Internet, có thể giúp truy cập được điều này.

Neelie Kroes, người vẫn là hiểu biết nhất của Ủy ban châu Âu khi nói về các công nghệ số, được trích đã nói:

“Các kết quả của nghiên cứu được nhà nước cấp vốn nên được lưu hành càng rộng rãi càng tốt như một vấn đề về nguyên tắc. Sự phổ biến tri thức rộng rãi, bên trong các lĩnh vực nghiên cứu của châu Âu và bên ngoài nó, là một động lực chủ chốt của sự tiến bộ trong nghiên cứu và đổi mới sáng tạo, và vì thế cho những công việc và sự tăng trưởng tai châu Âu. Tầm nhìn của chúng ta là Truy cập Mở đối với các thông tin khoa học sao cho tất cả chúng ta hưởng lợi được càng nhiều càng tốt từ những đầu tư trong khoa học. Để tăng tốc sự tiến bộ khoa học, nhưng cũng vì sự giáo dục, vì đổi mới sáng tạo và vì sự sử dụng lại sáng tạo khác. Vì lý do y hệt chúng ta phải gìn giữ các hồ sơ khoa học cho các thế hệ tương lai”

Các câu hỏi chính đang được đặt ra cho việc tham vấn là như sau:

Làm sao để các bài báo khoa học có thể truy cập được nhiều hơn đối với các nhà nghiên cứu và xã hội rộng lớn nói chung.

Làm sao để các dữ liệu có thể được làm cho sẵn sàng một cách rộng rãi và làm sao nó có thể được sử dụng lại.

Làm sao sự truy cập vĩnh viễn tới nội dung số có thể được đảm bảo và những rào cản nào đang ngăn trở sự lưu giữ các kết quả khoa học.

So, all-in-all, this looks to be a completely disproportionate response to the alleged actions - and it has to be said that the description of those actions in the formal indictment [.pdf] makes the whole case look pretty fishy. I predict that there's far more to this story than meets the eye, and that we'll be hearing much more on the subject in due course.

Coincidentally, the issue of free access to publicly-funded research is being discussed in Europe, too:

A public consultation on access to, and preservation of, digital scientific information has been launched by the European Commission on the initiative of European Commission Vice President for the Digital Agenda Neelie Kroes and Commissioner for Research and Innovation, Máire Geoghegan-Quinn. European researchers, engineers and entrepreneurs must have easy and fast access to scientific information, to compete on an equal footing with their counterparts across the world. Modern digital infrastructures can play a key role in facilitating access. However, a number of challenges remain, such as high and rising subscription prices to scientific publications, an ever-growing volume of scientific data, and the need to select, curate and preserve research outputs. Open access, defined as free access to scholarly content over the Internet, can help address this.

Neelie Kroes, who remains the most savvy of the European Commissioners when it comes to digital technologies, is quoted as saying:

"The results of publicly funded research should be circulated as widely as possible as a matter of principle. The broad dissemination of knowledge, within the European Research Area and beyond, is a key driver of progress in research and innovation, and thus for jobs and growth in Europe. Our vision is Open Access to scientific information so that all of us benefit as much as possible from investments in science. To accelerate scientific progress, but also for education, for innovation and for other creative re-use. For the same reason we must preserve scientific records for future generations".

The key questions being posed by the consultation are as follows:

how scientific articles could become more accessible to researchers and society at large

how research data can be made widely available and how it could be re-used

how permanent access to digital content can be ensured and what barriers are preventing the preservation of scientific output

Dịch tài liệu: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Không có nhận xét nào:

Đăng nhận xét

Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.