Thứ Sáu, 13 tháng 9, 2019

Giới thiệu và demo khai thác tài nguyên giáo dục mở ở trường Cao đẳng Sư phạm Thừa Thiên - Huế


  • Chào mừng hội thảo ‘Xây dựng và khai thác tài nguyên giáo dục mở’ do: (1) Hiệp hội các trường đại học, cao đẳng Việt Nam (AVU&C); (2) Hội Tin học Việt Nam (VAIP) cùng với 2 đơn vị trực thuộc là Câu lạc bộ Phần mềm Tự do Nguồn Mở Việt Nam (VFOSSA) và Câu lạc bộ các Khoa - Viện - Trường CNTT-TT (FISU); và (3) Hội Thư viện Việt Nam (VLA) sẽ đồng chủ trì và tổ chức vào ngày 04/10/2019 tại trường Đại học Thăng Long, Hà Nội,
  • Chào mừng Hội nghị Toàn thể của UNESCO sẽ diễn ra vào ngày 12/11/2019 tại Paris, Pháp, nơi các quốc gia thành viên sẽ bàn bạc và biểu quyết để thông qua khuyến cáo chính thức của UNESCO ủng hộ cho sự đầu tư toàn cầu vào 5 lĩnh vực hỗ trợ OER: (1) xây dựng năng lực, (2) phát triển chính sách hỗ trợ, (3) đảm bảo truy cập bình đẳng và có sự tham gia tới OER chất lượng, (4) các mô hình bền vững cho OER, và (5) hợp tác quốc tế.
Ngày 13/9/2019, trường Cao đẳng Sư phạm Thừa Thiên – Huế tổ chức tọa đàm ‘Tài nguyên Giáo dục Mở - OER’ với sự tham dự của các cán bộ giảng viên ngành CNTT và cán bộ Thư viện của nhà trường.


Tự do tải về tài liệu khóa học tại địa chỉ:




Blogger: Lê Trung Nghĩa

Thứ Năm, 12 tháng 9, 2019

Tìm điều mới trong những điều cũ



Là bài trình bày tại Security Bootcamp 2019 do Hiệp hội Internet Việt Nam tổ chức tại tỉnh Thừa Thiên – Huế trong các ngày 13-14/09/2019.

Tự do tải về bài trình bày tại địa chỉ:

Thứ Tư, 11 tháng 9, 2019

Các nguồn tốt nhất về các sách giáo khoa số tự do không mất tiền và hơn thế - Đoạn 2

Best Sources for Free Digital Textbooks and More
  • By Dian Schaffhauser
  • 03/25/19
Bài được đưa lên Internet ngày: 25/03/2019
Những gì chúng tôi thích: Bạn có thể, còn tranh cãi, tìm thấy tập hợp đắt giá nhất các văn bản khoa học máy tính và kỹ thuật điện tử ngay ở đây.
Sáng kiến này của Đại học Rice quảng cáo “các cuốn sách tự do không mất tiền, không lừa gạt”. Các chủ đề của 47 cuốn sách giáo khoa hiện sẵn sàng bao trùm các môn cơ bản: toán, khoa học, khoa học xã hội, nhân văn, kinh doanh và Đặt Cao cấp (Advanced Placement). Từng chủ đề được một nhóm các chuyên gia trng lĩnh vực đó phát triển và tgrair qua một “quy trình rà soát lại ngang hàng khắt khe”. Tổ chức phi lợi nhuận này vẫn tiếp tục điều chỉnh nội dung, tiết kiệm 600 triệu USD cho các sinh viên kể từ 2012, khi các sách giáo khoa của nó lần đầu xuất hiện.
Những gì chúng tôi thích: OpenStax CNX là một nhánh phục vụ như là kho trên trực tuyến cho nội dung được người sử dụng đệ trình, khuyến khích các nhà giáo dục chia sẻ tác phẩm của họ trong khi vẫn giữ lại sự thừa nhận và ghi công cho các nỗ lực của họ. Nội dung trên trang này có thể được tổ chức thành các sách giáo khoa pha trộn cho phù hợp hoặc được sử dụng như là chương trình giảng dạy bổ sung thêm. Cho tới nay, thư viện nội dung được cộng đồng tạo ra này có 20.000 đối tượng học tập, gồm khoảng 2.100 “cuốn sách”, các nhóm trang về một chủ đề nhất định.
Những trang khác đáng theo đuổi
Lưu trữ Sáng kiến Mức OER Mơ ước (Achieving the Dream's OER Degree Initiative)
Catalog này gồm các tư liệu OER được 26 trường cao đẳng cộng đồng đóng góp, họ đang tham gia trong một dự án tập trung vào việc loại bỏ khả năng chi trả và truy cập sách giáo khoa như các rào cản đối với sự thành công của sinh viên. Tổ chức này làm việc đó bằng việc sử dụng vốn trợ cấp để khuyến khích các giảng viên và các cơ sở của họ thiết kế các khóa học và các chương trình cấp bằng sử dụng OER thay vì các sách giáo khoa sở hữu độc quyền.
Những gì chúng tôi thích: Mọi thứ đã được Lumen Learning rà soát lại nội dung và cấp phép, và đặt chỗ cho các sách giáo khoa.
BCcampus OpenEd (Giáo dục Mở của BCcampus)
Dự án này được khởi động vào năm 2013 đề tập hợp các sách giáo khoa mở phù hợp với 40 lĩnh vực chủ đề có lượng tuyển sinh lớn nhất, tập trung vào thương mại (như khai khoáng và dầu khí), công nghệ và huấn luyện các kỹ năng. Bây giờ trang này đưa ra “các lời kêu gọi trợ giúp” để nhận diện và đáp ứng các chủ đề còn thiếu. Hiện hành, bộ sưu tập có 277 sách giáo khoa.
Những gì chúng tôi thích: 2 tuyển tập sách giáo khoa gốc rễ Hy lạp và Latin được giáo sư Peter Smith ở Đại học Victoria phát triển. Bạn đã có thúng tôi ở “fascinum”.
Sự thừa thãi các tư liệu học tập này đã được biên soạn từ Hệ thống Đại học Georgia. Việc chọn một chủ đề học thuật dẫn người sử dụng tới các đường liên kết các sách giáo khoa mở cùng với các tư liệu phụ trợ và thứ gì đó được gọi là “các bộ sưu tập trợ cấp” có thể tải về được với các phiên bản Word để xem lại nhanh. Có khoảng 60 sách giáo khoa.
Những gì chúng tôi thích: Dự án này đã cuốn hút những đóng góp từ các nhà chỉ dẫn ở 29 cơ sở của Georgia - chiếm gần 16% tổng số trong bang này.
Dự án này đặc thù theo một chủ đề duy nhất - tâm lý học – nhưng, có rất nhiều (105 module đáng giá). Các nhà tâm lý học từ khắp nơi trên thế giới đã phát triển nội dung, nó là sẵn sàng ở định dạng sách giáo khoa và có thể tùy biến được từ đó bởi người chỉ dẫn.

(Còn nữa)
What we like: You could, arguably, find the most extensive set of electrical engineering and computer science texts right here.
OpenStax
This Rice University initiative advertises "free books, no catch." Subjects of the 47 textbooks currently available cover the basics: math, science, social sciences, humanities, business and Advanced Placement. Each is developed by a crew of experts in the field and undergoes a "rigorous peer review process." This nonprofit just keeps cranking out the content, saving some $600 million dollars for students since 2012, when its textbooks first appeared.
What we like: OpenStax CNX is an offshoot that serves as an online repository for user-submitted content, encouraging educators to share their work while still retaining recognition and attribution for their efforts. Content on the site can be organized into mix-and-match textbooks or used as additional curriculum. So far, the community-created content library has 20,000 learning objects, including some 2,100 "books," groups of pages on a given topic.
Other Sites Worth Perusing
This catalog contains OER materials contributed by 26 of the community colleges that are participating in a project focused on removing textbook affordability and access as obstacles to student success. The organization is doing that by using grant funding to engage faculty and their institutions in redesigning their courses and degree programs to use OER instead of proprietary textbooks.
What we like: Everything has been through a content and licensing review by Lumen Learning, which hosts the textbooks.
This project kicked off in 2013 to gather open textbooks aligned with the top 40 highest-enrolled subject areas in the province of British Columbia. In 2014, the effort expanded to add 20 other textbooks focused on the trades (such as mining and oil and gas), technology and skills training. Now the site puts out "calls for help" to identify and fill in missing subjects. Currently, the collection has 277 textbooks.
What we like: A two-volume Greek and Latin Roots textbook developed by the late Professor Peter Smith at the University of Victoria. You had us at "fascinum."
This abundance of learning materials was compiled from the University System of Georgia. Choosing an academic subject leads the user to links for open textbooks along with ancillary materials and something called "grants collections," which can be downloaded in Word versions for quick revision. Textbooks number about 60.
What we like: This project has drawn contributions from instructors in 29 of Georgia's institutions — almost 16 percent of the state's total.
NOBA
This project specializes in a single topic — psychology — but, oh, how much there is to say (105 modules' worth). Psychologists from around the world have developed the content, which is available in textbook format and can be customized from there by the instructor.
Dịch: Lê Trung Nghĩa

Thứ Ba, 10 tháng 9, 2019

Các nguồn tốt nhất về các sách giáo khoa số tự do không mất tiền và hơn thế - Đoạn 1


Best Sources for Free Digital Textbooks and More
Để giúp các sinh viên của bạn giảm chi phí giáo dục của họ, hãy bắt đầu với các tài nguyên giáo dục mở. Nhiều sách giáo khoa đó sẽ không lấy của họ bất kỳ thứ gì.
To help your students reduce the cost of their education, begin with open educational resources. Many of these textbooks won't cost them anything.
  • By Dian Schaffhauser
  • 03/25/19
Bài được đưa lên Internet ngày: 25/03/2019
college student working on laptop surrounded by stacks of books
“Mở” đã trở thành điều chắc chắn. Theo tính toán công khai mới nhất, đã có gần 1,5 tỷ tác phẩm được cấp phép Creative Commons trên thế giới sẵn sàng để sử dụng trong dạy và học, bao gồm toàn bộ các khóa học, các sách giáo khoa, các hình ảnh, video, các câu đố, chương trình giảng dạy, bài giảng, bài tập về nhà, phòng thí nghiệm, các trò chơi và mô phỏng. Biết rằng có sự thừa thãi các tư liệu, có lẽ không ngạc nhiên nếu bạn cảm thấy choáng ngợp và không chắc chắn về nơi nào để bắt đầu tìm kiếm của bạn cho chương trình giảng dạy tự do để sử dụng trong các khóa học theo sự chăm sóc của bạn. Để trợ giúp, Campus Technology (Công nghệ Khu trường) đã phát triển danh sách các trang tốt nhất này để giành được các sách giáo khoa số tự do (và chi phí thấp).
4 tay chơi chính
Tay chơi này đáng được gọi là Mẹ của tài nguyên giáo dục mở - OER (Open Educational Resources), vì bạn không thể làm tốt hơn nhiều so với bắt đầu tìm kiếm nội dung OER của bạn ở đây. Một chương trình đã được hệ thống Đại học Bang California, MERLOT đã phát triển vượt ra khỏi các gốc rễ của nó như một hồ sơ các tư liệu học tập (khoảng 84,000 hạng mục khác nhau, tất cả chúng đều được lọc cao độ) bao quanh các cộng đồng OER; một nền tảng bộ xây nội dung (với việc đặt chỗ); và một tập hợp 23,000 "bộ sưu tập đánh dấu sách" được thiết lập bởi những người sử dụng thu thập các tài nguyên từ bộ sưu tập được tổ chức theo chủ đề, chuyên ngành hoặc nhãn.
Những gì chúng tôi thích: Lọc theo “Sách giáo kho (Truy cập) Mở” và bạn sẽ thấy gần 7.000 lựa chọn được/bị loại bỏ từ các nguồn dễ nhận biết (OpenSTAX và Amazon) cũng như cá nhân các tác giả những người đã đóng góp công việc của họ. Những gì tiện lợi là nội dung thường gồm “sự rà soát lại của ban biên tập” và “xếp hạng của người sử dụng” - từ 0 cho tới 5 sao.
Nội dung từ Lumen tới ở 3 dạng: Candela, nó chào các cuốn sách số “cực kỳ kham được” với văn bản, video, các tương tác và các dạng nội dung khác, bao trùm 37 khóa học được tính tới mới nhất - từng trong số đó có thể được soạn sửa để cho phép người chỉ dẫn “định hình nội dung” cho phù hợp với các kết quả đầu ra học tập, thời hạn, các nhu cầu của sinh viên và các ưu tiên khác. (Chi phí: 10 USD cho từng sinh viên được nhập học). Waymaker có 22 khóa học cho học tập nghiên cứu được cá nhân hóa và các hoạt động tương tác để khuyến khích các sinh viên thực hành và áp dụng việc học tập của họ. Và Quản lý Bài tập về nhà Trên trực tuyến - OHM (Online Homework Manager) là “động cơ” bài tập ở nhà cho toán học và các môn định lượng khác, với văn bản, video, các đánh giá tùy biến thích nghi, máy chấm điểm và “phản hồi tức thì” cho sinh viên.
Những gì chúng tôi thích: Các tài nguyên đó được thiết kế để thay thế các gói tư liệu khóa học đắt tiền bằng các lựa chọn ít đắt tiền hơn phù hợp với các nhu cầu của các giảng viên cho toàn bộ các yêu cầu - không chỉ nội dung, mà còn cả những điều khác.
Trang của Viện Công nghệ Massachusetts có toàn bộ các khóa học, nhưng cũng chuyên dành một trang cho các bản chào sách giáo khoa trên trực tuyến của nó, gồm các ấn bản điện tử được cấp phép mở của các cuốn sách in cùng với các cuốn sách và các ghi chép khóa học tự xuất bản trên trực tuyến mà là “rất kỹ lưỡng” và chúng có thể phục vụ như là các lựa chọn thay thế cho các sách giáo khoa truyền thống.
(Còn nữa)
"Open" has become a definite thing. According to the latest public accounting, there were nearly 1.5 billion Creative Commons-licensed works in the world available for use in teaching and learning, including whole courses, textbooks, images, videos, quizzes, syllabi, lectures, homework assignments, labs, games and simulations. Given that abundance of materials, it would be no surprise if you were to feel overwhelmed and unsure about where to start your search for free curriculum to use in the courses under your care. To help out, Campus Technology has developed this list of the best sites for obtaining free (and low-cost) digital textbooks.
4 Major Players
MERLOT
This one ought to be called the OER Mothership, since you couldn't do much better than to begin your OER content search here. A program begun by the California State University system, MERLOT has grown beyond its roots as a portfolio of learning materials (almost 84,000 different items, all of it highly filterable) to encompass OER communities; a content builder platform (with hosting); and an assemblage of 23,000 "bookmark collections" set up by users who gather resources from the collection organized by theme, topic or label.
What we like: Filter by "Open (Access) Textbook" and you'll find nearly 7,000 options culled from recognizable sources (OpenSTAX and Amazon) as well as individual authors who have contributed their work. What's nifty is that the content often includes an "editor review" and a "user rating" — from zero to five stars.
Content from Lumen comes in three forms: Candela, which offers "extremely affordable" digital books with text, video, interactives and other types of content, covering 37 courses at last count — each of which can be edited to allow the instructor "to shape the content" to fit learning outcomes, term length, student needs and other preferences. (Cost: $10 per enrolled student.) Waymaker has 22 courses for personalized study and interactive activities to encourage students to practice and apply their learning. And Online Homework Manager (OHM) is a homework "engine" for math and other quantitative subjects, with text, video, adaptive assessments, machine grading and "immediate feedback" for the students.
What we like: These resources are designed to replace costly packages of course materials with less expensive options that fit faculty needs for the whole caboodle — not just the content but also the extra stuff too.
This Massachusetts Institute of Technology site features whole courses, but also dedicates a page to its online textbook offerings, consisting of open-licensed electronic editions of print books along with self-published online books and course notes that are "so thorough" they could serve as alternatives to conventional textbooks.
Dịch: Lê Trung Nghĩa

Khóa bồi dưỡng ‘Thực hành khai thác tài nguyên giáo dục mở’ ở trường Cao đẳng Công nghệ Cao Hà Nội


Quang cảnh lớp thực hành khai thác OER ở Cao đẳng Công nghệ Cao Hà Nội
  • Chào mừng hội thảo ‘Xây dựng và khai thác tài nguyên giáo dục mở’ do: (1) Hiệp hội các trường đại học, cao đẳng Việt Nam (AVU&C); (2) Hội Tin học Việt Nam (VAIP) cùng với 2 đơn vị trực thuộc là Câu lạc bộ Phần mềm Tự do Nguồn Mở Việt Nam (VFOSSA) và Câu lạc bộ các Khoa - Viện - Trường CNTT-TT (FISU); và (3) Hội Thư viện Việt Nam (VLA) sẽ đồng chủ trì và tổ chức vào ngày 04/10/2019 tại trường Đại học Thăng Long, Hà Nội,
  • Chào mừng Hội nghị Toàn thể của UNESCO sẽ diễn ra vào ngày 12/11/2019 tại Paris, Pháp, nơi các quốc gia thành viên sẽ bàn bạc và biểu quyết để thông qua khuyến cáo chính thức của UNESCO ủng hộ cho sự đầu tư toàn cầu vào 5 lĩnh vực hỗ trợ OER: (1) xây dựng năng lực, (2) phát triển chính sách hỗ trợ, (3) đảm bảo truy cập bình đẳng và có sự tham gia tới OER chất lượng, (4) các mô hình bền vững cho OER, và (5) hợp tác quốc tế.
Trong các ngày 10 và 11/9/2019, Hiệp hội các trường đại học, cao đẳng Việt Nam đã phối hợp cùng với trường Cao đẳng Công nghệ Cao Hà Nội tổ chức khóa bồi dưỡng ‘Thực hành khai thác tài nguyên giáo dục mở’ cho 20 học viên là các cán bộ giảng viên của nhà trường.


Tự do tải về tài liệu khóa học tại địa chỉ:


Blogger: Lê Trung Nghĩa

Thứ Hai, 2 tháng 9, 2019

Hai điều kiện tiên quyết cho dữ liệu mở

(Bài đăng trên tạp chí Tia Sáng số 16, ra ngày 20/08/2019, trang 14-17. Phiên bản điện tử của Tia Sáng trên trực tuyến đăng ngày 26/08/2019 tại địa chỉ: http://www.tiasang.com.vn/-doi-moi-sang-tao/Hai-dieu-kien-tien-quyet-cho-du-lieu-mo-20567).
Dữ liệu là nền tảng cơ bản và quan trọng cho hàng loạt các công nghệ đương thời dựa vào nó như trí tuệ nhân tạo (AI), Internet của Vạn vật (IoT), dữ liệu lớn (Big Data). Dữ liệu được hình thành từ số hóa và/hoặc chuyển đổi số. Để quản lý tốt và tin cậy, máy đọc được, sử dụng lại được, lần vết được, và tránh đúp bản, thì số hóa và/hoặc chuyển đổi số, bên cạnh các việc khác, phải đi với: (1) mã nhận diện thường trực duy nhất phù hợp với các tiêu chuẩn quốc tế; và (2) cấp phép mở, nhất là đối với các dữ liệu được tạo ra từ cấp vốn nhà nước.
Trong một thế giới ngày càng được số hóa, mở và dựa vào dữ liệu như hiện nay, để có thể quản lý và lần vết được các tài nguyên số ngày càng trở nên thừa thãi trên Internet, cùng với nhu cầu mới của thời đại CMCN4 với yếu tố chưa từng có trước đây là máy đọc được, thế giới đã và đang hướng với việc xây dựng hệ thống các mã nhận diện thường trực duy nhất cho các đối tượng số. Cùng với điều đó, để có thể tạo ra được tri thức mới trong khi ‘đứng trên vai những người khổng lồ’, các tài nguyên tri thức ngày càng được chia sẻ và truy cập mở nhiều hơn trên Internet một cách hợp pháp nhờ vào việc cấp phép mở cho chúng để bất kỳ ai cũng có khả năng sử dụng lại chúng một cách hợp pháp, trong nhiều trường hợp vì bất kỳ mục đích gì, kể cả thương mại hóa nhưng vẫn đảm bảo tôn trọng bản quyền và các quyền hợp pháp của tác giả, tránh mọi rào cản về tài chính, pháp lý và kỹ thuật, đặc biệt là các tài nguyên được tạo ra từ các nguồn vốn cấp của nhà nước
 
A. Tiếp cận Dữ liệu Mở Liên kết - LOD (Linked Open Data) với quy tắc 4 điểm và lược đồ tiêu chuẩn 5 sao của Tim Berners-Lee
Vào ngày 27/07/2006, Tim Berners - Lee, nhà phát minh ra Web của các tài liệu siêu văn bản được kết nối với nhau những năm đầu thập niên 1990 với sự sử dụng các bộ định vị tài nguyên thống nhất - URL (Uniform Resource Locator), đã đề xuất một khái niệm mới, Web của dữ liệu (Web of Data) được kết nối với nhau với sự sử dụng các mã nhận diện tài nguyên thống nhất - URI (Uniform Resource Identifier). Cùng với nó, ông đã đưa ra đề xuất về Dữ liệu Liên kết (Linked Data) với quy tắc 4 điểm và lược đồ tiêu chuẩn 5 sao cho Dữ liệu Mở Liên kết - LOD (Linked Open Data)[1].
A.1 Mã nhận diện thường trực duy nhất trong tiếp cận Dữ liệu Mở Liên kết
Giải thích cho đề xuất này, Tim Berners-Lee nhấn mạnh tới khả năng sinh ra tri thức mới của LOD và khả năng máy đọc được, điều rất quan trọng trong CMCN4 với các công nghệ thời thượng như trí tuệ nhân tạo - AI (Artificial Intelligence), Internet của vạn vật - IoT (Internet of Things), hay Dữ liệu lớn (Big Data), và đặc biệt các mô hình kinh doanh mới dựa vào dữ liệu. Tương tự, ông cũng đưa ra giải thích về sự khác biệt giữa URI và URL, dù tranh luận về sự khác biệt giữa chúng và tên tài nguyên thống nhất – URN (Uniform Resource Name) tới nay vẫn chưa có hồi kết.
Hình 1. Khác biệt giữa các URI, URL và URN[2]
Đi theo tiếp cận LOD, nhiều quốc gia trên thế giới đã xây dựng cho mình các tài liệu URI cho mọi điều, từ hữu hình tới vô hình. Ví dụ, tại châu Âu, Eurovoc xây dựng tài liệu URI cho từng ngôn ngữ khác nhau của từng quốc gia châu Âu. Gần đây nhất, tài liệu Eurovoc, v4.9.1, 2019[3] đã được xuất bản ngày 17/04/2019 với các URI.


Hình 2. Trích từ tài liệu Eurovoc, v4.5, 2016, bản tiếng Anh[4] với các URI
Trên thực tế, URI và LOD không chỉ được sử dụng ở mức quốc gia, mà còn ở mức lĩnh vực và/hoặc ngành nghề. Ví dụ:
  • LandVoc[5] được sử dụng cho Dữ liệu Mở Liên kết (LOD) về đất đai
  • AgroVoc[6] được sử dụng cho Dữ liệu Mở liên kết (LOD) về nông nghiệp


A.2 Cấp phép mở trong tiếp cận Dữ liệu Mở Liên kết
Theo lược đồ tiêu chuẩn 5 sao cho Dữ liệu Mở Liên kết (LOD) trong đề xuất Web dữ liệu của Tim Berners-Lee như được minh họa trên Hình 3: (1) Để đạt được 1 sao, dữ liệu cần phải được cấp phép mở; (2) Để đạt được 2 sao, dữ liệu cần phải có 1 sao cộng thêm với máy đọc được; (3) Để đạt được 3 sao, dữ liệu cần phải có 2 sao cộng thêm với định dạng mở; (4) Để đạt được 4 sao, dữ liệu cần phải có 3 sao cộng thêm với URI; (5) Để có được 5 sao, dữ liệu cần phải có 4 sao cộng thêm với việc liên kết dữ liệu mức toàn cầu.
Hình 3. Lược đồ tiêu chuẩn 5 sao cho Dữ liệu Mở Liên kết (LOD)[7]


Tuân thủ với định nghĩa về Dữ liệu Mở, chỉ một số giấy phép mở có thể gắn cho dữ liệu để nó trở thành dữ liệu mở. Ngày nay, các giấy phép trong hệ thống giấy phép mở Creative Commons thường được sử dụng nhiều nhất khi cấp phép cho dữ liệu để nó trở thành dữ liệu mở, như các giấy phép CC BY, CC BY-SA và CC0.
Cũng có hệ thống giấy phép khác, như Open Data Commons License (Giấy phép Chung cho Dữ liệu Mở) được sử dụng để cấp phép cho dữ liệu; nó có các giấy phép tương tự như 3 giấy phép được nêu ở trên của Creative Commons, như trên Hình 4.
Hình 4. Các (hệ thống) giấy phép được sử dụng để cấp phép mở cho dữ liệu[8]

B. Tiếp cận theo nguyên tắc Dữ liệu Tìm thấy được, Truy cập được, Tương hợp được, Sử dụng lại được - FAIR (Findable, Accessible, Interoperable, Reusable)
Để hiểu chi tiết FAIR là gì và giải nghĩa từng ký tự của FAIR, có thể tham khảo phần ‘Định nghĩa FAIR[9]’ trong tài liệu EC xuất bản năm 2018 với tiêu đề ‘Biến FAIR thành hiện thực’.
Hình 5. Các nguyên tắc hướng dẫn FAIR


FAIR đã bắt đầu được Ủy ban châu Âu sử dụng trong dự án Thí điểm Dữ liệu Nghiên cứu Mở - ORD Pilot (Open Research Data Pilot)[10] trong chương trình Horizon 2020 giai đoạn 2014-2020 hiện nay là cách tiếp cận chủ đạo của EC cho dữ liệu/siêu dữ liệu.


B.1 Mã nhận diện thường trực duy nhất trong tiếp cận Dữ liệu FAIR
Hình 6. Mô hình các đối tượng FAIR
Theo tiếp cận FAIR, để có nghĩa và để là FAIR, dữ liệu và các đối tượng số khác đều phải đi với các mã nhận diện thường trực - PID (Persistent Identifier) cùng với siêu dữ liệu và tài liệu liên quan. Các mã nhận diện đó không chỉ là thường trực đối với một đối tượng số, mà thường là duy nhất trên phạm vi toàn cầu. Ví dụ các mã nhận diện thường trực duy nhất như:
  • Mã nhận diện đối tượng số - DOI (Digital Object Identifier)
  • Mã nhận diện các nhà nghiên cứu / những người đóng góp sáng tạo – ORCID (Open Researcher and Contributor ID);
  • Mã nhận diện tài nguyên nghiên cứu - RRID (Research Resource Identifiers)
B.2 Cấp phép mở trong tiếp cận Dữ liệu FAIR
Ngay cả khi chọn tiếp cận FAIR, cấp phép mở cũng là một khía cạnh không thể thiếu. Trong chương trình Horizon 2020 giai đoạn 2014-2020, châu Âu đã có Thí điểm Dữ liệu Nghiên cứu Mở - ORD Pilot (Open Research Data Pilot) chọn đi theo tiếp cận FAIR và khuyến cáo cấp phép mở bằng các giấy phép CC BY và CC0 của hệ thống giấy phép Creative Commons cho dữ liệu và siêu dữ liệu[11].
Còn trong Kế hoạch S cho giai đoạn 2021-2027, việc chọn tiếp cận vừa FAIR vừa MỞ là rõ ràng hơn, các giấy phép CC BY, CC BY-SA và CC0 của hệ thống Creative Commons được chỉ ra rõ ràng để cấp phép cho cả các xuất bản phẩm nghiên cứu và các dữ liệu nghiên cứu cùng các siêu dữ liệu[12].
Điều này cho thấy, việc cấp phép mở trong tiếp cận Dữ liệu FAIR cũng không khác so với của tiếp cận Dữ liệu Mở Liên kết với lược đồ tiêu chuẩn 5 sao được Tim Berners-Lee đề xuất, như được minh họa trong Hình 4
 
C. Mối quan hệ giữa 2 tiếp cận dữ liệu FAIR và MỞ
Để có chi tiết về mối quan hệ giữa FAIR và MỞ, xem phần ‘FAIR và dữ liệu Mở[13]’ trong tài liệu EC xuất bản năm 2018 với tiêu đề ‘Biến FAIR thành hiện thực’.
Dữ liệu FAIR được giải thích không nhất thiết phải là dữ liệu mở, kể cả trong ngữ cảnh của khoa học mở, vì có những lý do để các dữ liệu riêng tư của cá nhân và dữ liệu bí mật quốc gia không thể là mở được. Quan điểm của EC về dữ liệu là như sau:
Dữ liệu có thể là FAIR hoặc Mở, vừa là FAIR vừa là Mở, hoặc không là FAIR không là Mở. Các lợi ích lớn nhất tới khi dữ liệu vừa là FAIR vừa là Mở, vì khi không có các hạn chế sẽ hỗ trợ được rộng lớn nhất có thể cho sử dụng lại, và sử dụng lại ở phạm vi rộng. Để tối đa hóa những lợi ích của việc biến dữ liệu FAIR thành hiện thực, và trong ngữ cảnh của các sáng kiến Khoa học Mở, các nguyên tắc FAIR nên được triển khai kết hợp với yêu cầu chính sách rằng dữ liệu nghiên cứu nên là Mở mặc định - đó là, Mở trừ phi có lý do tốt để hạn chế truy cập hoặc sử dụng lại. Trong công thức của Ủy ban châu Âu gần đây, châm ngôn ‘càng mở càng tốt, đóng khi cần thiết’ (as open as possible, as closed as necessary) đã được giới thiệu, nó là sự khớp nối hữu ích các nguyên tắc đang được thi hành. Hơn nữa, các cố gắng nên được tiến hành để làm cho dữ liệu và siêu dữ liệu nghiên cứu truy cập được mà không lấy tiền của những người sử dụng đầu cuối. Bất kỳ việc lấy tiền nào hay chế độ phục hồi chi phí nào cũng nên là thích hợp và không ở mức làm hạn chế khả năng truy cập.
Từ quan điểm này, EC có khuyến cáo số 17 như sau:
Điều chỉnh phù hợp và hài hòa hóa chính sách dữ liệu FAIR và Mở. Các chính sách nên được điều chỉnh phù hợp và tăng cường để đảm bảo rằng dữ liệu nghiên cứu được nhà nước cấp vốn được làm thành FAIR và Mở, ngoại trừ các hạn chế hợp pháp. Châm ngôn ‘càng mở càng tốt, đóng khi có thể’ nên được áp dụng tương xứng với các nỗ lực thực sự tốt nhất để chia sẻ.
Nói một cách khác, mối quan hệ giữa FAIR và MỞ có thể được diễn giải là tính FAIR (FAIRness) càng cao thì càng nhanh tiệm cận tới tính MỞ (Openness), và ngược lại, tính mở càng cao thì càng nhanh tiệm cận tới tính FAIR.
Hình 7. Mối quan hệ giữa FAIR và MỞ

D. Gợi ý cho Việt Nam
Chuyển đổi số ở Việt Nam, dù là đi theo tiếp cận nào về dữ liệu, FAIR hay MỞ, hay vừa FAIR vừa MỞ, cũng đều cần thiết phải xây dựng hệ thống các mã nhận diện thường trực duy nhất cho các đối tượng số, phù hợp với các tiêu chuẩn quốc tế, cho cả các đối tượng hữu hình và vô hình, bao gồm các xuất bản phẩm dữ liệu nghiên cứu, để có thể quản lý tốt và tin cậy, sử dụng lại được, lần vết được, tránh đúp bản (đúp bản càng nhiều, rác dữ liệu cũng sẽ càng nhiều), và quan trọng hơn, để dữ liệu máy đọc được - một trong những đặc tính quan trọng bậc nhất để tiếp cận tới CMCN4, điều còn chưa rõ (các) cơ quan hay tổ chức nào sẽ chịu trách nhiệm xây dựng chúng. Có lẽ, ngành thư viện Việt Nam sẽ có vai trò chủ đạo, khi kết hợp với ngành công nghệ thông tin và truyền thông và các ngành khác có thể xây dựng hệ thống các mã thường trực duy nhất cho các đối tượng số cho Việt Nam.
Mặt khác, vì tính FAIR càng cao thì càng nhanh tiệm cận tới tính MỞ, trong khi để bất kỳ đối tượng số nào là mở, điều kiện tiên quyết là đối tượng số đó phải được cấp phép mở, công việc hầu như cũng chưa ở bất kỳ đâu, kể cả trong các cơ sở giáo dục mọi cấp ở Việt Nam, cũng chưa rõ (các) cơ quan nào sẽ chịu trách nhiệm phổ biến . Có lẽ là tốt nhất nếu cấp phép mở là môn học bắt buộcđược giảng dạy càng sớm càng tốt trong tất cả các cơ sở giáo dục ở tất cả các cấp, từ cấp tiểu học, đặc biệt trong toàn bộ hệ thống các trường sư phạm trên phạm vi toàn quốc ở Việt Nam.
Cuối cùng, mọi con đường đều dẫn tới giáo dục. Nó là đặc biệt đúng ở Việt Nam, khi gần 25 triệu người, khoảng 1/4 dân số Việt Nam, đang hàng ngày sống và làm việc trong khu vực giáo dục, nơi có ‘nguyên khí quốc gia’, nơi có lực lượng đông đảo nhất những người có khả năng giành được tri thức, đào sâu tri thức và tạo lập tri thức mới dựa vào tri thức sẵn có của thế giới, rất nhiều trong số chúng là các tri thức MỞ. Không có giáo dục đi cùng, CMCN4 - cách mạng của tri thức - khó có thể hiện thực hóa được trong thực tế, để tạo ra hàng loạt các sản phẩm và dịch vụ ‘Make in Vietnam’ trên diện rộng, theo đúng nghĩa của từ ‘Cách mạng’. 
 
E. Các chú giải
[1] Tim Berners-Lee, 27/07/2006: Linked Data: https://www.w3.org/DesignIssues/LinkedData.html
[2] Daniel Miessler, May 4, 2019: The Difference Between URLs, URIs, and URNs: https://danielmiessler.com/study/url-uri/
[5] LandPortal: LandVoc: https://landportal.org/voc/landvoc
[6] FAO, AIMS: AGROVOC Linked Open Data: http://aims.fao.org/standards/agrovoc/linked-data
[7] Tim Berners-Lee: 5 star Open Data: https://5stardata.info/en/
[8] Lê Trung Nghĩa biên dịch, 2018: Chỉ dẫn của nhà xuất bản về cấp phép dữ liệu mở: https://vnfoss.blogspot.com/2018/02/chi-dan-cua-nha-xuat-ban-ve-cap-phep-du.html
[9] Lê Trung Nghĩa biên dịch, 2019: Biến FAIR thành hiện thực: https://www.dropbox.com/s/wtiraui8svilgei/turning_fair_into_reality_1-Vi-30042019.pdf?dl=0, tr. 30-32
[10] Lê Trung Nghĩa biên dịch, 2019: Hướng dẫn của Hội đồng Nghiên cứu châu Âu về Triển khai Truy cập Mở tới các Xuất bản phẩm Khoa học và Dữ liệu Nghiên cứu trong các dự án được Hội đồng Nghiên cứu châu Âu hỗ trợ trong Horizon 2020: https://www.dropbox.com/s/lb0i9vr3t6cl1dt/h2020-hi-erc-oa-guide_en_Vi-06052019.pdf?dl=0, trang 8-9
[11] Lê Trung Nghĩa biên dịch, 2019: Hướng dẫn của Hội đồng Nghiên cứu châu Âu (ERC) về Triển khai Truy cập Mở tới các Xuất bản phẩm Khoa học và Dữ liệu Nghiên cứu trong các dự án được Hội đồng Nghiên cứu châu Âu hỗ trợ trong Horizon 2020: https://www.dropbox.com/s/lb0i9vr3t6cl1dt/h2020-hi-erc-oa-guide_en_Vi-06052019.pdf?dl=0, tr. 8, 10.
[12] Lê Trung Nghĩa biên dịch, 2019: Làm cho Truy cập Mở đầy đủ và tức thì thành hiện thực: https://www.dropbox.com/s/qv5adcecb47g65d/271118_cOAlitionS_Guidance-Vi-10042019.pdf?dl=0, phần ‘Cấp phép và các quyền’, tr. 7.
[13] Lê Trung Nghĩa biên dịch, 2019: Biến FAIR thành hiện thực: https://www.dropbox.com/s/wtiraui8svilgei/turning_fair_into_reality_1-Vi-30042019.pdf?dl=0, tr. 34-36


Giấy phép nội dung:
Trung Nghĩa


PS: Tự do tải về bài viết ở định dạng PDF ở địa chỉ: