Thứ Hai, 30 tháng 6, 2025

Viết là suy nghĩ: Nghịch lý của các mô hình ngôn ngữ lớn (LLM)


Writing is Thinking: The Paradox of Large Language Models

May 20, 2025 by opencontent

Theo: https://opencontent.org/blog/archives/7753

Bài được đưa lên Internet ngày: 20/05/2025

Tuần trước, tôi đã có cơ hội tuyệt vời để phát biểu tại Hội nghị thượng đỉnh AI thường niên lần thứ 3 tại UNC Charlotte. Toàn bộ sự kiện thật tuyệt vời và nhóm tổ chức thì thật tuyệt vời. Bài phát biểu chính của tôi không được ghi âm, vì vậy tôi nghĩ mình sẽ đăng thành nhiều bài đăng trên blog. Bài đăng này là bài đầu tiên trong loạt bài đó và phần này của bài phát biểu có tiêu đề Viết là suy nghĩ.

David McCullough đã nói, “Viết là suy nghĩ. Viết tốt là suy nghĩ rõ ràng. Đó là lý do tại sao việc này lại khó khăn đến vậy… Chúng ta đều biết câu nói cũ, ‘Tôi sẽ viết suy nghĩ của mình ra giấy.’ Có điều gì đó ở cây bút giúp tập trung não bộ theo cách mà không có thứ gì khác có thể làm được.”

Bạn có đồng ý không?

Rõ ràng là Plato không đồng ý. Chúng ta thường nghe trong các cuộc tranh luận về AI rằng Plato nghĩ rằng chữ viết, nếu nó trở nên phổ biến, sẽ đẩy xã hội thụt lùi thay vì tiến lên. Nhưng bất cứ khi nào chúng ta nghe những bản tóm tắt gián tiếp về bài viết của ai đó, tôi nghĩ chúng ta nên đọc bản gốc (hoặc ít nhất là bản dịch của bản gốc). Vì vậy, đây là một phần có liên quan từ Phaedrus (và vâng, tôi thực sự đã đọc trích dẫn mở rộng cho những người tham gia Hội nghị thượng đỉnh):

(Socrates nói với Phaedrus): Vâng, tôi nghe nói rằng ở Naucratis ở Ai Cập có một vị thần cổ đại của nơi đó, loài chim thiêng của vị thần này là loài mà người ta gọi là Ibis, trong khi tên của chính vị thần đó là Theuth. Ông là người đầu tiên phát hiện ra số và phép tính, hình học và thiên văn học, cũng như bản nháp và xúc xắc, và tất nhiên là chữ viết. Vào thời điểm đó, Thamus là Vua của toàn bộ Ai Cập khắp các thành phố lớn của vùng thượng lưu. Người Hy Lạp gọi thành phố này là Thebes của Ai Cập và họ gọi Thamus là Ammon. Theuth đã đến gặp vị Vua này để khoe những khám phá của mình, và ông đề xuất rằng chúng nên được truyền lại cho những người Ai Cập còn lại, và Thamus hỏi rằng mỗi người trong số họ có lợi ích gì, và khi Theuth giải thích điều này, ông đã khen ngợi bất cứ điều gì có vẻ đáng giá và chỉ trích bất cứ điều gì không. Bây giờ Thamus được cho là đã bày tỏ nhiều quan điểm cả tích cực và tiêu cực với Theuth về từng kỹ năng, vì vậy một bản tường thuật về những điều này sẽ khá dài. Nhưng khi bắt đầu viết, Theuth nói, “Thưa Đức Vua, ngành học này sẽ giúp người Ai Cập thông thái hơn và có trí nhớ tốt hơn, vì tôi đã khám phá ra một loại thuốc tiên cho cả trí nhớ và trí tuệ.” Nhà vua trả lời, “Ôi Theuth thông minh nhất, một người có thể phát minh ra những kỹ năng này, nhưng một người khác có thể đánh giá lợi ích hoặc tác hại của chúng đối với những người sẽ sử dụng chúng. Và bạn, với tư cách là cha đẻ của chữ viết, vì thái độ tích cực của bạn, bây giờ đang nói rằng nó làm ngược lại những gì nó có thể làm. Môn học này sẽ tạo ra sự lãng quên trong tâm hồn của những người học nó, vì họ sẽ không sử dụng trí nhớ. Vì niềm tin của họ vào chữ viết, họ sẽ được nhắc nhở bên ngoài bằng các dấu hiệu xa lạ, chứ không phải từ bên trong chính họ bằng chính họ. Vì vậy, bạn đã khám phá ra một loại thuốc tiên không phải của trí nhớ mà là của sự nhắc nhở. Bạn sẽ cung cấp cho các học viên một vẻ ngoài của trí tuệ, không phải là trí tuệ thực sự. Vì đã nghe rất nhiều mà không có bất kỳ lời dạy nào, họ sẽ có vẻ cực kỳ hiểu biết, trong khi phần lớn họ là những người thiếu hiểu biết, và là những người khó gần vì họ đã đạt được một trí tuệ có vẻ như nhưng không phải là người khôn ngoan.

Vậy ai đúng – Plato hay McCullough? Viết là một lời nguyền hay một ân huệ? Thực ra không có nhiều xung đột giữa hai tuyên bố đó. Plato đang nói về tác động của việc viết lên trí nhớ, trong khi McCullough đang nói về tác động của nó lên tư duy. Mặc dù có liên quan, nhưng đây chắc chắn là hai điều khác nhau. (Nhưng việc đặt câu hỏi "ai đúng?" và sau đó dành thời gian cho những người tham gia đã thúc đẩy một số cuộc trò chuyện nhóm nhỏ đầy năng lượng.)

Câu hỏi mà những người viện dẫn Plato trong các cuộc trò chuyện về AI ngụ ý là, "những gì chúng ta từ bỏ có giá trị nhiều hơn hay ít hơn những gì chúng ta đã có?" Hay nói cách khác, chúng ta có đánh đổi tất cả những gì chúng ta đã giành được từ việc viết trong hàng thiên niên kỷ để lấy lại khả năng ghi nhớ cá nhân phi thường mà tổ tiên chúng ta đã có không?

Gần đây, tôi đã suy ngẫm về những gì tôi nghĩ là "nghịch lý của các mô hình ngôn ngữ lớn". Nghịch lý của các mô hình ngôn ngữ lớn là bạn phải viết cho chúng để chúng viết cho bạn. Chúng ta đều quen thuộc với cụm từ "đầu vào rác, đầu ra rác". Nếu bạn viết một lời nhắc mơ hồ, không rõ ràng, không có tổ chức và không tập trung, mô hình sẽ cung cấp cho bạn đầu ra với những đặc điểm tương tự. Khi một người sử dụng LLM lần đầu tiên và có trải nghiệm kém ("Tôi biết rằng sự cường điệu về AI này chỉ là sự cường điệu quá mức!"), lý do thường là do lời nhắc kém từ phía họ chứ không phải do điểm yếu của mô hình. Sử dụng LLM cho hầu hết các nhiệm vụ, trừ những nhiệm vụ tầm thường nhất, đòi hỏi phải có văn bản rõ ràng, cụ thể, tập trung, có tổ chức tốt, v.v. Và nhiệm vụ bạn muốn LLM thực hiện càng phức tạp thì văn bản của bạn càng phải hiệu quả và mạnh mẽ.

Bây giờ, các giảng viên có thể ngắt lời ở đây để hỏi, "Nếu đúng như vậy, thì làm sao học sinh của tôi - nhiều người trong số họ là những cây bút non nớt - có thể sử dụng AI để tạo ra bài viết 'A' cho các bài tập viết của tôi?" Tôi thích câu hỏi này. Hãy dành một chút thời gian để suy ngẫm về câu trả lời cho câu đố này.

Câu trả lời, tất nhiên, là học sinh đang sử dụng bài tập của bạn làm lời nhắc của họ! Và - hy vọng - hướng dẫn cho bài tập của bạn được viết theo cách rõ ràng, cụ thể, tập trung và không mơ hồ.

Do đó, nếu bạn có một học sinh nói điều gì đó như, "Tại sao tôi cần nắm vững các khái niệm cốt lõi của khóa học này? AI có thể làm tất cả công việc của tôi cho tôi ngay bây giờ và sau khi tốt nghiệp!" câu trả lời là: “Sau khi bạn tốt nghiệp, sẽ không có ai ở đó để viết lời nhắc cho bạn – bạn sẽ phải tự viết chúng. Khi bạn cố gắng sử dụng AI vào ngày đầu tiên trong công việc mới của mình, bạn sẽ phải hiểu đủ rõ về lĩnh vực này để biết phải yêu cầu AI làm gì – sử dụng đúng từ vựng, theo đúng cách, với đủ sự rõ ràng và cụ thể để có được kết quả chất lượng. Và nếu bạn không có kiến thức và kỹ năng cần thiết để viết hiệu quả, ngày đầu tiên của bạn trong công việc có thể là ngày cuối cùng của bạn.

Nghĩ về tầm quan trọng của việc viết trong tương lai – cụ thể là hiểu rằng đó là một kỹ năng quan trọng để sử dụng hiệu quả LLM – khiến tôi tự hỏi liệu chúng ta có thấy một phương thức viết mới được dạy trong các khóa học Viết tiếng Anh của mình không. Trong lớp Viết tiếng Anh ngày nay, chúng ta thường học về cách viết giải thích, cách viết thuyết phục, cách viết mô tả, v.v. Có lẽ phương thức mới này sẽ được gọi là “viết tạo sinh (generative writing)?” Dù được gọi là gì, thì viết cho LLM cũng khác với các phương thức viết khác. Đầu tiên, đối tượng là khác – chúng ta viết cho LLM chứ không phải con người. Và thứ hai, chúng ta tham gia vào một số sự kết hợp mới lạ giữa phân tích quy trình và viết thuyết phục, cố gắng giải thích cho mô hình những gì chúng ta muốn nó làm và thực sự khiến nó làm điều đó. Viết tạo sinh không chỉ khác với bất kỳ loại viết nào khác mà chúng ta đang dạy hiện nay, mà còn có lẽ là phương thức viết có giá trị kinh tế nhất mà một sinh viên có thể học được ngày nay.

Tôi nghĩ gọi đây là “viết tạo sinh” hữu ích hơn nhiều so với gọi nó là “kỹ thuật nhắc” (prompt engineering), vì cách trước kết nối chúng ta với một khối lượng lớn các tài liệu, truyền thống và sự uyên thâm trong giảng dạy, trong khi cách sau thì không.

Last week I had the amazing opportunity to speak at the 3rd Annual AI Summit at UNC Charlotte. The entire event was wonderful and the organizing team were terrific. My keynote wasn’t recorded, so I thought I would serialize it across a series of blog posts. This post is the first in that series, and this section of the talk was titled Writing Is Thinking.

David McCullough said, “Writing is thinking. To write well is to think clearly. That’s why it’s so hard… We all know the old expression, ‘I’ll work my thoughts out on paper.’ There’s something about the pen that focuses the brain in a way that nothing else does.”

Do you disagree?

Apparently, Plato disagreed. We frequently hear in the debates about AI that Plato thought that writing, if it became widespread, would move society backward instead of forward. But any time we hear these secondhand summaries of someone’s writing, I think it behooves us to go read the original (or, at least a translation of the original). So here’s a relevant section from Phaedrus (and yes, I actually read the extended quote to the Summit participants):

(Socrates to Phaedrus): Well, I heard that at Naucratis in Egypt there was a certain ancient god of that place, whose sacred bird is the one they call the Ibis, while the name of the divine being himself was Theuth. He was first to discover number and calculation, geometry and astronomy, and also draughts and dice, and of course writing. Now at that time, Thamus was King of all Egypt round about the great city of the upper region. The Greeks call this city Egyptian Thebes and they refer to Thamus as Ammon. Theuth went to this King to show off his discoveries, and he proposed that they should be passed on to the rest of the Egyptians, and Thamus asked what benefit each of them possessed, and as Theuth explained this he praised whatever seemed worthwhile and criticised whatever did not. Now Thamus is said to have expressed many views both positive and negative to Theuth about each of the skills, so an account of these would be quite lengthy. But when he came to writing, Theuth said, “This branch of learning, O King, will make the Egyptians wiser and give them better memories, for I have discovered an elixir of both memory and wisdom.” The King replied, “Oh most ingenious Theuth, one man is able to invent these skills, but a different person is capable of judging their benefit or harm to those who will use them. And you, as the father of writing, on account of your positive attitude, are now saying that it does the opposite of what it is able to do. This subject will engender forgetfulness in the souls of those who learn it, for they will not make use of memory. Because of their faith in writing, they will be reminded externally by means of unfamiliar marks, and not from within themselves by means of themselves. So you have discovered an elixir not of memory but of reminding. You will provide the students with a semblance of wisdom, not true wisdom. For having heard a great deal without any teaching they will seem to be extremely knowledgeable, when for the most part they are ignorant, and are difficult people to be with because they have attained a seeming wisdom without being wise.

So who is right – Plato or McCullough? Is writing a curse or a boon? There’s actually not as much conflict between the two statements as there might appear. Plato is talking about writing’s effect on memory, while McCullough is talking about its effect on thinking. While related, these are definitely two different things. (But asking the “who’s right?” question and then giving participants some time catalyzed some energetic small group conversations.)

The question implied by those who invoke Plato in conversations about AI is, “was what we gave up worth more or less than what we got in exchange?” Or in other words, would we trade all that we’ve gained from writing over the millennia to regain access to the prodigious individual capacities for memory our ancestors had?

Recently I’ve been pondering what I think of as “the paradox of large language models.” The paradox of large language models is that you have to write for them in order to get them to write for you. We’re all familiar with the phrase “garbage in, garbage out.” If you write a prompt that is vague, ambiguous, disorganized, and unfocused, the model will give you output with those same characteristics. When a person uses an LLM for the first time and has a poor experience (“I knew this AI hype was all overblown exaggeration!”), the reason is often attributable to poor prompting on their part as opposed to a weakness in the model. Using an LLM for all but the most trivial tasks requires writing that is clear, specific, focused, well-organized, etc. And the more complex the task you want the LLM to perform, the more effective and powerful your writing has to be.

Now, instructors might interrupt here to ask, “If that’s true, then how are my students – many of whom are such immature writers – able to use AI to produce ‘A’ work on my writing assignments?” I love this question. Take a moment to reflect on what the answer to this riddle might be.

The answer, of course, it that students are using your assignments as their prompts! And – hopefully – the instructions for your assignments are written in a manner that is clear, specific, focused, and unambiguous.

Consequently, if you have a student who says something like, “Why do I need to master the core concepts of this course? AI can do all my work for me both now and after graduation!” the answer is: “After you graduate, there won’t be anyone there to write your prompts for you – you’ll have to write them yourself. When you try to use AI the first day on your new job you’ll have to understand the domain well enough to know what to ask the AI to do – using the right vocabulary, in the right way, with enough clarity and specificity to get a quality result. And if you don’t have the knowledge and skills you need to write that effectively, your first day on the job might be your last.”

Thinking about the importance of writing going forward – specifically, understanding that it’s a critical skill for the effective use of LLMs – makes me wonder if we’re not going to see a new mode of writing taught in our English Composition courses. In an English Composition class today we often learn about expository writing, persuasive writing, descriptive writing, etc. Maybe this new mode will be called “generative writing?” Whatever it’s called, writing for LLMs is different from other modes of writing. First, the audience is different – we’re writing for LLMs and not humans. And second, we’re engaged in some novel combination of process analysis and persuasive writing, trying to explain to the model what we want it do and actually get it to do it. Not only is generative writing unlike any other kind of writing we teach currently, it’s also probably the most economically valuable mode of writing a student could learn today.

I think calling this “generative writing” is far more useful than calling it “prompt engineering,” since the former connects us to a rich body of literatures and traditions and scholarship of teaching, while the latter does not.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Chủ Nhật, 29 tháng 6, 2025

Đặt tên cho mọi thứ thật khó: Từ OELM đến GOLE

Naming Things is Hard: From OELMs to GOLEs

April 8, 2025 by opencontent

Theo: https://opencontent.org/blog/archives/7731

Bài được đưa lên Internet ngày: 08/04/2025

Trong những cuộc trò chuyện gần đây, một số người mà tôi đã nói chuyện đã bối rối về cụm từ "mô hình ngôn ngữ giáo dục mở" - OELM (Open Education Language Model) mà tôi đã sử dụng để mô tả dòng công việc mới mà tôi đang theo đuổi. Không thể tránh khỏi, họ đã kết thúc bằng suy nghĩ rằng thuật ngữ này chỉ đề cập riêng đến thành phần mô hình ngôn ngữ tạo sinh của hệ thống và loại trừ bộ công cụ, nội dung và lời nhắc tích hợp rộng hơn. Tôi thừa nhận rằng, tôi có thể thấy cách họ đi đến kết luận đó. Vì vậy, trước khi cái tên OELM được chú ý, tôi sẽ chuyển sang một cái tên mới, mang tính mô tả hơn: "môi trường học tập mở tạo sinh" (GOLE).

Với công việc mà tôi đang cố gắng thực hiện (mà tôi đã mô tả trong bài viết trước đây của mình về OELM), tôi nghĩ rằng "môi trường học tập mở tạo sinh" chính xác và mang tính mô tả nhất có thể đối với một cụm từ gồm ba đến năm từ. Và đó là một cụm từ không có lịch sử hoặc định nghĩa hiện hành:



Vậy, đây là định nghĩa về “môi trường học tập mở tạo sinh”:

Môi trường học tập mở tạo sinh - GOLE (Generative Open Learning Evironmet) là các hệ thống kết hợp các mô hình AI tạo sinh, nội dung giáo dục, lời nhắc sư phạm và phần mềm để hỗ trợ người học trong quá trình học tập. Các mô hình, nội dung, lời nhắc và phần mềm này nằm trong phạm vi công cộng hoặc đã được phát hành theo giấy phép bản quyền mở cho phép chúng được giữ lại, sửa đổi, phối lại, sử dụng lại và phân phối lại.

Chủng loại artificial intelligence, gole, oelm

In recent conversations, several people I’ve talked to have been confused by the phrase “open educational language models” (OELMs) that I’ve been using to describe the new line of work I’m pursuing. Inevitably, they’ve ended up thinking that the term refers exclusively to the generative language model component of the system, and excludes the broader set of integrated tools, content, and prompts. I can, admittedly, see how they arrive at that conclusion. So before the name OELMs gains any traction, I’m going to switch to a new, more descriptive name: “generative open learning environments” (GOLEs).

Given the work I’m trying to do (which I’ve described in my previous writing about OELMs), I think “generative open learning environments” is about as accurate and descriptive as a three to five word phrase can be. And it’s a phrase with no existing history or definition:

So, here’s the definition of “generative open learning environments”:

Generative Open Learning Environments (GOLEs) are systems that combine generative AI models, educational content, pedagogical prompts, and software to support learners in their learning. These models, content, prompts, and software either reside in the public domain or have been released under an open copyright license that permits them to be retained, revised, remixed, reused, and redistributed.

Categories artificial intelligence, gole, oelm

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Năm, 26 tháng 6, 2025

Nơi Giáo dục Mở Gặp AI Tạo sinh: OELM


Where Open Education Meets Generative AI: OELMs

December 13, 2024 by opencontent

Theo: https://opencontent.org/blog/archives/7628

Bài được đưa lên Internet ngày: 13/12/2024

CẬP NHẬT: Tôi đã đổi tên của loạt bài này từ “các mô hình ngôn ngữ giáo dục mở” thành “các môi trường học tập mở tạo sinh” như được giải thích ở đây. Mặc dù tên đã thay đổi, các mục tiêu và cách tiếp cận tới các bài đó vẫn giữ nguyên.

Lời nói đầu

Người phụ nữ phi thường đã hướng dẫn tôi trong suốt thời gian học sau đại học và đồng chủ trì ủy ban tiến sĩ của tôi, Tiến sĩ Laurie Nelson, thường xuyên nói chuyện với tôi về ý tưởng "suy nghĩ tốt nhất hiện tại". Việc mô tả một cái gì đó là "suy nghĩ tốt nhất hiện tại" của bạn cho phép bạn chia sẻ vị trí của mình trong công việc đồng thời làm rõ rằng suy nghĩ của bạn vẫn sẽ phát triển trong tương lai.

Điều cực kỳ quan trọng cần nhớ là cả giáo dục mở và AI tạo sinh đều là công cụ và phương pháp tiếp cận - chúng là phương tiện để đạt được mục đích, phương pháp để hoàn thành mục tiêu hoặc giải quyết vấn đề. Tôi quan tâm đến việc giải quyết các vấn đề về khả năng tiếp cận và hiệu quả trong giáo dục. Tôi nghĩ rằng giáo dục mở và AI tạo sinh có nhiều điều để cung cấp hướng giải quyết cho những vấn đề này. Nhưng ngay từ đầu, tôi muốn cảnh báo tất cả chúng ta (kể cả tôi) không nên quá say mê giáo dục mở hoặc AI tạo sinh trong chính bản thân chúng. Như người ta nói, bạn nên yêu vấn đề của mình, chứ không phải giải pháp của mình.

Dưới đây là suy nghĩ tốt nhất hiện tại của tôi về cách giáo dục mở và AI tạo sinh có thể kết hợp với nhau để giúp chúng ta đạt được tiến bộ trong các vấn đề về khả năng tiếp cận và hiệu quả. Nó chắc chắn sẽ phát triển trong tương lai.

Giới thiệu

Bozkurt và hơn 40 đồng tác giả (Bozkurt, et al., 2024) cung cấp một danh mục toàn diện về những cách mà AI tạo sinh có thể gây hại cho giáo dục. Danh sách đó bao gồm:

Khoảng cách số và bất bình đẳng trong giáo dục

GenAI có thể làm trầm trọng thêm tình trạng bất bình đẳng hiện có trong giáo dục:

  • Quyền truy cập không bình đẳng: Chi phí cao của các công cụ GenAI tiên tiến cùng với các yêu cầu về cơ sở hạ tầng hạn chế khả năng tiếp cận của sinh viên và các tổ chức kém may mắn.

  • Mở rộng khoảng cách: Những người có quyền truy cập vào các dịch vụ GenAI cao cấp có thể đạt được những lợi thế làm tăng sự chênh lệch giữa những người học giàu có và những người học kém may mắn.

  • Bất bình đẳng toàn cầu: Các nước đang phát triển có thể thiếu cơ sở hạ tầng để hỗ trợ GenAI, cản trở sự tiến bộ của giáo dục.

Thương mại hóa và tập trung quyền lực

Việc phát triển và kiểm soát GenAI do vài tập đoàn lớn chi phối, gây ra một số lo ngại:

  • Big Tech kiếm lời: Các công ty có thể ưu tiên lợi nhuận hơn các cân nhắc về đạo đức, tác động tiêu cực đến giáo dục.

  • Hợp tác hạn chế với giới hàn lâm: Việc thiếu quan hệ đối tác giữa các công ty công nghệ và các tổ chức giáo dục cản trở sự đổi mới và minh bạch.

  • Độc quyền kiến thức: Việc tập trung phát triển GenAI trong các tập đoàn có thể dẫn đến việc kiểm soát thông tin và nội dung giáo dục.

Thiếu sự đại diện

GenAI có thể phản ánh và duy trì sự thiên vị của xã hội thông qua:

  • Quan điểm lấy phương Tây làm trung tâm: Các mô hình GenAI được đào tạo chủ yếu trên dữ liệu phương Tây có thể không thể hiện đầy đủ sự đa dạng toàn cầu.

  • Hạn chế về ngôn ngữ: Sự chênh lệch giữa các ngôn ngữ có nhiều tài nguyên và ít tài nguyên có thể gây bất lợi cho những người không nói tiếng Anh.

  • Đồng nhất hóa văn hóa: GenAI có thể thúc đẩy một thế giới quan hạn hẹp, kìm hãm sự khác biệt về văn hóa.

Những lo ngại này có vẻ quen thuộc với những người làm việc trong lĩnh vực giáo dục mở. Đây là nhiều vấn đề tương tự mà những người ủng hộ giáo dục mở đã nêu ra về sách giáo khoa độc quyền và các tài liệu học tập độc quyền khác trong nhiều thập kỷ. Và cũng giống như tính mở là một công cụ mạnh mẽ để chống lại những vấn đề này bằng các tài liệu học tập truyền thống, tính mở có vai trò quan trọng trong việc giải quyết những lo ngại này bằng AI tạo sinh.

Hiểu về LLM (Mô hình ngôn ngữ lớn) như Tài liệu khóa học

Trong vài năm tới, tài liệu khóa học có khả năng sẽ chuyển từ định dạng trông giống sách giáo khoa truyền thống sang định dạng trông giống mô hình ngôn ngữ lớn (LLM) và các công cụ AI tạo sinh khác. Việc chuyển sang các công cụ này, đi kèm với những rủi ro như đã mô tả ở trên, đe dọa làm xói mòn tiến trình quan trọng hướng tới khả năng chi trả, khả năng tiếp cận và công bằng mà phong trào giáo dục mở đã đạt được. Hiểu rằng LLM là tài liệu khóa học có thể giúp chúng ta suy nghĩ rõ ràng hơn về tương lai của tài liệu khóa học có thể trông như thế nào và tại sao mở vẫn tiếp tục quan trọng trong tương lai.

Các nhà xuất bản tài liệu giáo dục lớn như Pearson, McGraw-Hill và Cengage dành rất nhiều thời gian và tiền bạc để tạo ra tài liệu khóa học độc quyền. Vì những sản phẩm này rất tốn kém và mất nhiều thời gian để tạo ra (đôi khi lên tới hàng triệu đô la cho mỗi sản phẩm), nên hầu hết các giảng viên đều áp dụng một trong những tài nguyên có sẵn này thay vì tự tạo ra tài nguyên của riêng mình.

Khoảng 25 năm trước, các cá nhân và sau đó là các tổ chức bắt đầu tạo ra các giải pháp thay thế được cấp phép mở cho các sản phẩm độc quyền này. Các nhà xuất bản OER lớn như OpenStax, Lumen và CMU OLI dành rất nhiều thời gian và tiền bạc để tạo ra nội dung mở. Các OER này có giá cả phải chăng hơn đáng kể so với các giải pháp thay thế độc quyền và, nhờ có giấy phép mở, có thể đóng vai trò là nền tảng cho nhiều cải tiến trong giảng dạy và học tập.

Trong không gian AI tạo sinh, các công ty như OpenAI, Anthropic và Google dành rất nhiều thời gian và tiền bạc để tạo ra các LLM độc quyền. Vì các LLM này rất tốn kém và mất nhiều thời gian để tạo ra (có thể lên tới hơn một trăm triệu đô la cho mỗi mô hình), nên hầu hết mọi người cuối cùng sử dụng một trong những mô hình này thay vì tự tạo ra mô hình của riêng họ.

Vài năm trước, các tổ chức bắt đầu tạo ra các giải pháp thay thế được cấp phép mở cho các LLM độc quyền này. Các tổ chức như Meta, Mistral và IBM dành nhiều thời gian và tiền bạc để tạo ra các LLM và cấp phép mở các trọng số mô hình để mọi người có thể giữ lại, tái sử dụng, sửa đổi, phối lại và phân phối lại chúng. Các mô hình "nền tảng" này cung cấp nền tảng mà trên đó bạn có thể xây dựng nhiều sáng kiến trong giảng dạy và học tập.

Người sáng tạo ra các tài liệu khóa học độc quyền

Người sáng tạo ra các tài liệu khóa học mở

Pearson, McGraw-Hill, Cengage

OpenStax, Lumen, CMU OLI


Người sáng tạo ra LLM độc quyền

Người sáng tạo ra LLM mở

OpenAI, Anthropic, Google

Meta, Mistral, IBM


Một hiểu biết quan trọng mà tôi có được thông qua kinh nghiệm đau thương trong 26 năm qua là: phần lớn giảng viên sẽ không áp dụng OER trừ khi nó đi kèm với tất cả các tài liệu bổ sung và các cải tiến chất lượng cuộc sống khác do các nhà xuất bản truyền thống cung cấp - slide bài giảng, bài tập có tiêu chí chấm điểm, bài tập về nhà được chấm điểm tự động, ngân hàng câu hỏi trắc nghiệm, v.v. (Một số ít giảng viên sẽ áp dụng mà không có những thứ này là những người thích tự tạo tài liệu bổ sung của riêng họ.) Chúng ta có thể mong đợi xu hướng áp dụng LLM trông tương tự.

Hãy nghĩ, trong một khoảnh khắc, về LLM như là "sách giáo khoa" của giai đoạn tiếp theo của tài liệu khóa học. Mặc dù tôi chưa sẵn sàng dự đoán rằng OpenAI, Anthropic và Google sẽ thay thế Pearson, McGraw-Hill và Cengage, nhưng tôi hoàn toàn sẵn sàng dự đoán rằng các nhà xuất bản lớn sẽ bắt đầu tạo ra các gói tài liệu bổ sung độc quyền được thiết kế riêng để sử dụng với các mô hình ngôn ngữ độc quyền. Thật khó để nói chính xác điều này sẽ như thế nào, nhưng có một điều chắc chắn: sự khác biệt trong thiết kế và định dạng của tài liệu khóa học trước và sau AI tạo ra sẽ còn rõ rệt hơn sự khác biệt giữa thiết kế và định dạng của tài liệu khóa học trước và sau Internet.

Thay vì chờ đợi cho đến khi các công cụ AI tạo ra độc quyền được áp dụng rộng rãi trên thị trường tài liệu khóa học và cần nỗ lực đáng kể để thay thế chúng, chúng ta nên chủ động ngay từ bây giờ để đảm bảo rằng những người hướng dẫn muốn sử dụng LLM làm tài liệu khóa học có thể tiếp cận các tùy chọn chất lượng cao, được cấp phép mở ngay từ đầu. Các tùy chọn đó phải bao gồm cả bản thân các mô hình và các tài nguyên bổ sung cần thiết để sử dụng chúng một cách dễ dàng và hiệu quả. Việc tạo và chia sẻ các Mô hình ngôn ngữ giáo dục mở (Open Education Language Model), hay OELM (phát âm là "elms"), là một ví dụ về một bước chủ động mà chúng ta có thể thực hiện để đảm bảo rằng các công cụ AI tạo ra có thể giúp chúng ta tiến lên về khả năng chi trả, khả năng tiếp cận và công bằng thay vì thụt lùi. (Chắc chắn là có nhiều bước khác có thể thực hiện. Đây là bước mà tôi hiện đang thực hiện.)

Mô hình ngôn ngữ giáo dục mở

Mô hình ngôn ngữ giáo dục mở (OELM) tập hợp một bộ sưu tập các thành phần được cấp phép mở cho phép sử dụng một mô hình ngôn ngữ được cấp phép mở một cách dễ dàng và hiệu quả để hỗ trợ việc giảng dạy và học tập.

Thành phần cơ bản của OELM là một tập hợp các trọng số mô hình, là "bộ não" của mô hình ngôn ngữ. Meta, IBM, Mistral, Alibaba và nhiều công ty khác đã tạo ra và chia sẻ các trọng số mô hình chất lượng cao, được cấp phép mở và tốn hàng chục triệu đô la - thậm chí có thể hơn một trăm triệu đô la - để tạo ra. Nếu chúng ta sử dụng chúng chính xác như chúng ta tìm thấy chúng, việc tương tác với các mô hình này thực sự có thể dẫn đến một số tác hại được mô tả ở trên. Nhưng vì các trọng số mô hình là mở, nên chúng ta có cơ hội sửa đổi và phối lại chúng. Vì các trọng số mô hình là mở, nên chúng ta có thể thay đổi cách người học và giáo viên tương tác với chúng để tăng khả năng tiếp cận, khả năng chi trả và công bằng. Vì các trọng số mô hình là mở, nên chúng ta có quyền tự quyết lớn hơn đáng kể.

Trong OELM, các trọng số mô hình mở được bổ sung bởi các thành phần khác giúp chúng dễ sử dụng hơn, giải quyết các mối quan tâm chính về AI tạo sinh trong giáo dục và trả lời các câu hỏi bao gồm:

  • Làm thế nào để tôi sử dụng nó một cách hiệu quả?

  • Tôi có thể tin tưởng vào các phản hồi của nó là chính xác không?

  • Tôi có thể tin tưởng vào tính phù hợp của hành vi đó không?

Tôi sử dụng nó hiệu quả như thế nào? Một OELM bao gồm một bộ sưu tập toàn diện các lời nhắc được viết sẵn. Những lời nhắc này được thiết kế để hỗ trợ nhiều hoạt động khác nhau. Đối với người học, các hoạt động này có thể bao gồm các cuộc tranh luận, lập luận hoặc đối thoại, khám phá các khái niệm và ý tưởng mở, đặt câu hỏi làm rõ và nhận được câu trả lời cá nhân hóa, và tham gia vào quá trình đánh giá tương tác với phản hồi chẩn đoán ngay lập tức. Đối với giáo viên, các hoạt động này có thể bao gồm lập kế hoạch bài học, thiết kế bài tập học tập tích cực để sử dụng trong lớp học, phân biệt hướng dẫn, sửa đổi hoặc phối lại OER và soạn thảo phản hồi về bài tập của học sinh.

Tôi có thể tin tưởng vào phản hồi của nó là chính xác không? Một OELM bao gồm một bộ sưu tập OER được quản lý mà mô hình đó sử dụng để tạo sinh tăng cường truy xuất - RAG (Retrieval Augmented Generation). RAG là một quy trình mà các phản hồi của các mô hình được làm chính xác hơn và hoạt động như sau. Khi giáo viên hoặc người học gửi lời nhắc cho mô hình, trước khi lời nhắc được gửi đến mô hình, thông tin có liên quan sẽ được tìm kiếm trong bộ sưu tập OER và được thêm vào lời nhắc. Sau đó, mô hình sử dụng thông tin đã lấy từ OER làm cơ sở cho phản hồi của mình với người dùng, tăng cường kiến thức chung về chủ đề trước khi tạo ra phản hồi. Về mặt khái niệm, điều này tương tự như cách một thủ thư có thể tham khảo một tác phẩm tham khảo trước khi trả lời một câu hỏi.

Tôi có thể tin tưởng vào hành vi của nó là phù hợp không? Một OELM bao gồm một bộ sưu tập nội dung mở được thiết kế đặc biệt có thể được sử dụng để điều khiển hành vi của mô hình. Điều này có thể được nhúng vào lời nhắc hệ thống (lời nhắc mà người dùng không nhìn thấy nhưng điều khiển hành vi của mô hình ở chế độ nền) hoặc được sử dụng để tinh chỉnh. Tinh chỉnh là quá trình mà hành vi của mô hình được thay đổi vĩnh viễn theo một cách mong muốn nào đó. Trong bối cảnh OELM, tinh chỉnh là quá trình mà một mô hình có thể được tạo ra để hoạt động theo hướng sư phạm hơn. Ví dụ, một mô hình được tinh chỉnh để hoạt động như một nhân viên dịch vụ khách hàng hữu ích (như ChatGPT) trả lời trực tiếp các câu hỏi của học sinh, trong khi một mô hình được tinh chỉnh để hoạt động theo hướng sư phạm hơn có thể hỏi học sinh thêm các câu hỏi hoặc cung cấp gợi ý trước khi đưa ra câu trả lời. Về mặt khái niệm, tinh chỉnh một mô hình tương tự như việc cung cấp cho một sinh viên tốt nghiệp hiểu biết một vài giờ đào tạo để họ có thể trở thành một gia sư hiệu quả hơn.

Mỗi thành phần trong bốn thành phần này – trọng số mô hình, nội dung để tinh chỉnh, nội dung cho RAG và lời nhắc được viết sẵn – đều có thể được cấp phép công khai, cung cấp cho giáo viên, người học và những người khác quyền tham gia vào các hoạt động 5R. Hãy coi trọng số mô hình là sách giáo khoa cốt lõi và các thành phần khác là tài liệu bổ sung cần thiết để áp dụng rộng rãi. Và giống như OER truyền thống, khả năng sao chép, chỉnh sửa và chia sẻ lời nhắc và các thành phần OELM khác có nghĩa là chúng có thể được bản địa hóa để đáp ứng tốt nhất nhu cầu của từng người học, giảm thiểu tác hại tiềm ẩn liên quan đến AI tạo sinh và tăng khả năng tiếp cận, khả năng chi trả và công bằng.


Các thành phần của một Mô hình Ngôn ngữ Giáo dục Mở (OELM)

Chạy cục bộ OELM

R nền tảng trong khuôn khổ 5R là Giữ lại (Retain) – để tận dụng lợi thế của một nguồn tài nguyên giáo dục được cấp phép mở, bạn phải có khả năng tải xuống bản sao tài nguyên của riêng mình. Sau đó, bạn có thể lấy bản sao đã tải xuống đó và sửa đổi, phối lại, tái sử dụng và phân phối lại để đáp ứng nhu cầu của bạn và nhu cầu của những người xung quanh bạn. (Bạn sẽ lưu ý rằng không có "lớn" (Large) trong Mô hình ngôn ngữ giáo dục mở. Đó là vì các mô hình nhỏ là chìa khóa cho chiến lược này trong trung hạn đến dài hạn.)

Có một cộng đồng tích cực (ví dụ: Ollama, LM Studio, llama.cpp, v.v.) đang nỗ lực để giúp bạn dễ dàng tải xuống các mô hình trọng số mở và chạy chúng trên phần cứng của người tiêu dùng. Ngay bây giờ (vào cuối năm 2024), đã có nhiều mô hình trọng số mở có thể chạy trên máy tính để bàn, máy tính xách tay và thậm chí cả điện thoại thông minh mà không cần kết nối internet. Ví dụ, đối với Substack Reviewing Research on AI in Education (ngăn xếp phụ Rà soát lại Nghiên cứu về AI trong Giáo dục), tôi đã tạo ra một tác nhân (được hỗ trợ bởi mô hình trọng số mở Llama 3.1 chạy cục bộ trên máy tính xách tay của tôi thông qua Ollama) có thể đọc 150 – 300 bản tóm tắt mỗi sáng và đề xuất 3 – 5 bản tóm tắt hay nhất để tôi xem xét thêm.

Những tiến bộ trong việc chạy các mô hình cục bộ rất quan trọng vì những người không có quyền truy cập đáng tin cậy vào internet hiện không thể tận dụng AI tạo sinh để hỗ trợ việc giảng dạy và học tập. Tuy nhiên, khả năng chạy các mô hình cục bộ có nghĩa là OELM có thể được tải xuống ổ đĩa USB và gửi đến bất kỳ nơi nào có thiết bị phù hợp - sau đó sử dụng mà không cần quan tâm đến kết nối internet. Điều này làm tăng đáng kể số lượng người có thể hưởng lợi từ AI tạo sinh để hỗ trợ việc giảng dạy và học tập.

Khả năng chạy OELM cục bộ cũng giải quyết một số mối quan tâm của mọi người về AI tạo sinh. Ví dụ, nhiều người lo ngại về quyền riêng tư dữ liệu và cách dữ liệu của họ được các nhà cung cấp mô hình AI tạo sinh độc quyền sử dụng. Tuy nhiên, khi một mô hình chạy cục bộ trên thiết bị của người dùng, dữ liệu của người dùng sẽ không bao giờ rời khỏi thiết bị của họ - nghĩa là các nhà cung cấp độc quyền sẽ không bao giờ có quyền truy cập vào dữ liệu của người dùng. Việc chạy các mô hình nhỏ hơn trên các thiết bị cục bộ cũng giải quyết mối quan tâm về lượng điện, nước và các tài nguyên khác được các trung tâm dữ liệu khổng lồ phục vụ các mô hình AI tập trung tiêu thụ.

Và cuối cùng, khả năng tải xuống OELM và chạy chúng cục bộ cung cấp cho mọi người khả năng tham gia vào các hoạt động 5R. Bạn có thể tải xuống các trọng số mô hình - cũng như các thành phần khác - và chạy chúng cục bộ theo cách bạn tìm thấy hoặc sửa đổi và phối lại chúng trước. Việc trao quyền cho giáo viên và người học để họ có thể thực hiện đầy đủ hơn quyền tự quyết của mình đối với LLM sẽ là chìa khóa để kết hợp sức mạnh của mở và sức mạnh của AI tạo sinh nhằm cải thiện khả năng tiếp cận, khả năng chi trả và công bằng trong dài hạn.

Kết luận

Khi thị trường tài liệu khóa học bắt đầu chuyển đổi sang các sản phẩm và dịch vụ được AI hỗ trợ nhiều hơn, tính mở trở nên quan trọng hơn bao giờ hết đối với những người trong chúng ta quan tâm đến việc tăng khả năng tiếp cận, khả năng chi trả và công bằng. Có những bài học quan trọng mà chúng ta cần học về cách tận dụng AI hiệu quả để phục vụ cho việc giảng dạy và học tập, và cách thức mà quyền tự quyết bổ sung đi kèm với tính mở có thể giúp chúng ta thực hiện điều đó hiệu quả hơn nữa. Tôi rất vui khi bắt đầu học những bài học này. Hãy cho tôi biết nếu bạn quan tâm đến việc hợp tác trong lĩnh vực công việc này - Tôi đang lập kế hoạch cho học kỳ mùa xuân năm 2025.

Chủng loại artificial intelligence, equity, improving learning, open content

UPDATE: I have changed the name of this line of work from “open educational language models” to “generative open learning environments” as explained here. Though the name has changed, the goals of and approach to the work remain the same.

Prelude

The extraordinary woman who mentored me through graduate school and co-chaired my PhD committee, Dr. Laurie Nelson, frequently talked to me about the idea of “current best thinking.” Characterizing something as your “current best thinking” gives you permission to share where you are in your work while simultaneously making it clear that your thinking will still evolve in the future.

It is critically important to remember that both open education and generative AI are tools and approaches – they’re means to an end, methods for accomplishing a goal or solving a problem. I’m interested in solving problems of access and effectiveness in education. I think open education and generative AI have a lot to offer toward solutions to these problems. But I want to, from the outset, caution all of us (myself included) against becoming enamored with either open education or generative AI in and of themselves. As they say, you should fall in love with your problem, not your solution.

Below is my current best thinking about how open education and generative AI can come together to help us make progress on problems of access and effectiveness. It will definitely evolve in the future.

Introduction

Bozkurt and more than 40 co-authors (Bozkurt, et al., 2024) provide a comprehensive catalog of ways that generative AI might harm education. Their list includes:

Digital Divide and Educational Inequality

GenAI may exacerbate existing inequalities within education:

  • Unequal Access: High costs of advanced GenAI tools along with infrastructure requirements limit accessibility for underprivileged students and institutions.

  • Widening the Gap: Those with access to premium GenAI services may gain advantages that increase the disparity between wealthy and disadvantaged learners.

  • Global Inequities: Developing countries may lack the infrastructure to support GenAI, hindering educational progress.

Commercialization and Concentration of Power

The development and control of GenAI are dominated by a few large corporations, which poses several concerns:

  • Profiteering by Big Tech: Companies may prioritize profit over ethical considerations, impacting education negatively.

  • Limited Collaboration with Academia: Lack of partnership between tech companies and educational institutions hinders innovation and transparency.

  • Monopolization of Knowledge: Concentration of GenAI development within corporations can lead to control over information and educational content.

Lack of Representation

GenAI may reflect and perpetuate societal biases through:

  • Western-Centric Perspectives: GenAI models trained predominantly on Western data may not adequately represent global diversity.

  • Linguistic Limitations: Disparities between high- and low-resource languages may disadvantage non-English speakers.

  • Cultural Homogenization: GenAI may promote a narrow worldview, suppressing cultural differences.

These concerns should sound familiar to those working in open education. These are many of the same issues that open education advocates have raised about proprietary textbooks and other proprietary learning materials for decades. And just as openness has been a powerful tool for combatting these issues with traditional learning materials, openness has an important role to play in addressing these concerns with generative AI.

Understanding LLMs as Course Materials

Over the next several years course materials will likely shift from formats that look more like traditional textbooks toward formats that look more like large language models (LLMs) and other generative AI tools. The shift to these tools, which comes with the risks like those described above, threatens to erode important progress toward affordability, access, and equity made by the open education movement. Understanding that LLMs are course materials can help us think more clearly about what the future of course materials might look like and how and why open continues to be important going forward.

Large educational materials publishers like Pearson, McGraw-Hill, and Cengage spend a significant amount of time and money creating proprietary course materials. Because these products are so expensive and time-intensive to create (sometimes millions of dollars per product), most instructors end up adopting one of these pre-existing resources rather than creating their own.

About 25 years ago, individuals and then organizations began creating openly licensed alternatives to these proprietary products. Large OER publishers like OpenStax, Lumen, and CMU OLI spend a significant amount of time and money creating open content. These OER are significantly more affordable than the proprietary alternatives and, because of their open licensing, can serve as the foundation for a wide range of innovations in teaching and learning.

In the generative AI space, companies like OpenAI, Anthropic, and Google spend a significant amount of time and money creating proprietary LLMs. Because these LLMs are so expensive and time-intensive to create (possibly more than a hundred million dollars per model), most people end up using one of these models rather than creating their own.

A few years ago, organizations began creating openly licensed alternatives to these proprietary LLMs. Organizations like Meta, Mistral, and IBM spend a significant amount of time and money creating LLMs and openly licensing the model weights so that everyone can retain, reuse, revise, remix, and redistribute them. These “foundation” models provide the foundation upon which you can build a wide range of innovations in teaching and learning.

Creators of Proprietary Course Materials

Creators of Open Course Materials

Pearson, McGraw-Hill, Cengage

OpenStax, Lumen, CMU OLI



Creators of Proprietary LLMs

Creators of Open LLMs

OpenAI, Anthropic, Google

Meta, Mistral, IBM 


A critical insight I’ve gained through painful experience over the last 26 years is this: the majority of faculty won’t adopt OER unless it comes with all the supplemental materials and other quality-of-life improvements provided by traditional publishers – lecture slides, assignments with rubrics, automatically graded homework, quiz banks, etc. (The few faculty who will adopt without these are the ones who enjoy making their own supplemental materials.) We can expect LLM adoption trends to look similar.

Think, for a moment, of LLMs as the “textbooks” of this next phase of course materials. While I’m not ready to predict that OpenAI, Anthropic, and Google will replace Pearson, McGraw-Hill, and Cengage, I am absolutely ready to predict that the large publishers will begin creating bundles of proprietary supplemental materials designed specifically for use with proprietary language models. It’s hard to say exactly what this will end up looking like, but one thing is certain: the difference in the design and format of course materials pre- and post-generative AI will be even more dramatic than the difference between the design and format of course materials pre- and post-internet.

Rather than waiting to act until after proprietary generative AI tools have become widely adopted in the course materials market and significant effort is required to displace them, we should take the initiative now to ensure that instructors who want to use LLMs as course materials have access to high quality, openly licensed options from the start. Those options should include both the models themselves and the additional resources necessary to use them easily and effectively. Creating and sharing Open Educational Language Models, or OELMs (pronounced “elms”), is one example of a proactive step we can take to ensure that generative AI tools can move us forward on affordability, access, and equity instead of backward. (There are, doubtless, many other steps that could be taken. This is the one I’m currently working on.)

Open Educational Language Models

Open Educational Language Models (OELMs) bring together a collection of openly licensed components that allow an openly licensed language model to be used easily and effectively in support of teaching and learning.

The foundational component of an OELM is a set of model weights, which are the “brains” of a language model. High quality, openly licensed model weights have been created and shared by Meta, IBM, Mistral, Alibaba, and many others, and cost tens of millions of dollars – maybe over one hundred million dollars – to create. If we use them exactly as we find them, interacting with these models may indeed result in some of the harms described above. But because the model weights are open, we have the opportunity to revise and remix them. Because the model weights are open, we can change the way learners and teachers interact with them in order to increase access, affordability, and equity. Because the model weights are open, we have significantly greater agency.

In an OELM, the open model weights are supplemented by other components that make them easier to use, that address key concerns about generative AI in education, and that answers questions including:

  • How do I use it effectively?

  • Can I trust its responses to be accurate?

  • Can I trust its behavior to be appropriate?



How do I use it effectively? An OELM includes a comprehensive collection of pre-written prompts. These prompts are designed to support a wide range of activities. For learners, these activities might include debates, arguments, or dialogues, open-ended exploration of concepts and ideas, asking clarifying questions and receiving individualized answers, and engaging in interactive review with immediate, diagnostic feedback. For teachers, these activities might include lesson planning, designing an active learning exercise for use in class, differentiating instruction, revising or remixing OER, and drafting feedback on student work.

Can I trust its responses to be accurate? An OELM includes a curated collection of OER that the model uses for retrieval augmented generation (RAG). RAG is a process by which models’ responses are made more accurate, and works as follows. When a teacher or learner submits a prompt to the model, before the prompt is sent to the model, relevant information is searched for in the collection of OER and added to the prompt. The model then uses the information it has retrieved from the OER as the basis for its response to the user, augmenting its general knowledge about the topic before generating a response. Conceptually, this is similar to the way a librarian might refer to a reference work before answering a question.

Can I trust its behavior to be appropriate? An OELM includes a specially designed collection of open content that can be used to steer the model’s behavior. This can be embedded in the system prompt (a prompt which the user doesn’t see but which steers model behavior in the background) or used for fine-tuning. Fine-tuning is the process by which a model’s behavior is permanently changed in some desired way. In the OELM context, fine-tuning is the process by which a model can be made to behave more pedagogically. For example, a model fine-tuned to behave as a helpful customer service agent (like ChatGPT was) answers student questions directly, whereas a model fine-tuned to behave more pedagogically might ask students additional questions or provide hints before giving an answer. Conceptually, fine-tuning a model is similar giving a knowledgeable graduate student a few hours of training so they can be a more effective tutor.

Each of these four components – the model weights, content for fine-tuning, content for RAG, and pre-written prompts – can be openly licensed, providing teachers, learners, and others with permission to engage in the 5R activities. Think of the model weights as the core textbook and the other components as the supplemental materials necessary for widespread adoption. And just like with traditional OER, the ability to copy, edit, and share prompts and other OELM components means they can be localized in order to best meet the needs of individual learners, minimize the potential harms associated with generative AI, and increase access, affordability, and equity.

Components of an Open Educational Language Model (OELM)

Running OELMs Locally

The foundational R in the 5Rs framework is Retain – to take advantage of an educational resource being openly licensed, you have to be able to download your own copy of the resource. Then you can take that copy you downloaded and revise, remix, reuse, and redistribute it to meet your needs and the needs of others around you. (You’ll note that there’s no “large” in Open Educational Language Model. That’s because small models are a key to this strategy over the medium to long-term.)

There is an active community (e.g., Ollama, LM Studio, llama.cpp, etc.) working to make it easy to download open weights models and run them on consumer hardware. Right now (in late 2024), there are already many open weights models that can be run on desktop computers, laptops, and even smartphones without any connection to the internet. For example, for my Substack Reviewing Research on AI in Education, I created an agent (powered by a Llama 3.1 open weights model running locally on my laptop via Ollama) that reads 150 – 300 abstracts each morning and recommends the best 3 – 5 for me to review further.

Advances in running models locally are important because people without reliable access to the internet are currently unable to take advantage of generative AI in support of teaching and learning. However, the capability to run models locally means that an OELM can be downloaded to a thumb drive and sent wherever a suitable device is available – and then used without regard for internet connectivity. This dramatically increases the number of people who can benefit from generative AI in support of teaching and learning.

The ability to run OELMs locally also addresses a number of concerns people have about generative AI. For example, many people are concerned about data privacy and how their data are used by the providers of proprietary generative AI models. However, when a model runs locally on the user’s device the user’s data never leaves their device – meaning the proprietary providers never have access to the user’s data. Running smaller models on local devices also addresses concerns about the amount of power, water, and other resources consumed by the huge data centers that serve AI models centrally.

And finally, the ability to download OELMs and run them locally provides people with the ability to engage in the 5R activities. You can download the model weights – as well as the other components – and run them locally just as you found them, or revise and remix them first. Empowering teachers and learners to more fully exercise their agency with regard to LLMs will be key to combining the power of open and the power of generative AI in the service of improving access, affordability, and equity over the long-term.

Conclusion

As the course materials market begins the transition toward more AI-powered products and offerings, openness is more important than ever for those of us who care about increasing access, affordability, and equity. There are critical lessons we need to learn about how to leverage AI effectively in the service of teaching and learning, and how the added agency that comes with openness can help us do that even more powerfully. I’m super excited to begin learning these lessons. Let me know if you’re interested in collaborating on this line of work – I’m making plans for spring term 2025.

Categories artificial intelligence, equity, improving learning, open content

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Ba, 24 tháng 6, 2025

Hội thảo ‘Xây dựng nhà trường số trên nền khung năng lực số’ tại TP. Quy Nhơn, 25/06/2025



Hiệp hội các trường Cao đẳng Nghề nghiệp Ngoài công lập Việt Nam cùng Hiệp hội Giáo dục nghề nghiệp và nghề công tác xã hội Việt Nam - Văn phòng đại diện tại thành phố Hồ Chí Minh; Viện nghiên cứu, Đào tạo và Phát triển tài nguyên giáo dục mở (InOER); Google For Education Việt Nam, và Trung tâm Phát triển Khoa học Công nghệ và Kinh tế MAPLE tổ chức hội thảo ‘Xây dựng nhà trường số trên nền khung năng lực số - Tài nguyên Giáo dục Mở’ trong ngày 25/06/2025 tại Trường Cao đẳng Kỹ Thuật Công Nghệ Quy Nhơn.


Tải về các bài trình chiếu tại Tọa đàm:

  1. Chuyển đổi số: Năng lực số, văn hóa số và giải pháp mở là điều kiện tiên quyết để thành công: https://zenodo.org/records/15702240

  2. Giới thiệu: Khung năng lực Tài nguyên Giáo dục Mở cho giảng viên V2.0: https://zenodo.org/records/15702233

  3. AI trong TVET: Một vài gợi ý triển khai trong thực tế: https://www.dropbox.com/scl/fi/mj3damlds5dwaiprk0f08/AI_in_TVET.pdf?rlkey=7cv6ao5g3l750oqwe5qngjcd8&e=1&st=8raecu2p&dl=0

X (Tweet): https://x.com/nghiafoss/status/1937703284925694156

Xem thêm:

Blogger: Lê Trung Nghĩa

letrungnghia.foss@gmail.com


Thứ Hai, 23 tháng 6, 2025

Loạt bài về Giáo dục Mở 101


Open Education 101 Series

Tuesday, June 3, 2025 News

Theo: https://sparcopen.org/news/2025/open-education-101-series/

Bài được đưa lên Internet ngày: 03/06/2025

Khi giáo dục mở tiếp tục thu hút sự chú ý trong các tổ chức giáo dục, chúng tôi đã nghe cộng đồng nói về nhu cầu phát triển chuyên môn nhiều hơn tập trung vào các khái niệm cơ bản—đặc biệt là đối với những người lần đầu tham gia công tác giáo dục mở.

Dựa trên phản hồi tích cực đối với loạt bài Truy cập Mở 101 (Open Access 101) của chúng tôi, SPARC vui mừng thông báo về Giáo dục Mở 101 (Open Education 101), một loạt bài được thiết kế để cung cấp điểm khởi đầu cho công tác giáo dục mở cũng như là khóa bồi dưỡng cho những người đã tham gia vào lĩnh vực này. Trong loạt bài gồm bốn phần này, chúng tôi sẽ đề cập đến kiến thức cơ bản, ứng dụng thực tế và các xu hướng mới nổi để giúp bạn hiểu, triển khai và ủng hộ giáo dục mở trong bối cảnh tổ chức của mình. Không cần kiến thức hoặc kinh nghiệm trước đó và tất cả đều được chào đón.

Các phiên này dành cho bất kỳ ai làm việc trong thư viện, giảng dạy, thiết kế hướng dẫn hoặc những người chỉ đơn giản là tò mò muốn khám phá chủ đề mang tính chuyển đổi này. Người tham gia có thể đăng ký chỉ những phiên mà họ quan tâm. KHÔNG yêu cầu phải là thành viên SPARC và mục tiêu của chúng tôi trong loạt bài này là hỗ trợ cộng đồng rộng lớn hơn, đặc biệt là những người ở các tổ chức có ít nguồn lực hơn để hỗ trợ công tác giáo dục mở.

Vui lòng tìm thêm thông tin về từng phiên bên dưới, cùng với các liên kết đăng ký cho từng phiên. Tất cả các phiên sẽ được ghi lại và đăng cho những người không thể tham dự trực tiếp.

Phiên 1: Nền tảng giáo dục mở

Ngày 13 tháng 8 từ 2–3 giờ chiều theo giờ miền Đông Hoa Kỳ / 11 giờ sáng–12 giờ trưa theo giờ PDT [đăng ký tại đây]

Phiên này sẽ giới thiệu tổng quan về giáo dục mở, bao gồm các nguyên tắc cốt lõi, thuật ngữ chính và quá trình phát triển trong lịch sử. Chúng tôi sẽ thảo luận về cách giáo dục mở kết nối với các phong trào liên quan như truy cập mở và khoa học mở, đồng thời nêu bật tiềm năng của giáo dục mở trong việc xóa bỏ rào cản và mở rộng cơ hội cho cả sinh viên và nhà giáo dục. Những người tham gia sẽ rời đi với sự hiểu biết cơ bản vững chắc để hỗ trợ việc học tập sâu hơn, cùng với nhận thức về các công cụ và tài nguyên chính.

Phiên 2: Giáo dục mở trong thực tế

Ngày 28 tháng 8 từ 2–3 giờ chiều theo giờ miền Đông Hoa Kỳ / 11 giờ sáng–12 giờ trưa theo giờ PDT [đăng ký tại đây]

Phiên này sẽ giới thiệu các khía cạnh chính của việc đưa giáo dục mở vào thực tế. Các chủ đề sẽ bao gồm cách tìm kiếm, tạo và tùy chỉnh các nguồn tài nguyên giáo dục mở (OER), nền tảng của phương pháp sư phạm mở và cách các trường cao đẳng và đại học khác nhau đang hỗ trợ giáo dục mở thông qua các chương trình tại trường. Những người tham gia sẽ mang về những ví dụ thực tế và điểm khởi đầu để áp dụng vào công việc giảng dạy, công việc thư viện hoặc tổ chức của mình.

Phiên 3: Giáo dục mở ở thời điểm hiện tại

Ngày 10 tháng 9 từ 2–3 giờ chiều theo giờ miền Đông Hoa Kỳ / 11 giờ sáng–12 giờ trưa theo giờ PDT [đăng ký tại đây]

Phiên này sẽ khám phá cách giáo dục mở giao thoa với các xu hướng chính định hình giáo dục đại học ngày nay. Các chủ đề sẽ bao gồm sự thay đổi trong các mô hình thanh toán tài liệu khóa học (ví dụ: "Truy cập toàn diện"), sự phát triển của trí tuệ nhân tạo và các lĩnh vực đang phát triển như chứng chỉ vi mô và sự sẵn sàng của lực lượng lao động. Những người tham gia sẽ rời đi với những ý tưởng để định vị giáo dục mở trong các cuộc trò chuyện rộng hơn này và thúc đẩy nó một cách chiến lược hơn trong khuôn viên trường.

Phiên 4: Câu hỏi thường gặp: Trả lời các câu hỏi thường gặp về Giáo dục mở

Ngày 25 tháng 9 từ 2–3 giờ chiều theo giờ miền Đông Hoa Kỳ / 11 giờ sáng–12 giờ trưa theo giờ PDT [đăng ký tại đây]

Phiên này sẽ giải quyết các câu hỏi thực tế nảy sinh khi giáo dục mở được giới thiệu trong khuôn viên trường. Tôi có thể tìm OER ở đâu? Làm sao để biết liệu nó có chất lượng cao hay không? Chúng tôi giải quyết những vấn đề này và các vấn đề thực tế khác do giảng viên, sinh viên và quản trị viên nêu ra, bao gồm cả những vấn đề do người tham gia trình bày trong các phiên trước đó. Người tham gia sẽ ra về với những câu trả lời hiệu quả cho các câu hỏi thường gặp, bằng chứng để chứng minh và các mẹo vận động để áp dụng trong bối cảnh của riêng họ.

Bản ghi âm của mỗi phiên sẽ được cung cấp trên trang này sau các phiên.

As open education continues to gain traction across educational institutions, we’ve heard from the community about the need for more professional development focused on foundational concepts—especially for those stepping into open education work for the first time.

Building on the positive response to our Open Access 101 series, SPARC is pleased to announce Open Education 101, a series designed to provide an entry point to open education work as well as a refresher for those already engaged in this field. In this four-part series, we’ll cover foundational knowledge, practical applications, and emerging trends to help you understand, implement, and advocate for open education in your institutional context. No prior knowledge or experience is necessary, and all are welcome.

These sessions are open to anyone working in libraries, teaching, instructional design, or those simply curious about exploring this transformative topic. Participants can register for just those sessions that are of interest. SPARC membership is NOT required, and our goal in this series is to support the wider community, particularly those at institutions with fewer resources to support open education work.

Please find more information about each session below, along with the registration links for each. All sessions will be recorded and posted for those unable to attend live.

Session 1: Open Education Foundations

August 13 from 2–3 p.m. EDT / 11 a.m.–12 p.m. PDT [register here]

This session will provide a broad introduction to open education, including its core principles, key terms, and historical development. We’ll discuss how open education connects to related movements such as open access and open science, and highlight its potential to remove barriers and expand opportunities for both students and educators. Participants will leave with a strong foundational understanding to support further learning, along with awareness of key tools and resources.

Session 2: Open Education in Practice

August 28 from 2–3 p.m. EDT / 11 a.m.–12 p.m. PDT [register here]

This session will introduce key aspects of putting open education into practice. Topics will include how to find, create, and adapt open educational resources (OER), the foundations of open pedagogy, and how various colleges and universities are supporting open education through campus programs. Participants will leave with practical examples and starting points to apply in their own teaching, library work, or institutional setting.

Session 3: Open Education in the Current Moment

September 10 from 2–3 p.m. EDT / 11 a.m.–12 p.m. PDT [register here]

This session will explore how open education intersects with major trends shaping higher education today. Topics will include shifts in course material billing models (e.g., “Inclusive Access”), the rise of artificial intelligence, and growing areas such as microcredentials and workforce readiness. Participants will leave with ideas for situating open education within these broader conversations and advancing it more strategically on campus.

Session 4: FAQs: Answering Common Questions about Open Education

September 25 from 2–3 p.m. EDT / 11 a.m.–12 p.m. PDT [register here]

This session will take on the real-world questions that come up when open education is introduced on campus. Where do I find OER? How do I know if it’s high quality? We address these and other practical concerns raised by faculty, students, and administrators, including those submitted by participants in earlier sessions. Participants will leave with effective answers to common questions, evidence to back it up, and advocacy tips to apply in their own context.

Recordings of each session will be made available on this page following the sessions.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Chủ Nhật, 22 tháng 6, 2025

Vì sao AI tạo sinh là hiệu quả hơn trong việc nâng cao quyền truy cập tới cơ hội giáo dục so với Tài nguyên Giáo dục Mở (OER)


Why Generative AI Is More Effective at Increasing Access to Educational Opportunity than OER

September 10, 2024 by opencontent

Theo: https://opencontent.org/blog/archives/7589

Bài được đưa lên Internet ngày: 10/09/2024

Đây là phần mở đầu cho bài thuyết trình ngày 19 tháng 9 năm 2024 của tôi, Tại sao Giáo dục Mở sẽ Trở thành Giáo dục AI Tạo sinh. Tôi đang đăng trước một số nội dung bài thuyết trình do cuộc trò chuyện rất sôi nổi mà thông báo về bài thuyết trình đã tạo ra. Tuần trước, tôi đã đăng phần giữa của bài thuyết trình, AI Tạo sinh Ảnh hưởng đến Tài nguyên Giáo dục Mở như thế nào, trong đó tôi mô tả cách chúng ta cần vượt ra ngoài tư duy hạn hẹp về cách AI tạo sinh tác động đến công việc của chúng ta với OER truyền thống và bắt đầu suy nghĩ rộng hơn về sức mạnh của OER tạo sinh.

Mục tiêu chính của Phong trào Giáo dục mở

Trong hơn 25 năm, mục tiêu chính của phong trào giáo dục mở là tăng cường khả năng tiếp cận các cơ hội giáo dục. Chiến lược chính để đạt được mục tiêu này là tăng cường khả năng tiếp cận các tài liệu giáo dục. Và chiến thuật chính để thực hiện chiến lược này là tạo ra và chia sẻ OER. Hơn 25 năm sau, giờ đây có thể khó nhớ được OER là một sáng kiến đáng kinh ngạc như thế nào vào cuối những năm 1990.

Quyền truy cập Internet của công chúng vừa mới bắt đầu mở rộng. Mặc dù họ có thể chưa học các thuật ngữ từ vựng ECON 101, nhưng mọi người bắt đầu hiểu rằng khi các nguồn lực vật chất được chuyển đổi thành các nguồn lực kỹ thuật số, về cơ bản chúng trở nên không cạnh tranh. Ví dụ, hãy lấy một bản sao vật lý của tờ New York Times. Nếu vợ tôi đang đọc một phần trong bữa sáng, tôi không thể đọc cùng phần đó cùng lúc. Hoặc đối với một ví dụ thậm chí còn cũ hơn, nếu đĩa CD Take 6 ở trong xe của cô ấy, tôi không thể nghe nó trong xe của mình. Những nguồn lực vật chất này (một tờ báo in hoặc đĩa CD) là cạnh tranh. Wikipedia định nghĩa sự cạnh tranh theo cách này:

Trong kinh tế học, một hàng hóa được coi là cạnh tranh nếu việc tiêu thụ của một người tiêu dùng ngăn cản việc tiêu thụ đồng thời của những người tiêu dùng khác hoặc nếu việc tiêu thụ của một bên làm giảm khả năng tiêu thụ của bên kia. Một hàng hóa được coi là không cạnh tranh nếu, đối với bất kỳ mức sản xuất nào, chi phí cung cấp hàng hóa đó cho một cá nhân cận biên (bổ sung) là bằng không.

Tuy nhiên, các đối tác kỹ thuật số của những nguồn tài nguyên này – trang web New York Times hoặc album Take 6 trên Spotify – về cơ bản là không cạnh tranh, nghĩa là nhiều người có thể đọc và nghe chúng cùng một lúc. Vào cuối những năm 1990, nhiều người trong chúng ta bắt đầu nhận ra rằng sự chuyển đổi tương tự này có thể được áp dụng cho các nguồn tài nguyên giáo dục như sách giáo khoa. Nếu bạn biến chúng thành kỹ thuật số, thì các nguồn tài nguyên giáo dục sẽ thừa hưởng đặc tính kỳ diệu, không cạnh tranh này và hàng triệu người có thể cùng sử dụng cùng một nguồn tài nguyên cùng một lúc. Điều này rõ ràng sẽ cách mạng hóa nhiệm vụ cung cấp quyền truy cập vào các nguồn tài nguyên giáo dục cho người học trên toàn cầu.

Nhưng chúng ta phải dừng lại một chút. Chỉ vì có thể chia sẻ tài nguyên với hàng triệu người cùng lúc qua internet về mặt công nghệ không có nghĩa là việc đó là hợp pháp. Trong một khoảng thời gian ngắn bắt đầu vào cuối những năm 1990, các ứng dụng như Napster và LimeWire đã giúp chia sẻ và tải xuống nhiều loại tệp nhạc kỹ thuật số. Nhiều người đã có sự hiểu biết thực sự đầu tiên về luật bản quyền trong giai đoạn này khi họ phải xem vô số thông báo dịch vụ công cộng về bản quyền và tin tức về những người bị kiện đòi bồi thường hàng triệu đô la vì chia sẻ nhạc trực tuyến bất hợp pháp.

Theo một số cách, đây là giai đoạn vô cùng khó chịu. Internet đã giúp việc chia sẻ ở quy mô lớn trở nên khả thi, nhưng làm sao chúng ta có thể hợp pháp hóa việc chia sẻ ở quy mô lớn? Nhờ người bạn cũ của chúng ta là Công ước Berne (mỉa mai), mọi tác phẩm sáng tạo đều tự động được bảo vệ bản quyền theo phạm vi đầy đủ của luật tại thời điểm tác phẩm được cố định ở dạng hữu hình (bao gồm cả dạng kỹ thuật số). Và điều này xảy ra bất kể bạn có muốn bảo vệ bản quyền cho tác phẩm hay không. Nhưng nếu thay vì bảo vệ tác phẩm của mình, bạn muốn chia sẻ nó với người khác thì sao? Không có cách dễ dàng hoặc rõ ràng nào để làm điều đó.

Năm 1998, tôi đã khởi chạy dự án OpenContent và phát hành giấy phép theo kiểu nguồn mở đầu tiên cho các tài liệu giáo dục và nội dung khác. Vài năm tiếp theo, những người khác cũng áp dụng ý tưởng này. Năm 1999, tôi đã hợp tác với Eric Raymond về Giấy phép xuất bản mở. Năm 2000, Quỹ phần mềm tự do đã phát hành Giấy phép tài liệu tự do GNU (GFDL). Và năm 2002, Creative Commons đã công bố các giấy phép đầu tiên của mình.

Công nghệ mới nổi mạnh mẽ nhất

Vào đầu phong trào giáo dục mở hiện đại vào cuối những năm 1990, chúng ta đang bước vào thời đại thông tin – thời đại mà công nghệ mới nổi mạnh mẽ nhất (Internet) có thể tạo và truyền tải các bản sao của tài nguyên kỹ thuật số gần như ngay lập tức và với chi phí tương đối thấp (so với các lựa chọn khác như vận chuyển tài nguyên vật lý trên toàn thế giới). Trong bối cảnh này, chiến thuật tạo và chia sẻ tài liệu giáo dục được cấp phép mở trực tuyến (để có thể tạo và phân phối các bản sao một cách tự do và hợp pháp) là cách tối ưu để tăng khả năng tiếp cận các tài nguyên giáo dục cho mọi người trên khắp thế giới. Chiến thuật này đã chứng minh ngày càng hiệu quả hơn khi kết nối Internet trở nên nhanh hơn, rẻ hơn và phổ biến hơn.

Nhiều người đã quên – hoặc có lẽ chưa bao giờ biết – rằng chúng ta từng phải trả tiền theo phút để sử dụng Internet. Chúng ta gọi đến các ngân hàng qua thiết bị modem bằng điện thoại cố định và lắng nghe âm thanh tuyệt vời đó có nghĩa là chúng ta đang trực tuyến. So với ngày nay, Internet của những năm 1990 chậm và đắt đỏ. Nhưng thực tế là việc sử dụng của chúng ta được đo lường (tính phí theo phút) theo nhiều cách là rào cản lớn nhất đối với việc Internet phát huy hết tiềm năng của nó. Khi dịch vụ băng thông rộng tốc độ cao với mức phí cố định cuối cùng cũng xuất hiện, thói quen sử dụng của mọi người đã thay đổi và cuộc cách mạng Internet thực sự bắt đầu.

Trí tuệ nhân tạo tạo sinh (Generative AI) ngày nay giống như Internet vào những năm 1990. Suy luận (“suy luận” là tên gọi khi AI tạo ra phản hồi cho lời nhắc của bạn) chậm, tốn kém và bị giới hạn. Ngay cả khi bạn trả tiền đăng ký hàng tháng cho một thứ gì đó như ChatGPT Pro, nếu bạn gửi quá nhiều lời nhắc trong thời gian quá ngắn, bạn sẽ bị chặn tạm thời và phải đợi trước khi có thể gửi thêm lời nhắc. Nhưng nhờ những tiến bộ nhanh chóng trong nhiều lĩnh vực – từ thuật toán đến phần cứng – tốc độ suy luận đang tăng lên và giá suy luận đang giảm xuống. AI tạo ra đang nhanh chóng tiến đến điểm mà theo lời của Sam Altman, nó sẽquá rẻ để giới hạn”. Nói cách khác, AI tạo sinh đang tuân theo mô hình do Internet thiết lập và sẽ trở nên rẻ và phổ biến.

Quan sát này khiến tôi tin rằng chúng ta đang chuyển đổi từ thời đại thông tin sang thời đại tạo sinh. Trong khi công nghệ mới nổi mạnh mẽ nhất của thời đại thông tin (Internet) có thể tạo và truyền tải các bản sao của các nguồn tài nguyên hiện có theo yêu cầu, thì công nghệ mới nổi mạnh mẽ nhất của thời đại tạo sinh (AI tạo sinh) có thể tạo ra các nguồn tài nguyên mới theo yêu cầu. Chúng ta không thể hiểu hết những thay đổi sẽ được gây ra (cả trong giáo dục và những nơi khác) bởi khả năng này. Và những thay đổi đó ngày càng trở nên rõ rệt hơn khi AI tạo sinh trở nên rẻ và phổ biến.

AI sinh sản tạo điều kiện cho khả năng tiếp cận lớn hơn OER truyền thống

Vì có thể tạo ra các tài nguyên mới theo yêu cầu, AI tạo sinh có thể cung cấp quyền truy cập vào nhiều tài nguyên hơn đáng kể, về nhiều chủ đề hơn, bằng nhiều ngôn ngữ hơn, với nhiều ví dụ hơn, sử dụng nhiều phương pháp sư phạm hơn, ở nhiều định dạng hơn, v.v., so với cách tiếp cận hiện tại là "tạo OER truyền thống bằng tay thông qua quy trình tùy chỉnh theo yêu cầu". Khi chúng ta kết nối thực tế này trở lại với mục tiêu chính của phong trào giáo dục mở, hàm ý trở nên rõ ràng. Nếu:

  • mục tiêu chính của phong trào giáo dục mở là tăng khả năng tiếp cận các cơ hội giáo dục và

  • chiến lược chính để đạt được mục tiêu này là tăng quyền truy cập tới các tài nguyên giáo dục và

  • AI tạo sinh có thể cung cấp quyền truy cập vào nhiều tài nguyên hơn đáng kể so với quy trình biên soạn OER tùy chỉnh theo yêu cầu hiện tại, thì

  • chiến thuật tối ưu để đạt được mục tiêu chính của phong trào giáo dục mở không còn là tạo lập và chia sẻ OER truyền thống nữa –

  • chiến thuật tối ưu để đạt được mục tiêu chính của phong trào giáo dục mở là sử dụng AI tạo sinh.

Chủng loại artificial intelligence, open education, student success

This is the opening section of my September 19, 2024 presentation, Why Open Education Will Become Generative AI Education. I’m pre-posting some of the presentation content due to the very active conversation the announcement of the presentation has created. Last week I posted the middle section of the presentation, How Generative AI Affects Open Educational Resources, in which I described how we need to move beyond narrow thinking about how generative AI impacts our work with traditional OER and begin thinking more broadly about the power generative OER.

The Primary Goal of the Open Education Movement

For over 25 years, the primary goal of the open education movement has been to increase access to educational opportunities. The primary strategy for accomplishing this goal has been to increase access to educational materials. And the primary tactic for implementing this strategy has been to create and share OER. More than 25 years later now, it can be hard to remember what an incredible innovation OER was in the late 1990s.

Public access to the internet had just started to scale. Although they might not have learned the ECON 101 vocabulary terms, people were beginning to understand that when physical resources are converted into digital resources, they become essentially non-rivalrous. Take, for example, a physical copy of the New York Times. If my wife is reading a section during breakfast I can’t be reading that same section at the same time. Or for an even more dated example, if the Take 6 CD is in her car I can’t listen to it in my car. These physical resources (a printed newspaper or CD) are rivalrous. Wikipedia defines rivalry this way:

In economics, a good is said to be rivalrous if its consumption by one consumer prevents simultaneous consumption by other consumers, or if consumption by one party reduces the ability of another party to consume it. A good is considered non-rivalrous if, for any level of production, the cost of providing it to a marginal (additional) individual is zero.

The digital counterparts of these resources, however – the New York Times website or the Take 6 album on Spotify – are essentially non-rivalrous, meaning that many people can read and listen to them at the same time. In the late 1990s, many of us were beginning to realize that this same transformation could be applied to educational resources like textbooks. If you made them digital, then educational resources inherited this magical, non-rivalrous property and millions of people could all be using the same resource at the same time. This would obviously revolutionize the task of providing access to educational resources to learners around the globe.

But we have to pause for a moment. Just because it is technologically possible to share resources with millions of people simultaneously via the internet doesn’t mean it’s legal to do so. During a brief period of time beginning in the late 1990s, apps like Napster and LimeWire made it possible to share and download a wide range of digital music files. Many people got their first real introduction to copyright law during this period as they were subjected to countless PSAs about copyright and news stories about people being sued for millions of dollars for sharing music online illegally.

In some ways this was an incredibly frustrating period. The internet had made it possible to share at scale, but how could we make it legal to share at scale? Thanks to our old pal the Berne Convention (sarcasm), each and every creative work is automatically copyrighted to the full extent of the law at the moment it is fixed in a tangible (including digital) form. What the internet had made possible, open licenses made legal. We finally had a simple, straightforward way to share educational materials (and other creative works) at scale.

And this happens regardless of whether you want copyright protection for the work or not. But what if instead of protecting your work you wanted to share it with others? There was no easy or obvious way to do that.

In 1998 I launched the OpenContent project and released the first open source-style license for educational materials and other content. The next several years saw others pick up on this same idea. In 1999 I collaborated with Eric Raymond on the Open Publication License. In 2000 the Free Software Foundation released the GNU Free Documentation License (GFDL). And in 2002, Creative Commons published its first licenses.

The Most Powerful Emerging Technology

At the beginning of the modern open education movement in the late 1990s we were entering an information age – a time when the most powerful emerging technology (the internet) could make and transmit copies of digital resources almost instantaneously and at relatively low cost (compared to other options like shipping physical resources around the world). In this context, the tactic of creating and sharing openly licensed educational materials online (so that copies could be made and distributed freely and legally) was the optimal way to increase access to educational resources for people around the world. This tactic has proven more and more effective as internet connectivity has gotten faster, cheaper, and more broadly available.

Many people have forgotten – or perhaps never knew – that we used to pay per minute to use the internet. We dialed into modem banks using our landlines and listened for that marvelous sound that meant we were online. Compared to today, the internet of the 1990s was slow and expensive. But it was the fact that our usage was metered (charged per minute) that was in many ways the biggest barrier to the internet fulfilling its potential. When flat-fee, high-speed broadband finally arrived, people’s usage patterns changed and the internet revolution began in earnest.

Generative AI today is like the internet in the 1990s. Inference (“inference” is what it’s called when generative AI creates a response to your prompt) is slow, expensive, and metered. Even if you pay for a monthly subscription to something like ChatGPT Pro, if you submit too many prompts in too short a period of time you’ll get blocked temporarily and have to wait before you can submit additional prompts. But thanks to rapid advances in a range of areas – from algorithms to hardware – the speed of inference is increasing and the price of inference is decreasing. Generative AI is rapidly approaching the point where it will be, in Sam Altman’s words, “too cheap to meter.” In other words, generative AI is following the pattern established by the internet and will become inexpensive and ubiquitous.

This observation leads me to believe that we are transitioning from an information age to a generative age. While the most powerful emerging technology of the information age (the internet) could make and transmit copies of existing resources on demand, the most powerful emerging technology of the generative age (generative AI) can create new resources on demand. It is impossible for us to fully comprehend the changes that will be caused (both in education and elsewhere) by this capability. And those changes become more and more dramatic as generative AI becomes inexpensive and ubiquitous.

Generative AI Facilitates Greater Access than Traditional OER

Because it can create new resources on demand, generative AI can provide access to dramatically more resources, on more topics, in more languages, with more examples, using more pedagogies, in more formats, etc., than the current “create traditional OER by hand through a bespoke process” approach can. When we connect this fact back to the primary goal of the open education movement, the implication becomes clear. If:

  • the primary goal of the open education movement is to increase access to educational opportunities, and

  • the primary strategy for accomplishing this goal is to increase access to educational resources, and

  • generative AI can provide access to dramatically more resources than the current bespoke OER authoring process can, then

  • the optimal tactic for accomplishing the open education movement’s primary goal is no longer creating and sharing traditional OER –

  • the optimal tactic for accomplishing the open education movement’s primary goal is to use generative AI.

Categories artificial intelligence, open education, student success

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com