Thứ Năm, 27 tháng 2, 2025

Hình dung lại dữ liệu cho AI Nguồn Mở: Lời kêu gọi hành động


Reimagining data for Open Source AI: A call to action

January 23, 2025; Nick Vidal

Theo: https://opensource.org/blog/reimagining-data-for-open-source-ai-a-call-to-action

Bài được đưa lên Internet ngày:

Trí tuệ nhân tạo - AI (Artificial Intelligence) đang thay đổi thế giới với tốc độ chưa từng thấy, với AI Nguồn Mở - OSAI (Open Source AI) đóng vai trò then chốt trong việc định hình quỹ đạo của nó. Tuy nhiên, khi AI phát triển, một thách thức cơ bản xuất hiện: Làm thế nào để tạo ra một hệ sinh thái dữ liệu không chỉ mạnh mẽ mà còn công bằng và bền vững?

Sáng kiến Nguồn Mở - OSI (Open Source Initiative) và Tương lai Mở (Open Future) đã tiến hành một bước đáng kể hướng tới việc giải quyết thách thức này bằng việc phát hành sách trắng: “Quản trị dữ liệu trong AI Nguồn Mở: Xúc tác cho quyền truy cập có trách nhiệm và hệ thống”. Tài liệu này là đỉnh cao của quá trình đồng thiết kế toàn cầu, được bổ sung thêm những hiểu biết sâu sắc từ hội thảo sôi nổi kéo dài hai ngày được tổ chức tại Paris vào tháng 10 năm 2024.

Một bước ngoặt cho AI Nguồn Mở

Về cốt lõi, sách trắng này giải quyết một câu hỏi cấp bách: Làm thế nào chúng ta có thể quản trị dữ liệu có trách nhiệm thúc đẩy AI Nguồn Mở? Câu trả lời đòi hỏi một sự chuyển đổi sâu sắc trong cách chúng ta suy nghĩ về dữ liệu. Nó không chỉ là một nguồn tài nguyên để khai thác mà còn là một tài sản chung được chia sẻ (shared commons) —một nền tảng chung mà sự đổi mới có thể phát triển mạnh mẽ trong khi tôn trọng các quyền và thúc đẩy công bằng.

AI Nguồn Mở phát triển mạnh mẽ trên các tập dữ liệu được chia sẻ. Tuy nhiên, bối cảnh hiện tại đầy rẫy những thách thức:

  • Tính mở và minh bạch: Nhiều mô hình AI được dán nhãn "mở" thiếu tính minh bạch liên quan đến nguồn gốc dữ liệu, việc cấp phép và hạn chế sử dụng, tạo ra sự nhầm lẫn về những gì thực sự cấu thành nên AI Nguồn Mở.

  • Sự khan hiếm và bất bình đẳng về dữ liệu: Mặc dù có rất nhiều thông tin trên internet, nhiều tập dữ liệu có chất lượng thấp và không thể hiện được sự đa dạng của thế giới của chúng ta.

  • Mối quan ngại về quyền riêng tư: Một số dữ liệu không thể được chia sẻ hợp pháp do các luật khác nhau trên khắp các quyền tài phán liên quan đến dữ liệu cá nhân và các tiêu chuẩn nhân quyền quốc tế về quyền riêng tư.

  • Đại diện cho các bên liên quan: Hệ sinh thái AI thường ưu tiên các nhà phát triển và tập đoàn hơn là những người đóng góp, các cộng đồng bị ảnh hưởng và các tổ chức vì lợi ích công cộng.

  • Tính bền vững về môi trường: Bản chất sử dụng nhiều tài nguyên của AI làm dấy lên mối lo ngại về tác động của nó đến môi trường.

Tầm nhìn cho sự thay đổi

Sách trắng này đưa ra bản thiết kế cho hệ sinh thái dữ liệu bắt nguồn từ sự công bằng, tính bao hàm toàn diện và tính bền vững. Sách trắng kêu gọi hai sự thay đổi mang tính chuyển đổi:

  1. Từ Dữ liệu mở đến Dữ liệu chung (tài sản chung về dữ liệu): Đi vượt ra ngoài khái niệm dữ liệu không hạn chế để đến một mô hình cân bằng giữa tính mở với các quyền và nhu cầu của tất cả các bên liên quan.

  2. Mở rộng phạm vi các bên liên quan: Tạo ra các khung cộng tác tập hợp các cộng đồng, người quản lý và người sáng tạo trong các hoạt động chia sẻ dữ liệu công bằng.

Để hiện thực hóa những thay đổi này, sách trắng đi sâu vào sáu lĩnh vực trọng tâm quan trọng:

  • Chuẩn bị dữ liệu

  • Tín hiệu ưu tiên và việc cấp phép

  • Người quản lý và người giám hộ dữ liệu

  • Tính bền vững của môi trường

  • Sự tương hỗ và đền bù

  • Can thiệp chính sách

Mỗi lĩnh vực trọng tâm là một bước đệm hướng tới việc xây dựng một tương lai mà dữ liệu trao quyền thay vì khai thác, nơi dữ liệu phản ánh sự đa dạng các trải nghiệm của con người thay vì củng cố bất bình đẳng có hệ thống.

Lời kêu gọi hành động

Sách trắng này là lời mời gọi cộng đồng toàn cầu hình dung lại vai trò của dữ liệu trong AI Nguồn Mở. Sách trắng này thách thức chúng ta:

  • Cộng tác giữa các lĩnh vực, từ dữ liệu mở và khoa học mở đến các tổ chức văn hóa.

  • Trao quyền cho các cộng đồng, đặc biệt là ở các khu vực chưa được phục vụ đầy đủ, để định hình cách sử dụng dữ liệu của họ.

  • Ưu tiên các mô hình AI nhỏ hơn, cục bộ để phản ánh các bối cảnh và nhu cầu cụ thể, giảm sự phụ thuộc vào các hệ thống đơn khối.

Việc phát hành sách trắng này đánh dấu một thời điểm quan trọng trong quá trình phát triển của AI Nguồn Mở. Sách trắng này đại diện cho trí tuệ tập thể của các chuyên gia quản trị dữ liệu và Nguồn Mở trên toàn thế giới, tập hợp xung quanh tầm nhìn chung về sự công bằng, tính bao hàm toàn diện và tính bền vững. Chúng tôi hy vọng nguồn tài nguyên này sẽ thúc đẩy cuộc trò chuyện xung quanh dữ liệu đào tạo trong AI Nguồn Mở.

Hãy đọc toàn bộ sách trắng và tham gia cùng chúng tôi. Cùng nhau, chúng ta có thể tạo ra một thế giới mà dữ liệu vừa là nguồn lực vừa là nền tảng chung cho sự đổi mới công bằng.

Quản trị dữ liệu trong AI Nguồn Mở. Tải xuống (bản dịch sang tiếng Việt)

---------------

Giới thiệu

Tiến sĩ Alek Tarkowski là Giám đốc Chiến lược tại Open Future. Ông có bằng Tiến sĩ xã hội học của Viện Hàn lâm Khoa học Ba Lan. Ông có hơn 15 năm kinh nghiệm trong việc vận động vì lợi ích công cộng, xây dựng phong trào và nghiên cứu về mối quan hệ giữa xã hội, văn hóa và các công nghệ kỹ thuật số.

OSI là cơ quan có thẩm quyền định nghĩa Nguồn Mở, được các cá nhân, công ty và các tổ chức công trên toàn cầu công nhận.

Open Future là một nhóm chuyên gia tư vấn của Châu Âu phát triển các phương pháp tiếp cận mới đối với Internet mở nhằm tối đa hóa lợi ích của xã hội từ dữ liệu, kiến ​​thức và văn hóa được chia sẻ.

Artificial intelligence (AI) is changing the world at a remarkable pace, with Open Source AI playing a pivotal role in shaping its trajectory. Yet, as AI advances, a fundamental challenge emerges: How do we create a data ecosystem that is not only robust but also equitable and sustainable?

The Open Source Initiative (OSI) and Open Future have taken a significant step toward addressing this challenge by releasing a white paper: “Data Governance in Open Source AI: Enabling Responsible and Systematic Access.” This document is the culmination of a global co-design process, enriched by insights from a vibrant two-day workshop held in Paris in October 2024.

A turning point for Open Source AI

At its core, this white paper addresses a pressing question: How can we responsibly govern the data that fuels Open Source AI? The answer requires a profound transformation in how we think about data. It’s not just a resource to exploit but a shared commons—a collective foundation upon which innovation can flourish while respecting rights and fostering equity.

Open Source AI thrives on shared datasets. Yet, the current landscape is fraught with challenges:

  • Openness and transparency: Many AI models labeled “open” lack transparency regarding data provenance, licensing and usage restrictions, creating confusion about what truly constitutes Open Source AI.

  • Data scarcity and inequity: Despite the vast amount of information on the internet, many datasets are of low quality and fail to represent the diversity of our world.

  • Privacy concerns: Some data cannot be legally shared due to varied laws across jurisdictions concerning personal data and international human rights standards on the right to privacy.

  • Stakeholder representation: The AI ecosystem often prioritizes developers and corporations over contributors, affected communities, and public interest organizations.

  • Environmental sustainability: AI’s resource-intensive nature raises concerns about its environmental impact..

A vision for change

The white paper offers a blueprint for a data ecosystem rooted in fairness, inclusivity and sustainability. It calls for two transformative shifts:

  1. From Open Data to Data Commons: Moving beyond the notion of unrestricted data to a model that balances openness with the rights and needs of all stakeholders.

  2. Broadening the stakeholder universe: Creating collaborative frameworks that unite communities, stewards and creators in equitable data-sharing practices.

To bring these shifts to life, the white paper delves into six critical focus areas:

  • Data preparation

  • Preference signaling and licensing

  • Data stewards and custodians

  • Environmental sustainability

  • Reciprocity and compensation

  • Policy interventions

Each focus area is a stepping stone toward building a future where data empowers rather than exploits, where it reflects the diversity of human experience rather than reinforcing systemic inequities.

A call to action

This white paper is an invitation to the global community to reimagine the role of data in Open Source AI. It challenges us to:

  • Collaborate across sectors, from open data and open science to cultural institutions.

  • Empower communities, particularly in underserved regions, to shape how their data is used.

  • Prioritize smaller, localized AI models that reflect specific contexts and needs, reducing reliance on monolithic systems.

The release of this white paper marks a pivotal moment in the evolution of Open Source AI. It represents the collective wisdom of data governance and Open Source experts worldwide, coalescing around a shared vision of fairness, inclusivity, and sustainability. We hope this resource will catalyze the conversation around training data in Open Source AI.

Read the full white paper and join us. Together, we can create a world where data is both a resource and a shared foundation for equitable innovation.

Data Governance in Open Source AI Download

About

Dr. Alek Tarkowski is the Strategy Director at Open Future. He holds a PhD in sociology from the Polish Academy of Science. He has over 15 years of experience with public interest advocacy, movement building, and research into the intersection of society, culture, and digital technologies.

The OSI is the authority that defines Open Source, recognized globally by individuals, companies, and by public institutions.

Open Future is a European think tank that develops new approaches to an open internet that maximize societal benefits of shared data, knowledge and culture.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Tư, 26 tháng 2, 2025

‘Quản trị dữ liệu trong AI Nguồn Mở. Xúc tác cho quyền truy cập có trách nhiệm và có hệ thống’ - bản dịch sang tiếng Việt


Là bản dịch sang tiếng Việt của tài liệu do Sáng kiến Nguồn Mở - OSI (Open Source Initiative) và Tương lai Mở (Open Future) đồng xuất bản ngày 22/01/2025; Giấy phép mở CC BY-SA 4.0.

Xét về tổng thể, công việc trong các lĩnh vực trọng tâm khác nhau này phục vụ hai mục tiêu. Đầu tiên, nó phục vụ mục đích tăng cường chia sẻ dữ liệu, bằng cách giúp nhiều loại dữ liệu dễ sử dụng hơn, bằng cách nâng cao chất lượng của các tập dữ liệu và đảm bảo rằng nhiều dữ liệu hơn có sẵn một cách công khai. Thứ hai, nó bảo vệ tài sản chung kiến thức (knowlegde commons) bằng cách thừa nhận nhiều khía cạnh xã hội của việc tạo ra dữ liệu và các xung đột pháp lý liên quan, đồng thời triển khai các cơ chế khác ngoài các giấy phép để cung cấp khả năng quản trị đầy đủ.

Cần phải nỗ lực hơn nữa đối với cả các tập dữ liệu hiện có và mới. Có cơ hội để cải thiện khả năng quản trị các tập dữ liệu hiện có do các nhà phát triển AI tạo ra dưới dạng công cụ — đặc biệt là những công cụ thường được sử dụng lại cho các giải pháp AI Nguồn Mở. Ngoài ra, cần phải thiết kế và xây dựng các tập dữ liệu vừa tăng khối lượng dữ liệu có sẵn để đào tạo AI vừa thiết lập các tiêu chuẩn quản trị dữ liệu chặt chẽ hơn. Cuối cùng, cần phải công nhận nhiều bộ sưu tập hiện có là nguồn dữ liệu đào tạo AI tiềm năng, đồng thời công nhận giá trị vốn có của chúng và thừa nhận các hình thức hiện có mà chúng được quản lý và duy trì.

Ngoài ra, cần tiếp tục nỗ lực tập thể để thiết lập, khi có thể, các tiêu chuẩn liên quan đến quản trị dữ liệu và cung cấp hướng dẫn về cách thức triển khai các tiêu chuẩn này.

Tự do tải về bản dịch sang tiếng Việt của tài liệu có 47 trang tại địa chỉ: https://www.dropbox.com/scl/fi/ehhz9f05ehs4s8tufsqig/2025-OSI-DataGovernanceOSAI_Vi-13022025.pdf?rlkey=yxmhheyfns07mg50x80x7s1pm&st=oty7rkkf&dl=0

Xem thêm:

Blogger: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Ba, 25 tháng 2, 2025

Bạn cần biết những gì về các khung năng lực AI mới của UNESCO cho học sinh và giáo viên

GOALLORD-CREATIVITY/Shutterstock.com

What you need to know about UNESCO's new AI competency frameworks for students and teachers

3 September 2024. Last update:18 September 2024

Theo: https://www.unesco.org/en/articles/what-you-need-know-about-unescos-new-ai-competency-frameworks-students-and-teachers

Bài được đưa lên Internet ngày: 03/09/2024. Cập nhật mới nhất: 18/09/2024

Trí tuệ nhân tạo – AI (Artificial Intelligence) đang biến đổi nhanh chóng thế giới của chúng ta và thay đổi cách chúng ta sống, làm việc và học tập. Để giúp các hệ thống giáo dục bắt kịp, UNESCO đã phát hành 2 khung năng lực AI mới - một cho học sinh và một cho giáo viên.

Các khung này nhằm hướng dẫn các quốc gia hỗ trợ học sinh và giáo viên hiểu tiềm năng cũng như các rủi ro của AI để tham gia với nó một cách an toàn, có đạo đức và có trách nhiệm trong giáo dục và hơn thế nữa. Các khung được phát hành nhân dịp Tuần lễ Học tập Kỹ thuật số 2024, một trong các sự kiện chính thường niên của UNESCO.

Đây là những gì bạn cần biết về các sáng kiến mới nhất của UNESCO để tích hợp các năng lực AI vào giáo dục.

Vì sao UNESCO tập trung vào AI tách biệt khỏi các công nghệ kỹ thuật số khác trong giáo dục?

AI là phân biệt được với các công nghệ kỹ thuật số khác vì tiềm năng của nó để định hình lại sâu sắc các xã hội, nền kinh tế và hệ thống giáo dục. Không giống như các công nghệ thông tin và truyền thông (CNTT-TT), AI đặt ra các thách thức độc nhất vô nhị về đạo đức và xã hội, chẳng hạn như các vấn đề về tính công bằng, minh bạch, quyền riêng tư và trách nhiệm giải trình. Ngoài ra, khả năng độc đáo của AI để bắt chước hành vi của con người trực tiếp tác động đến quyền tự quyết của con người. Cách thách thức đó đòi hỏi các năng lực chuyên dụng ngoài phạm vi hiểu biết kỹ thuật số truyền thống.

Trong khi UNESCO đã cung cấp hướng dẫn về các năng lực kỹ thuật số nhiều năm qua, các khung năng lực AI mới này được điều chỉnh để giải quyết các sắc thái cụ thể của AI. Chúng nhấn mạnh cách tiếp cận lấy con người làm trung tâm cho giáo dục AI, thúc đẩy tư duy phản biện, các xem xét về đạo đức và sử dụng có trách nhiệm các công nghệ AI.

Vì sao các khung năng lực AI quan trọng đối với các quốc gia?

Khi AI ngày càng được tích hợp vào tất cả các khía cạnh xã hội, các hệ thống giáo dục khắp trên thế giới đang vật lộn để bắt kịp. Các khung này cung cấp lộ trình rất cần thiết cho các quốc gia để phát triển các chiến lược giáo dục AI sáng suốt về đạo đức, toàn diện, tùy chỉnh được và hướng về phía trước.

Bằng việc giúp cho học sinh và giáo viên hiểu tiềm năng và các hạn chế của AI, các khung đó nhằm trao quyền cho họ để sử dụng Ai có trách nhiệm và sáng suốt, đảm bảo rằng AI đóng góp tích cực cho xã hội và môi trường.

Cách tiếp cận về AI trong giáo dục của UNESCO là gì?

UNESCO dùng cách tiếp cận lấy con người làm trung tâm cho AI trong giáo dục, nhấn mạnh việc nâng cao các năng lực con người và thúc đẩy công bằng xã hội, tính bền vững và phẩm giá của con người. Điều này phù hợp với các nguyên tắc được nêu trong Hướng dẫn của UNESCO về AI tạo sinh trong giáo dục và nghiên cứu cũng như Khuyến nghị về đạo đức của Trí tuệ nhân tạo năm 2021 và Đồng thuận Bắc Kinh về trí tuệ nhân tạo và giáo dục năm 2019.

Các khung mới này nhấn mạnh AI cần hỗ trợ việc ra quyết định và sự phát triển trí tuệ của con người, thay vì làm xói mòn hoặc thay thế nó. Các khung đó cũng nêu bật tầm quan trọng của việc tôn trọng các quyền và đa dạng văn hóa của con người trong thiết kế và sử dụng các công nghệ AI.

Các yếu tố chính của khung năng lực AI cho học sinh là gì?

Khung năng lực AI cho học sinh (bản dịch sang tiếng Việt) được thiết kế để hướng dẫn các nhà hoạch định chính sách, các nhà giáo dục và các nhà phát triển chương trình giảng dạy trong việc trang bị cho học sinh các kỹ năng, kiến thức và giá trị cần thiết để tham gia với AI một cách hiệu quả. Nó tập trung vào 4 năng lực cốt lõi:

  • Tư duy lấy con người làm trung tâm: khuyến khích học sinh hiểu và khẳng định vai trò của mình trong mối quan hệ với AI.

  • Đạo đức AI: Dạy sử dụng có trách nhiệm, thiết kế có đạo đức và thực hành an toàn.

  • Kỹ thuật và ứng dụng AI: Cung cấp kiến thức nền tảng về AI và các kỹ năng.

  • Thiết kế hệ thống AI: Thúc đẩy giải quyết vấn đề, tư duy sáng tạo và thiết kế.

Khung này khuyến khích tích hợp các chủ đề liên quan đến Ai vào các môn học cốt lõi khắp chương trình giảng dạy, nhấn mạnh việc học tập liên ngành trong cả STEM và các nghiên cứu xã hội.


Khung năng lực AI cho giáo viên bao gồm những gì?

Khung năng lực AI cho giáo viên (bản dịch sang tiếng Việt) tập trung vào việc phát triển chuyên môn suốt đời cho giáo viên, cung cấp một khung tham chiếu để phát triển các chương trình đào tạo và năng lực quốc gia. Nó nhằm mục đích đảm bảo rằng các giáo viên được trang bị để sử dụng AI có trách nhiệm và hiệu quả trong khi giảm thiểu các rủi ro tiềm tàng cho học sinh và xã hội. Có 5 lĩnh vực năng lực gồm:

  • Tư duy lấy con người làm trung tâm: Tập trung vào quyền tự quyết, trách nhiệm giải trình và trách nhiệm xã hội của con người.

  • Đạo đức AI: Thúc đẩy các nguyên tắc đạo đức và sử dụng có trách nhiệm.

  • Nền tảng và ứng dụng AI: Cung cấp kiến thức, hiểu biết và các kỹ năng cần thiết để sáng tạo và sử dụng AI.

  • Sư phạm AI: Hỗ trợ các giáo viên tận dụng AI cho các phương pháp giảng dạy đổi mới.

  • AI để phát triển chuyên môn: Phác thảo các năng lực của giáo viên để tận dụng AI hướng tới phát triển chuyên môn suốt đời.

Khung này nhấn mạnh rằng các công cụ AI nên bổ sung, không thay thế, các vai trò và trách nhiệm rất quan trọng của giáo viên trong giáo dục.



Các khuyến nghị chính sách rộng hơn cho AI trong giáo dục của UNESCO là gì?

UNESCO khuyến nghị rằng các khung năng lực Ai cho học sinh và giáo viên được tích hợp vào một chiến lược toàn diện về xây dựng năng lực AI khắp tất cả các mức giáo dục. Điều này bao gồm việc đảm bảo quyền truy cập phổ cập tới Internet, thực thi các nguyên tắc thiết kế có đạo đức cho các công cụ AI, và thúc đẩy các thực hành Ai thân thiện với môi trường.

UNESCO cũng cảnh báo chống lại việc dựa quá đáng vào Ai trong việc giải quyết các vấn đề có tính hệ thống trong giáo dục, chẳng hạn như thiếu giáo viên và không đủ hạ tầng, điều đòi hỏi sự chú ý và đầu tư chính sách được duy trì bền vững.

Vì AI tiếp tục định hình tương lai của chúng ta, các khung mới của UNESCO cung cấp hướng dẫn rất quan trọng cho việc chuẩn bị học sinh và giáo viên để điều hướng bối cảnh này. Các khung đó đại diện cho lời kêu gọi hành động đối với các quốc gia để phát triển các chiến lược AI quốc gia có đạo đức, toàn diện, và phù hợp với các giá trị lấy con người làm trung tâm.

Artificial Intelligence (AI) is rapidly transforming our world and changing the way we live, work and learn. To help education systems keep pace, UNESCO is launching two new AI competency frameworks - one for students and one for teachers.

These frameworks aim to guide countries in supporting students and teachers to understand the potential as well as risks of AI in order to engage with it in a safe, ethical and responsible manner in education and beyond. They are launched on the occasion of Digital Learning Week 2024, one of UNESCO’s annual flagship events. 

Here’s what you need to know about UNESCO’s latest initiatives to integrate AI competencies in education.

Why is UNESCO focusing on AI separately from other digital technologies in education?

AI is distinct from other digital technologies due to its potential to profoundly reshape societies, economies and education systems. Unlike conventional information and communication technologies (ICTs), AI poses unique ethical and social challenges, such as issues of fairness, transparency, privacy and accountability. Additionally, AI's unique ability to mimic human behavior directly impacts human agency. These challenges require dedicated competencies beyond the scope of traditional digital literacy.

While UNESCO has provided guidance on digital competencies for many years, the new AI competency frameworks are tailored to address the specific nuances of AI. They emphasize a human-centred approach to AI education, promoting critical thinking, ethical considerations and responsible use of AI technologies.

Why are the AI competency frameworks important for countries?

As AI becomes increasingly integrated into all aspects of society, education systems worldwide are struggling to keep up. The frameworks provide a much-needed roadmap for countries to develop AI education strategies that are ethically informed, inclusive, adaptable and forward-looking.

By helping students and teachers understand AI's potential and limitations, these frameworks aim to empower them to use AI responsibly and thoughtfully, ensuring that AI contributes positively to society and the environment.

What is UNESCO's approach to AI in education?

UNESCO takes a human-centred approach to AI in education, emphasizing the enhancement of human capabilities and the promotion of social justice, sustainability and human dignity. This aligns with the principles outlined in UNESCO’s guidance on generative AI in education and research  as well as the 2021 Recommendations on the ethics of Artificial Intelligence and the 2019 Beijing consensus on Artificial Intelligence and education.

The new frameworks stress that AI should support human decision-making and intellectual development, rather than undermine or replace it. They also highlight the importance of respecting human rights and cultural diversity in the design and use of AI technologies.

What are the key elements of the AI competency framework for students?

The AI competency framework for students is designed to guide policy-makers, educators and curriculum developers in equipping students with the necessary skills, knowledge and values to engage with AI effectively. It focuses on four core competencies:

  • A human-centred mindset: Encouraging students to understand and assert their agency in relation to AI.

  • Ethics of AI: Teaching responsible use, ethics-by-design and safe practices.

  • AI techniques and applications: Providing foundational AI knowledge and skills.

  • AI system design: Fostering problem-solving, creativity and design thinking.

The framework encourages integrating AI-related topics into core subjects across the curriculum, emphasizing interdisciplinary learning in both STEM and the social studies.

What does the AI competency framework for teachers cover?

The AI competency framework for teachers is focused on lifelong professional development for teachers, offering a reference framework for national competency development and training programmes. It aims to ensure that teachers are equipped to use AI responsibly and effectively while minimizing potential risks to students and society. The five key competency areas are:

  • A human-centred mindset: Focusing on human agency, accountability and social responsibility.

  • Ethics of AI: Promoting ethical principles and responsible use.

  • AI foundations and applications: Providing the knowledge, understanding and skills needed to create and use AI.

  • AI pedagogy: Supporting teachers in leveraging AI for innovative teaching methods.

  • AI for professional development: Outlining teachers’ capacities to leverage AI for driving their own lifelong professional development.

The framework emphasizes that AI tools should complement, not replace, the vital roles and responsibilities of teachers in education.

What are UNESCO's broader policy recommendations for AI in education?

UNESCO recommends that AI competency frameworks for students and teachers be integrated into a comprehensive strategy for AI capacity building across all educational levels. This includes ensuring universal access to the internet, enforcing ethical design principles for AI tools, and promoting environmentally-friendly AI practices.

UNESCO also warns against over-reliance on AI in addressing systemic issues in education, such as teacher shortages and infrastructure inadequacies, which require sustained policy attention and investment.

As AI continues to shape our future, UNESCO's new frameworks provide critical guidance for preparing students and teachers to navigate this landscape. These frameworks represent a call to action for countries to develop national AI strategies that are ethical, inclusive, and aligned with human-centered values.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com


Thứ Hai, 24 tháng 2, 2025

Khung năng lực AI cho học sinh


AI competency framework for students

8 August 2024

Last update:7 February 2025

Theo: https://www.unesco.org/en/articles/ai-competency-framework-students

Bài được đưa lên Internet ngày: 08/08/2024. Cập nhật mới nhất: 07/02/2025

Ấn phẩm này nhằm để giúp các nhà giáo dục tích hợp các mục tiêu học tập vào chương trình giảng dạy chính quy của nhà trường để chuẩn bị cho học sinh trở thành các công dân có trách nhiệm và sáng tạo trong kỷ nguyên AI.

Trí tuệ nhân tạo - AI (Artificial Intelligence) ngày càng trở nên không thể thiếu trong cuộc sống của chúng ta, cần thiết cho các hệ thống giáo dục chủ động tích cực chuẩn bị cho học sinh trở thành những người dùng AI có trách nhiệm và người đồng sáng tạo AI. Việc tích hợp các mục tiêu học tập AI vào chương trình giảng dạy chính quy của nhà trường là rất quan trọng cho học sinh trên phạm vi toàn cầu để tham gia với AI một cách an toàn và có ý nghĩa.

Khung năng lực AI cho học sinh của UNESCO có mục đích để giúp cho các nhà giáo dục trong việc tích hợp này, phác thảo 12 năng lực xuyên khắp 4 chiều:

  • Tư duy lấy con người làm trung tâm

  • Đạo đức AI

  • Kỹ thuật và ứng dụng AI

  • Thiết kế hệ thống AI

Các năng lực đó bao trùm 3 mức thông thạo:

  • Hiểu

  • Áp dụng

  • Sáng tạo

Khung này chi tiết hóa các mục tiêu của chương trình giảng dạy và các phương pháp sư phạm của các lĩnh vực cụ thể.

Dựa vào tầm nhìn sinh viên như những người đồng sáng tạo AI và các công dân có trách nhiệm về AI, ấn phẩm này nhấn mạnh sự phán xét rất quan trọng các giải pháp AI, nhận thức về các trách nhiệm quyền công dân trong kỷ nguyên AI, kiến thức nền tảng về AI cho việc học tập suốt đời, và thiết kế AI toàn diện, bền vững.



This publication aims to help educators integrating artificial intelligence learning objectives into official school curricula to prepare students to be responsible and creative citizens in the era of AI.

Artificial intelligence is increasingly integral to our lives, necessitating proactive education systems to prepare students as responsible users and co-creators of AI. Integrating AI learning objectives into official school curricula is crucial for students globally to engage with AI safely and meaningfully.

The UNESCO AI Competency Framework for Students aims to help educators in this integration, outlining 12 competencies across four dimensions:

  • A human-centred mindset

  • Ethics of AI

  • AI techniques and applications

  • AI system design

These competencies span three progression levels:

  • Understand

  • Apply

  • Create

The framework details curricular goals and domain-specific pedagogical methodologies.

Grounded in the vision of students as AI co-creators and responsible citizens, the publication emphasizes critical judgement of AI solutions, awareness of citizenship responsibilities in the AI era, foundational AI knowledge for lifelong learning, and inclusive, sustainable AI design.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Chủ Nhật, 23 tháng 2, 2025

Khung năng lực AI cho giáo viên


AI competency framework for teachers

8 August 2024. Last update:6 September 2024

Theo: https://www.unesco.org/en/articles/ai-competency-framework-teachers

Bài được đưa lên Internet ngày: 08/08/2024. Cập nhật mới nhất: 06/09/2024

Hướng dẫn giáo viên về sử dụng và lạm dụng trí tuệ nhân tạo - AI (Artificial Intelligence) trong giáo dục, ấn phẩm này định nghĩa kiến thức, các kỹ năng và giá trị các giáo viên phải làm chủ trong kỷ nguyên AI.

AI xử lý lượng thông tin khổng lồ, sinh ra nội dung mới, và giúp ra quyết định thoogn qua các phân tích dự báo. Trong giáo dục, AI đã chuyển mối quan hệ truyền thống giữa giáo viên - học sinh thành mối quan hệ động giáo viên - AI - học sinh.

Sự dịch chuyển này đòi hỏi xem xét lại vai trò của giáo viên và các năng lực họ cần trong kỷ nguyên AI. Tuy nhiên, rất ít quốc gia đã định nghĩa các năng lực này hoặc phát triển các chương trình quốc gia để đào tạo giáo viên về AI, khiến nhiều nhà giáo dục không có sự hướng dẫn phù hợp.

Khung năng lực AI cho giáo viên giải quyết khoảng trống này bằng cách định nghĩa kiến thức, các kỹ năng và giá trị các giáo viên phải làm chủ trong kỷ nguyên AI. Được phát triển với các nguyên tắc bảo vệ các quyền của giáo viên, nâng cao quyền tự quyết của con người, và thúc đẩy tính bền vững, ấn phẩm phác thảo 15 năng lực xuyên suốt 5 chiều:

  • Tư duy lấy con người làm trung tâm

  • Đạo đức AI

  • Nền tảng và ứng dụng AI

  • Sư phạm AI

  • AI cho việc học tập chuyên môn.

Các năng lực đó được phân loại thành 3 mức thông thạo:

  • Giành được

  • Áp dụng

  • Sáng tạo

Như một tham chiếu toàn cầu, công cụ này hướng dẫn sự phát triển các khung năng lực AI quốc gia, thông tin cho các chương trình đào tạo giáo viên, và giúp thiết kế các tham số đánh giá. Nó cũng cung cấp các chiến lược cho giáo viên để xây dựng kiến thức AI, áp dụng các nguyên tắc đạo đức, và hỗ trợ sự phát triển chuyên môn của họ.




Guiding teachers on artificial intelligence (AI) use and misuse in education, this publication defines the knowledge, skills, and values teachers must master in the age of AI.

AI processes vast information, generates new content, and helps decision-making through predictive analyses. In education, AI has transformed the traditional teacher-student relationship into a teacher-AI-student dynamic.

This shift requires a re-examination of teachers' roles and the competencies they need in the AI era. Yet, few countries have defined these competencies or developed national programmes to train teachers in AI, leaving many educators without proper guidance.

The AI Competency Framework for Teachers addresses this gap by defining the knowledge, skills, and values teachers must master in the age of AI. Developed with principles of protecting teachers' rights, enhancing human agency, and promoting sustainability, the publication outlines 15 competencies across five dimensions:

  • Human-centred mindset

  • Ethics of AI

  • AI foundations and applications

  • AI pedagogy

  • AI for professional learning.

These competencies are categorized into three progression levels:

  • Acquire

  • Deepen

  • Create

As a global reference, this tool guides the development of national AI competency frameworks, informs teacher training programmes, and helps in designing assessment parameters. It also provides strategies for teachers to build AI knowledge, apply ethical principles, and support their professional growth.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Năm, 20 tháng 2, 2025

‘Khung năng lực AI cho học sinh’ - bản dịch sang tiếng Việt


Là bản dịch sang tiếng Việt của tài liệu do UNESCO xuất bản năm 2024. Giấy phép CC BY-SA 3.0 IGO.

Khung năng lực AI cho học sinh


Khung năng lực AI cho học sinh
vạch ra một chương trình hướng đến hành động dựa trên ba giả định cơ bản về vai trò của giáo dục trong việc ứng phó với việc áp dụng AI tràn lan trên thế giới ngày nay. Giả định đầu tiên là ngành giáo dục, thay vì chỉ thích ứng với các hệ thống và công cụ AI, phải chủ động phát triển các năng lực cần thiết để định hình AI có đạo đức và thân thiện với môi trường. Thứ hai, học sinh phải được trang bị các năng lực để đóng vai trò là người dùng có trách nhiệm và có phản biện, đồng thời là người đồng sáng tạo AI, cũng như là người dẫn đầu trong việc xác định và thiết kế thế hệ công nghệ AI tiếp theo. Giả định thứ ba là năng lực AI của học sinh phải được xây dựng xung quanh sự hội tụ của tư duy và thái độ lấy con người làm trung tâm, đạo đức nội tại của AI, kiến thức và kỹ năng khái niệm có thể chuyển giao về AI, cũng như tư duy hướng đến tương lai liên quan đến thiết kế hệ thống AI. Vì quá trình phát triển năng lực AI vượt xa các kỹ năng kỹ thuật đơn thuần liên quan đến việc học cách lập trình hoặc vận hành các công cụ AI, nên việc tích hợp việc học liên quan đến AI đòi hỏi một cách tiếp cận liên ngành đối với việc tích hợp chương trình giảng dạy, bao gồm các môn học liên quan đến khoa học, công nghệ, kỹ thuật, nghệ thuật và toán học, đến các nghiên cứu xã hội và giáo dục công dân.

Khung năng lực AI cho học sinh này là nỗ lực đầu tiên nhằm cung cấp một bản thiết kế toàn cầu để định hướng quá trình tích hợp lấy con người làm trung tâm của việc học liên quan đến AI vào chương trình giảng dạy. Được thông tin từ chuyên môn và tham vấn ở cấp độ quốc tế, khung này đóng vai trò là tài liệu tham khảo toàn cầu để điều chỉnh trong nhiều bối cảnh giáo dục địa phương khác nhau. Chỉ thông qua việc điều chỉnh và thử nghiệm khung này giữa các giáo viên và các nhà giáo dục giáo viên trong nhiều bối cảnh khác nhau, và đưa ra những hiểu biết sâu sắc từ thực hành theo ngữ cảnh của họ, thì khung toàn cầu này mới có thể được tinh chỉnh hơn nữa. Do đó, khung này là một tài liệu sống cần được xem xét liên tục trên cơ sở phân tích thực hành trong nhiều bối cảnh khác nhau, cũng như để ứng phó với các lần lặp lại mới của công nghệ AI sẽ xuất hiện.

Tự do tải về bản dịch sang tiếng Việt của tài liệu có 94 trang tại địa chỉ: https://zenodo.org/records/14903158

Xem thêm:

Blogger: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Tư, 19 tháng 2, 2025

‘Khung năng lực AI cho giáo viên’ - bản dịch sang tiếng Việt


Là bản dịch tài liệu do UNESCO xuất bản năm 2024, giấy phép CC BY-SA 3.0 IGO.

Khung năng lực AI cho giáo viên


Khung năng lực AI cho giáo viên - AI CFT (AI Competency Framework for Teachers) có mục đích khẳng định vai trò quan trọng của giáo viên trong việc đảm bảo áp dụng AI vào giáo dục một cách có đạo đức và hiệu quả. AI CFT cũng nhằm mục đích thông báo cho các nhà hoạch định chính sách, nhà cung cấp chương trình đào tạo giáo viên, nhân viên của các cơ sở đào tạo giáo viên, các lãnh đạo nhà trường và bản thân các giáo viên về sự phát triển năng động của các năng lực mà quá trình chuyển đổi giáo dục trong kỷ nguyên AI có thể đòi hỏi. Thông qua việc ra mắt AI CFT, UNESCO kêu gọi các quốc gia thành viên đẩy nhanh quá trình phát triển các khung năng lực AI quốc gia và cung cấp các chương trình đào tạo giáo viên để hỗ trợ việc học tập chuyên môn suốt đời.

Với bản chất của AI là một công nghệ đa năng có tiềm năng chuyển đổi đáng kể các mô hình kinh doanh trên nhiều lĩnh vực kinh tế và sự tiến bộ nhanh chóng theo cấp số nhân, rất có thể sự phát triển hơn nữa của AI và tác động của nó đối với giáo dục sẽ vượt xa các lần lặp lại của AI CFT. Trong khi đó, sự quan tâm ngày càng gia tăng đối với AI và các thử nghiệm về AI trong giáo dục sẽ tạo ra vô số cách tiếp cận để sử dụng AI trong giáo dục và đặc biệt là ứng dụng AI CFT. Để ứng phó với những thách thức này, UNESCO coi AI CFT là một 'khung chính' (Master Framework), thay vì là bản thiết kế mang tính quy định về kiến thức và kỹ năng AI. Nó được thiết kế để giúp định hình các khung quốc gia, cấp tiểu bang và/hoặc cơ sở có thể phản ánh những tiến bộ công nghệ theo thời gian và nhu cầu thay đổi trong các bối cảnh địa phương đa dạng và khác nhau. Do đó, UNESCO khuyến nghị rằng AI CFT có thể được sử dụng như một công cụ định hình bao quát và lộ trình mở đối với các nhà hoạch định chính sách và nhà phát triển các chương trình đào tạo để liên tục tinh chỉnh định nghĩa về năng lực AI và truyền cảm hứng cho các phương pháp phát triển năng lực sáng tạo.

Đây là phiên bản đầu tiên của khung năng lực AI cho giáo viên. Dự kiến sẽ được cập nhật dựa trên phương pháp tiếp cận có sự tham gia. Các bên liên quan tham gia vào quá trình phát triển chuyên môn của giáo viên được khuyến khích tham gia và chia sẻ kinh nghiệm của họ với các giảng viên đồng cấp và với UNESCO, nhằm mục đích đồng sáng tạo các phiên bản tiếp theo của khung này.

Tự do tải về bản dịch sang tiếng Việt của tài liệu có 73 trang tại địa chỉ: https://zenodo.org/records/14897590

Xem thêm:

Blogger: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Ba, 18 tháng 2, 2025

Dữ liệu để phân loại AI


A data for AI taxonomy

Tue Oct 15, 2024

Theo: https://theodi.org/news-and-events/blog/a-data-for-ai-taxonomy/

Bài được đưa lên Internet ngày: 15/10/2024

Chúng tôi đã phát triển sự phân loại dữ liệu có liên quan đến việc phát triển, sử dụng và giám sát các mô hình và hệ thống AI nền tảng.

Các hệ thống trí tuệ nhân tạo (AI) hiện đại được đặc trưng bởi các mô hình phạm vi rộng và tính linh hoạt cao, có khả năng sản sinh ra các kết quả đầu ra phong phú.

Nhận biết cả tiềm năng và rủi ro của các mô hình mới đó, Viện Dữ liệu Mở - ODI (Open Data Institute) đã bắt tay vào một chương trình công việc về AI lấy dữ liệu làm trung tâm (Data-centric AI), được thiết kế để mang lại một hệ sinh thái AI dựa trên các thực hành dữ liệu có trách nhiệm.

Như một phần của công việc này, chúng tôi đã bắt đầu phát triển sự phân loại dữ liệu có liên quan đến việc phát triển, sử dụng và giám sát các mô hình và hệ thống AI nền tảng. Đây là phản hồi cho cách dữ liệu được sử dụng để đào tạo các mô hình thường được mô tả như là một khối tĩnh, đơn lẻ và để chứng minh nhiều loại dữ liệu cần thiết để xây dựng, sử dụng và giám sát các hệ thống AI một cách an toàn và hiệu quả.

Cũng như việc sử dụng nó trong công việc của riêng chúng tôi, chúng tôi hy vọng phân loại này sẽ được những người khác sử dụng - đặc biệt các nhà nghiên cứu và các nhà hoạch định chính sách. Chúng tôi nghĩ nó sẽ bổ sung thêm sắc thái trong các cuộc tranh luận về dữ liệu cho AI, bao gồm ở những nơi quyền truy cập công bằng tới dữ liệu là rất cần thiết trong tương lai, liệu các nhà phát triển có thực sự sắp "hết dữ liệu" hay không và tập dữ liệu AI nào rất quan trọng đối với hệ sinh thái AI và do đó đòi hỏi sự quản lý đặc biệt chu đáo.

Dù được thiết kế để phản ánh dữ liệu có liên quan trong các mô hình lớn, nền tảng, chúng tôi nghi ngờ rằng phần lớn phân loại này cũng có thể áp dụng cho các mô hình nhỏ hơn và hẹp hơn.

Tải về phân loại (bản dịch sang tiếng Việt)

We've developed a taxonomy of the data involved in developing, using and monitoring foundation AI models and systems.

Modern artificial intelligence (AI) systems are characterised by models of large scale and high flexibility, capable of producing rich outputs.

Recognising both the potential and the risks of these new models, the Open Data Institute has embarked on a programme of work on data-centric AI, designed to bring about an AI ecosystem grounded in responsible data practices.

As part of this work, we set out to develop a taxonomy of the data involved in developing, using and monitoring foundation AI models and systems. It is a response to the way that the data used to train models is often described as if a static, singular blob, and to demonstrate the many types of data needed to build, use and monitor AI systems safely and effectively.

As well as using it in our own work, we hope for this taxonomy to be used by others - especially researchers and policymakers. We think it will add nuance in ongoing debates in data for AI, including where equitable access to data is badly needed going forward, whether developers are really about to ‘run out of data’, and which AI datasets are critical to the AI ecosystem and therefore require particularly thoughtful stewardship.

Although designed to reflect the data involved in large, foundation models, we suspect much of the taxonomy will also apply to smaller, narrower models too.

Download the taxonomy

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Hai, 17 tháng 2, 2025

‘Phân loại dữ liệu liên quan đến việc phát triển, sử dụng và giám sát các hệ thống AI (Dữ liệu phân loại AI)’ - bản dịch sang tiếng Việt


Là bản dịch sang tiếng Việt của tài liệu do Viện Dữ liệu Mở - ODI (Open Data Institute) xuất bản năm 2024.

ODI hy vọng phân loại này sẽ được những người khác sử dụng - đặc biệt các nhà nghiên cứu và các nhà hoạch định chính sách, chứ không chỉ dành cho các nhà phát triển các mô hình AI.

Tự do tải về bản dịch sang tiếng Việt của tài liệu có 7 trang tại địa chỉ: https://www.dropbox.com/scl/fi/g9rk3sxv0sgd8rlngg306/A_taxonomy_of_the_data_involved_in_developing_using_and_monitoring_AI_systems_Vi-18012025.pdf?rlkey=81i4gw8l2vdooyzipn7kxxrli&st=bhzf5if8&dl=0

Xem thêm:

Blogger: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Chủ Nhật, 16 tháng 2, 2025

“Chúng tôi không có hào nước”: Sự đổi mới đột phá của AI nguồn mở


We Have No Moat”: Open Source AI's Breakneck Innovation


Jim Zemlin, Executive Director at Linux Foundation

Published Feb 7, 2025

Theo: https://www.linkedin.com/pulse/we-have-moat-open-source-ais-breakneck-innovation-jim-zemlin-fsrwc

Bài được đưa lên Internet ngày: 07/02/2025

Vào tháng 5 năm 2023, một bản ghi nhớ từ một kỹ sư AI giấu tên của Google đã bị rò rỉ và nhanh chóng lan truyền trên các trang tin công nghệ, thu hút hàng nghìn bình luận trên Hacker News. Bản ghi nhớ có tiêu đề "Chúng tôi không có hào nước... Và OpenAI cũng vậy". Nội dung chính của bài đăng là thế này — hãy ngừng tập trung vào việc xây dựng mô hình khổng lồ tiếp theo và bắt đầu làm việc với cộng đồng nguồn mở vì cuối cùng họ sẽ đánh bại chúng ta. "Chúng tôi đã nhìn lại OpenAI rất nhiều. Ai sẽ vượt qua cột mốc tiếp theo? Động thái tiếp theo sẽ là gì? Nhưng sự thật khó chịu là chúng tôi không ở vị thế để giành chiến thắng trong cuộc chạy đua vũ trang này và OpenAI cũng vậy. Trong khi chúng tôi đang cãi vã, một phe phái thứ ba đã âm thầm ăn bữa trưa của chúng tôi. Tất nhiên, tôi đang nói về nguồn mở. Nói một cách đơn giản, họ đang vượt qua chúng tôi. Những thứ mà chúng tôi coi là "vấn đề mở lớn" đã được giải quyết và nằm trong tay mọi người ngày nay."

Bài đăng này ban đầu là để phản hồi về việc Meta phát hành các mô hình Llama có khả năng đầu tiên, nhanh chóng tạo ra nhiều nhánh được điều chỉnh cho vô số mục đích cụ thể. Vào thời điểm đó, các mô hình nguồn mở tương đương có xu hướng tụt hậu so với các mô hình nguồn đóng trên nhiều mặt trận và cần một số tháng để đạt được sự ngang bằng. Tuy nhiên, ngay cả khi đó, chữ viết tay đã ở trên tường. Ngày nay, trong thời đại của các mô hình AI tức thời và DeepSeek, lợi thế nhỏ về thời gian đưa ra thị trường đó đã thu hẹp lại còn 24 giờ. AI nguồn mở không chỉ đang chiến thắng mà còn phát triển nhanh đến mức Sam Altman đã công khai thừa nhận rằng ông có thể cần theo đuổi một chiến lược nguồn mở chặt chẽ hơn (Tôi để lịch cho bạn, Sam!).

Khi tôi viết vào tuần trước về DeepSeek và lý do tại sao AI nguồn mở sẽ chiến thắng trong cả ngắn hạn và dài hạn, tôi đã dự đoán rằng các phương pháp mà DeepSeek nêu bật sẽ dẫn đến làn sóng đổi mới nhanh chóng trong các mô hình AI. Ngay cả khi đó, các công ty đang nghiên cứu các phiên bản đáng tin cậy hơn và khả thi về mặt thương mại hơn của mô hình nền tảng R1 của DeepSeek khiến cổ phiếu lao dốc. Sau đó, OpenAI đã phát hành dịch vụ nghiên cứu nâng cao của riêng mình, Deep Research, vài ngày sau đó. Dịch vụ này kết hợp một LLM (có thể được chọn từ danh sách LLM hiện tại do OpenAI, 4o, o1, o3, v.v. cung cấp) và một “khung tác nhân” để hướng dẫn LLM cách sử dụng các công cụ như tìm kiếm trên web hoặc cách suy nghĩ thông qua việc sắp xếp quy trình của mình thành các bước hợp lý và sử dụng các công cụ như tìm kiếm trên web và sắp xếp các hành động của mình theo từng bước. Nó được thiết kế để thực hiện lý luận nâng cao, hoạt động như một nhà phân tích nghiên cứu và cung cấp các phân tích phức tạp về các dự án bao gồm hầu hết mọi chủ đề. Các chuyên gia AI như Ethan Mollick đã ca ngợi nó và nhiều người khác trực tuyến đang ca ngợi nó là công cụ tổng hợp tốt nhất mà họ từng thấy.

Một ngày sau, HuggingFace đã phát hành phiên bản nguồn mở của Deep Research, mặc dù chưa thể so sánh được nhưng khá gần. ( HuggingFace cũng đã đạt được tiến bộ trong việc tái tạo các phần còn thiếu của R1, chẳng hạn như tập dữ liệu và mã đào tạo). Deep Research chắc chắn đã được hưởng lợi từ dữ liệu, mô hình nền tảng và đào tạo của DeepSeek và đặc biệt là mô hình R1 của nó. Đó chính xác là lý do tại sao AI nguồn mở lại nhanh nhẹn và mạnh mẽ như vậy. (Hãy xem Nathan Lambert của AI2 nói gì về điều này). Không có hào nước theo thiết kế và nó làm nổi tất cả các con thuyền theo thiết kế. Trong khi đó, trong cộng đồng, năm đối thủ cạnh tranh Deep Research nguồn mở khác đã nổi lên (dzhng, assafelovic, nickscamara, jina-aimshumecảm ơn HuggingFace đã tìm ra chúng). Vào thời điểm bạn đọc bài viết này, rất có thể nhiều nhà phát triển AI đã công bố các phiên bản mới hơn và được cải tiến hơn. Khả năng sao chép nhanh chóng các khả năng khiến nhiều người ngạc nhiên, nhưng không phải tôi. Đổi mới nguồn mở đã diễn ra nhanh hơn đáng kể so với đổi mới nguồn đóng trong nhiều thập kỷ nay. Chúng ta đã chứng kiến ​​điều này tại Linux Foundation khi phần mềm nguồn mở đã thống trị thế giới phần mềm. Nói rõ hơn, phần mềm nguồn mở không tự làm được gì cả. Nó chỉ là mã nguồn. Các nhà phát triển giỏi nhất thế giới, đóng góp và cộng tác trong một mô hình đánh giá ngang hàng khoa học, mở đã tạo ra phần mềm tốt hơn mà nhiều nhà phát triển khác đã chọn sử dụng vì phần mềm nguồn mở tốt hơn các giải pháp thay thế. Điểm mấu chốt của tất cả những điều này là gì? AI nguồn mở đang tăng tốc. Khả năng của cộng đồng trong việc nhanh chóng bắt kịp bất kỳ sự phát triển mới nào là sự xác nhận rõ ràng về tốc độ và sức mạnh của AI nguồn mở, được thúc đẩy bởi bộ não của một cộng đồng tài năng khổng lồ và đang phát triển trên toàn thế giới. Hơn nữa, việc giữ bất kỳ cải tiến AI nào bị khóa trong một cái chai sẽ là một thách thức vô cùng lớn. Những tiến bộ trong quá trình chưng cất mô hình - một quá trình mà một mô hình lớn hơn, phức tạp hơn được sử dụng để đào tạo một phiên bản nhỏ hơn, hiệu quả hơn - cho phép các nhà nghiên cứu phân tích các hệ thống AI có sẵn công khai hiệu quả hơn. Thông qua quá trình chưng cất, những hiểu biết sâu sắc về đào tạo quan trọng có thể được trích xuất, giúp khả thi để phát triển các mô hình tương đương hoặc thậm chí hiệu quả hơn. Khả năng này không chỉ đẩy nhanh quá trình nghiên cứu và phát triển mà còn mở rộng hệ sinh thái đổi mới bằng cách cho phép một cộng đồng rộng lớn hơn thử nghiệm và cải thiện các mô hình hiện có. DeepSeek đã sử dụng quá trình chưng cất để tăng cường khả năng suy luận của loạt mô hình Qwen và LLama, thực sự tăng cường hiệu suất của chúng trong các tác vụ suy luận. Gần như đúng lúc, một bài báo được công bố từ các nhà nghiên cứu Stanford trình bày một cách đơn giản để chuyển đổi LLM mở thành mô hình lý luận, chỉ sử dụng 26 phút thời gian đào tạo và tốn 30 đô la (rõ ràng, chi phí của mô hình cơ sở cao hơn nhiều). Bí quyết bí mật là gì? Cung cấp cho nó 1.000 ví dụ lý luận có cấu trúc tốt và mở rộng quy trình suy nghĩ của nó. Sử dụng phương pháp đơn giản này (và hiện đã được công khai), họ đã có thể gần như đạt được hiệu suất của GPT o1 trong các bài toán khớp nối.

Vì các khả năng AI cơ bản đang tăng tốc rất nhanh trong mã nguồn mở, nên giá trị sẽ tăng lên và chảy đến các nhà cung cấp có thể cung cấp bảo mật, tính dễ sử dụng và trải nghiệm tốt nhất cho nhà phát triển và người tiêu dùng. Đây nên được coi là một chiến thắng tuyệt vời. Chỉ một năm trước, nhiều người trong lĩnh vực công nghệ lo sợ rằng thế giới đang phân chia thành những người giàu GPU và những người nghèo GPU — những người có quyền truy cập vào AI mạnh mẽ và những người không có. Chúng ta có thể thấy rằng đó là một điểm gây tranh cãi và điều đó rất quan trọng. Quyền truy cập dân chủ vào các khả năng AI trên khắp các quốc gia, các công ty ở mọi quy mô và các tổ chức phi chính phủ sẽ là nền tảng cơ bản cho sự đổi mới trong nhiều năm tới, trên nhiều lĩnh vực. Mở ra những chiến thắng trong các công nghệ thúc đẩy lợi ích chung. Luôn luôn. Hãy kéo cầu xuống vì thủy triều đang dâng.

In May 2023, a memo from an unnamed Google AI engineer leaked and quickly made the rounds of the tech newsophere, racking up thousands of comments on Hacker News. The memo was titled “ We Have No Moat…And Neither Does OpenAI”. The gist of the post was this — stop focusing on building the next giant model and start working with the open source community because they will beat us in the end.

“We’ve done a lot of looking over our shoulders at OpenAI. Who will cross the next milestone? What will the next move be? But the uncomfortable truth is we aren’t positioned to win this arms race and neither is OpenAI. While we’ve been squabbling, a third faction has been quietly eating our lunch. I’m talking, of course, about open source. Plainly put, they are lapping us. Things we consider “major open problems” are solved and in people’s hands today.“

This post was initially in response to the release of the first capable Llama models by Meta, which quickly yielded numerous offshoots tuned for myriad specific purposes. Back then, comparable open source models tended to lag closed source models on a variety of fronts, and required a number of months to reach parity. However, the handwriting was on the wall even then. Today, in the age of Instant AI models and DeepSeek, that slight time-to-market advantage has shrunk to 24 hours. Open source AI is not only winning but it’s moving so fast that Sam Altman has publicly admitted he may need to pursue a more rigorous open source strategy (My calendar is open for you, Sam!). 

When I wrote last week about DeepSeek and why open source AI will win both in the short and long run, I predicted that the methods DeepSeek highlighted would lead to a wave of rapid innovation in AI models. Even then, companies were working on more reliable and commercially viable versions of DeepSeek’s R1 foundational model which sent stocks into a nosedive. Then, OpenAI released its own advanced research offering, Deep Research, a few days later. This combined an LLM (which can be selected from the current list of LLMs provided by OpenAI, 4o, o1, o3, etc.) and an “agentic framework” to instruct the LLM how to use tools like web searches or how to think through organizing its process into logical steps and to use tools like web search and organize its actions in steps.

It was designed to perform advanced reasoning, function like a research analyst, and deliver complex analyses on projects covering almost any topic. AI experts like Ethan Mollick raved about it, and many others online are singing its praises as the best general agentic tool they have seen. 

A day later, HuggingFace released an open source version of Deep Research that, while not yet comparable, was pretty close. (HuggingFace has also made progress towards recreating R1’s missing pieces, such as dataset, and training code). Deep Research undoubtedly benefitted from the data, foundational model and training of DeepSeek and its R1 model in particular. Which is exactly why open source AI is so nimble and powerful. (Check out what Nathan Lambert of AI2 has to say about this).  There are no moats by design, and it floats all boats by design.

Meanwhile, in the community, five other open source Deep Research competitors emerged (dzhng, assafelovic, nickscamara, jina-ai and mshumer — h/t to HuggingFace for finding them). By the time you read this, it’s entirely likely more AI developers have published newer and improved versions.  The fast replication of capabilities surprised many, but not me. Open source innovation has moved significantly faster than closed source innovation for decades now. We’ve witnessed this at the Linux Foundation as open source software has eaten the software world. To be clear, the open source software didn’t do anything itself. It’s just source code. The world’s best developers, contributing and collaborating in an open, scientific peer review-esque model produced better software that many other developers chose to use because the open source software was just better than alternatives.  

The bottom line of all this? Open source AI is accelerating. The ability of the community to quickly match any new development is clear validation of the velocity and power of open source AI, driven by the brains of a massive and growing community of talent all over the world. What’s more, keeping any AI innovation locked in a bottle is going to be incredibly challenging. Advances in model distillation—a process by which a larger, complex model is used to train a smaller, more efficient version—enable researchers to dissect publicly available AI systems more effectively. Through distillation, key training insights can be extracted, making it feasible to develop comparable or even more efficient models. This capability not only accelerates research and development but also broadens the ecosystem of innovation by allowing a wider community to experiment with and improve upon existing models. DeepSeek used distillation to enhance the reasoning capabilities of the Qwen and LLama series of models, effectively supercharging their performance on reasoning tasks. 

Almost on cue, a paper dropped from Stanford researchers demonstrating a simple way to transform an open LLM into a reasoning model, using only 26 minutes of training time and costing $30 (obviously, the cost of the base model was a lot more). The secret trick? Feeding it 1,000 well-structured reasoning examples and extending its thinking process. Using this simple  (and now publicly known) method, they were able to nearly match the performance of GPT o1 on match problems. 

Because foundational AI capabilities are accelerating so quickly in open source, the value will move up the stack and flow to providers who can deliver the best security, ease of use, and developer and consumer experiences. This should be viewed as an amazing victory. Only a year ago, many in the technology realm were fearful that the world was bifurcating into GPU richies and GPU poors — those who had access to powerful AI and those who didn’t. We can already see that’s a moot point and that’s important. Democratic access to AI capabilities across countries, companies of all sizes and NGOs will be a fundamental building block of innovation for many years to come, across many fields. Open wins in technologies that drive a shared benefit. Always. Pull down that drawbridge because the tide is rising.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com