Thứ Tư, 5 tháng 3, 2025

Nâng cao tính mở và khả năng sử dụng của Hàng hóa Công cộng Kỹ thuật số bằng cách chỉ chấp nhận các bộ sưu tập nội dung và bộ dữ liệu hoàn toàn được cấp phép mở


Enhancing the Openness and Usability of Digital Public Goods by Accepting Only Fully Open-Licensed Content Collections and Data Sets

August 23, 2024

Theo: https://www.digitalpublicgoods.net/standard

Bài được đưa lên Internet ngày: 23/08/2024

Author: Amreen Taneja, Standards Lead, DPGA Secretariat

Tác giả: Amreen Taneja, Lãnh đạo về tiêu chuẩn, Ban Thư ký của DPGA

Liên minh Hàng hóa Công cộng Kỹ thuật số - DPGA (Digital Public Goods Alliance) cam kết duy trì các tiêu chuẩn cao nhất về tính mở và khả năng sử dụng các hàng hóa công cộng kỹ thuật số - DPG (Digital Public Goods). Phù hợp với cam kết này, Ban Thư ký của DPGA gần đây đã đề xuất một cải tiến đáng kể đối với các tiêu chí cần thiết cho các tập ữ liệu mở và các bộ sưu tập nội dung mở để được công nhận là DPG. Đề xuất này từng mở cho bình luận công khai và đã trải qua các thủ tục quản trị của Tiêu chuẩn DPG, hiện đang được triển khai như một yêu cầu mới theo Tiêu chuẩn DPG đó và sẽ có hiệu lực từ ngày 01/09/2024.

Sự thay đổi này ngụ ý rằng các tập dữ liệu và các bộ sưu tập nội dung được cấp phép hỗn hợp sẽ không còn được công nhận như là DPG nữa. Thay vào đó, chỉ dữ liệu và các bộ sưu tập nội dung mở hoàn toàn, bao gồm cả dữ liệu và bộ sưu tập nội dung có vài hạn chế truy cập, là đủ điều kiện để được công nhận là DPG.

Một cách tiếp cận khắt khe đối với việc cấp phép: Quyết định đã được đưa ra như thế nào

Theo sau sự rà soát lại khắt khe tất cả các giải pháp hiện có được liệt kê trong Sổ đăng ký DPG, đã trở nên rõ ràng là các tập con nhỏ của dữ liệu và các bộ sưu tập nội dung được cấp phép hỗn hợp thể hiện vài thách thức. Các thách thức đó bao gồm những phức tạp và nhầm lẫn tiềm tàng về pháp lý nếu người dùng không nhận thức được rằng vài DPG họ đang truy cập không được cấp phép mở, và họ chẳng may sử dụng nó vi phạm giấy phép đó, và các khó khăn trong việc đảm bảo sự rõ ràng và khả năng sử dụng DPG trong đó chỉ một phần của nó có thể được sử dung miễn phí. Kết quả là, nhu cầu về một cách tiếp cận khắt khe hơn đối với việc cấp phép đã nổi lên như là nhu cầu thiết yếu cho việc duy trì tính mở và khả năng sử dụng các DPG.

Quyết định của Hội đồng Tiêu chuẩn DPG tinh chỉnh các yêu cầu xung quanh việc cấp phép mở là kết quả của các tham vấn mở rộng với các chuyên gia từ Creative Commons và Quỹ Tri thức Mở (Open Knowledge Foundation), các bên đang lãnh đạo trong lĩnh vực nội dung mở và các tiêu chuẩn dữ liệu mở, cũng như phản hồi nhận được trong suốt giai đoạn bình luận mở.

Yêu cầu mới: Nó có ý nghĩa gì đối với các DPG

Yêu cầu mới có nghĩa là các tập dữ liệu và các bộ sưu tập nội dung mở phải đáp ứng các tiêu chí sau đây để được công nhận như là hàng hóa công cộng kỹ thuật số:

  1. Cấp phép mở toàn diện:

    • Toàn bộ tập dữ liệu /bộ sưu tập nội dung phải có một giấy phép mở có thể chấp nhận (acceptable open licence).

  1. Truy cập được và khám phá được

    • Tất cả các tập dữ liệu và bộ sưu tập nội dung DPG phải được cấp phép mở và dễ truy cập được từ một vị trí độc nhất, phân biệt được, chẳng hạn như một URL độc nhất.

  1. Các hạn chế quyền truy cập được phép:

    • Các hạn chế quyền truy cập nhất định - chẳng hạn như đăng nhập, đăng ký, khóa API, và điều chỉnh băng thông - là được phép miễn là chúng không phân biệt đối xử đối với những người dùng hoặc hạn chế sử dụng dựa trên địa lý hoặc bất kỳ yếu tố nào khác.

Cơ sở lý luận: Tăng cường sự tin cậy, khả năng sử dụng và đổi mới

Yêu cầu mới này được thiết kế để nâng cao sự tin tưởng và tự tin vào tất cả các dPG bằng việc đảm bảo rằng người dùng có thể tham gia đầy đủ với các giải pháp mà không lo lắng về vi phạm sở hữu trí tuệ. Việc đơn giản hóa quyền truy cập và sử dụng phù hợp với mục tiêu của DPGA biến các DPG trở thành mở và truy cập được thực sự để áp dụng rộng khắp.

Bằng việc loại bỏ các rủi ro liên quan đến việc cấp phép hỗn hợp, tính toàn vẹn của định nghĩa của DPG và Sổ đăng ký DPG được bảo vệ. Nó cũng giúp thúc đẩy môi trường và hệ sinh thái trong đó đổi mới có thể thịnh vượng mà không có sự mù mờ về pháp lý. Ngoài ra, trong khi Ban Thư ký của DPGA thừa nhận tầm quan trọng của tính mở, chúng tôi cũng công nhận nhu cầu bảo vệ thông tin cá nhân và đảm bảo rằng các bộ sưu tập nội dung và tập dữ liệu nhất định được chia sẻ có trách nhiệm và chỉ khi thích hợp.

Triển khai và tác động

Như một phần của quá trình triển khai, các DPG hiện hành hiện đang được cấp phép hỗn hợp sẽ cần hoặc loại bỏ hoặc cấp phép lại cho các thành phần độc quyền của dữ liệu và nội dung để duy trì trạng thái của chúng như là hàng hóa công cộng kỹ thuật số. Ban Thư ký DPGA sẽ hỗ trợ cho các DPG hiện có đó trong việc thực hiện việc chuyển đổi này nếu họ muốn đáp ứng các tiêu chí mới này.

Đối với các DPG mới tiềm năng, yêu cầu này cũng có thể mở lại cánh cửa cho các giải pháp trước đó từng bị từ chối vì có các bộ sưu tập nội dung /dữ liệu được cấp phép mở với các rào cản quyền truy cập như đăng nhập, hoặc đăng ký, mà bây giờ được phép - bằng cách đó mở rộng phạm vi và tính đa dạng của hệ sinh thái DPG.

Các bước tiếp theo

Phù hợp với các thủ tục quản trị Tiêu chuẩn DPG, yêu cầu mới này là mở cho bình luận công khai và bây giờ đã kết thúc và sẽ được triển khai từ 01/09/2024. Không sự thay đổi nào về ngôn từ của Tiêu chuẩn DPG hiện hành nào là cần thiết. Trọng tâm sẽ nhằm vào sự thực thi nghiêm ngặt các yêu cầu cấp phép mở hiện hành. Sự thay đổi này sẽ được phản ánh trong câu hỏi về Tiêu chuẩn DPG ở những nơi có sự tinh chỉnh đối với các câu hỏi được yêu cầu từ các ứng viên để phản hánh các yêu cầu mới đó. Điều này sẽ bao gồm việc xác thực rằng toàn bộ các bộ sưu tập nội dung và tập dữ liệu đều có một giấy phép mở và đánh giá bản chất của bất kỳ hạn chế quyền truy cập nào. Hội đồng Tiêu chuẩn DPG sẽ tiếp tục giám sát tác động của nó và tiến hành các tinh chỉnh cần thiết nhằm đảm bảo sự cải tiến liên tục và phù hợp với Tiêu chuẩn DPG.

Ban Thư ký của DPGA đánh giá cao đầu vào và sự hỗ trợ vô giá từ cộng đồng rộng lớn hơn khi chúng tôi tiếp tục duy trì và tăng cường các nguyên tắc tính mở và khả năng sử dụng các hàng hóa công cộng kỹ thuật số khắp trên thế giới.

The Digital Public Goods Alliance (DPGA) is committed to maintaining the highest standards of openness and usability of digital public goods (DPGs). In line with this commitment, the DPGA Secretariat recently proposed a significant enhancement to the criteria needed for open data sets and open content collections to be recognised as DPGs.This proposal, which was open for public comment and underwent the DPG Standard’s governance procedures, is now being implemented as a new requirement under the DPG Standard and will be effective as of Sept 1st, 2024.

The change means that mixed licensed data sets and content collections will no longer be recognised as DPGs. Instead, only fully open data and content collections, including those with some access restrictions, are eligible for DPG recognition.

A Rigorous Approach to Licensing: How the Decision was Made

Following a thorough review of existing all solutions listed on the DPG Registry, it became clear that a small subset of mixed-licensed data and content collections presented several challenges. These challenges included potential legal complications and confusion if a user doesn’t realise that some of the DPG they’re accessing is not openly licensed, and they accidentally use it in violation of the licence, and difficulties in ensuring the clarity and usability of a DPG where only part of it can be used freely. As a result, the need for a more stringent approach to licensing emerged as essential to maintaining the openness and usability of DPGs.

The DPG Standard’s Council’s decision to refine the requirements around open licensing is the result of extensive consultations with experts from Creative Commons and the Open Knowledge Foundation, who are leaders in the field of open content and open data standards, as well as the feedback received during the open comment period. 

The New Requirement: What It Means for DPGs

This new requirement means open data sets and content collections must meet the following criteria to be recognised as a digital public good:

  1. Comprehensive Open Licensing:

    • The entire data set/content collection must be under an acceptable open licence. Mixed-licensed collections will no longer be accepted.

  2. Accessible and Discoverable:

    • All data sets and content collection DPGs must be openly licensed and easily accessible from a distinct, single location, such as a unique URL.

  3. Permitted Access Restrictions:

    • Certain access restrictions—such as logins, registrations, API keys, and throttling—are permitted as long as they do not discriminate against users or restrict usage based on geography or any other factors.

The Rationale: Enhancing Trust, Usability, and Innovation

This new requirement is designed to increase trust and confidence in all DPGs by ensuring that users can fully engage with solutions without concerns over intellectual property infringement. Simplifying access and usage aligns with the DPGA’s goal of making DPGs truly open and accessible for widespread adoption.

By eliminating the risks associated with mixed licensing, the integrity of the DPG definition and DPG Registry is protected. It also helps foster an environment and ecosystem where innovation can thrive without legal uncertainties. Additionally, while the DPGA Secretariat acknowledges the importance of openness, we also recognise the need to protect personal information and ensure that certain content collections and data sets are shared responsibly and only when appropriate.

Implementation and Impact

As part of the implementation process, existing DPGs that currently feature mixed licensing will need to either move or re-license the proprietary components of their data and content to maintain their status as digital public goods. The DPGA Secretariat will assist the existing DPGs in making this transition if they want to meet this new criteria.

For new potential DPGs, this requirement may also re-open the door to solutions that were previously rejected due to having openly licensed content/data collections with access barriers like logins, or registration, that are now permitted – thereby broadening the scope and diversity of the DPG ecosystem.

Next Steps

In alignment with DP Standard governance procedures, the new requirement was open for public comment and has now been finalised and will be implemented on September 1, 2024. No changes to the language of the existing DPG Standard are necessary. The focus will be on stricter enforcement of existing open licensing requirements. This change will be reflected in the questionary of the DPG Standard where adjustments will be made to the questions  asked of applicants to reflect these new requirements. This will include verifying that entire content collections and data sets are under an open licence and assessing the nature of any access restrictions. The DPG Standard’s Council will continue to monitor its impact and make necessary adjustments to ensure the ongoing improvement and relevance of the DPG Standard.

The DPGA Secretariat appreciates the invaluable input and support from the broader community as we continue to uphold and enhance the principles of openness and usability of digital public goods worldwide.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Ba, 4 tháng 3, 2025

Hướng tới AI vì lợi ích công cộng: vai trò của DPG AI và các tài nguyên công cộng cho AI


Toward public interest AI: the role of AI DPGs and public resources for AI

June 30, 2024

Theo: https://www.digitalpublicgoods.net/blog/toward-public-interest-ai-the-role-of-ai-dpgs-and-public-resources-for-ai

Bài được đưa lên Internet ngày: 30/06/2024

Author: Lea Gimpel, Director of AI and Country Engagement (Visiting Fellow)

Tác giả: Lea Gimpel, Giám đốc AI và Tham gia quốc gia (Nghiên cứu viên thỉnh giảng)

Sự gia tăng của AI vì lợi ích công cộng, nói chung là các hệ thống AI phục vụ cho sự tồn tại và hạnh phúc lâu dài của loài người, và các nguồn lực công cho AI, bao gồm cơ sở hạ tầng và tài trợ cho các nhà phát triển và nghiên cứu AI, có khả năng thúc đẩy sự phát triển của các giải pháp AI sáng tạo giải quyết các thách thức toàn cầu cấp bách, từ biến đổi khí hậu đến chăm sóc sức khỏe. Mặc dù về mặt kỹ thuật tách biệt nhau, cả AI vì lợi ích công cộng và các nguồn lực công đều giao thoa vì chúng có thể đẩy nhanh quá trình phát triển, triển khai và quản trị toàn diện các DPG AI1 —các hệ thống AI là nguồn mở2, có liên quan đến SDG và không gây hại theo thiết kế. Bài đăng sau đây phản ánh về sự giao thoa này giữa AI vì lợi ích công cộng, DPG AI và tài trợ công cho cơ sở hạ tầng AI. Bài viết này được thông báo bởi Hội nghị Bellagio về các nguồn lực công cho AI do Quỹ Rockefeller tổ chức từ ngày 3 đến ngày 7/06/2024.

Kể từ khi OpenAI ra mắt ChatGPT, các cuộc thảo luận liên quan đến các quy định về AI đã trở nên sôi nổi hơn giữa các nhà hoạch định chính sách, nhà công nghệ và học giả. Điều này đã dẫn đến những kết quả hữu hình như Đạo luật AI của EUSắc lệnh hành pháp của Hoa Kỳ về Phát triển và Sử dụng Trí tuệ nhân tạo An toàn, Bảo mật và Đáng tin cậy. Bên cạnh sự quan tâm mạnh mẽ đến quy định về AI, gần đây đã có sự chuyển dịch sang các câu hỏi liên quan đến AI vì lợi ích công cộng để đảm bảo những tiến bộ trong công nghệ AI lấy con người làm trung tâm và phục vụ lợi ích công cộng. Điều này đang chuyển hướng cuộc trò chuyện để vượt ra ngoài việc thảo luận về cách giảm thiểu rủi ro, như được phản ánh trong các quy định đã đề cập ở trên. Đồng thời, thuật ngữ "AI công cộng" (Public AI) xuất hiện, ám chỉ AI là cơ sở hạ tầng công cộng được khu vực công tạo điều kiện tiếp cận để mang lại lợi ích cho tất cả mọi người, chịu trách nhiệm trước công chúng và phản ánh các giá trị của xã hội.

Mặc dù chưa có sự đồng thuận, vài mục tiêu mong muốn gắn với Ai công cộng và vì lợi ích công cộng bao gồm:

  • xúc tác tốt hơn cho việc sử dụng Ai để xử lý các thách thức cấp bách về xã hội và môi trường,

  • cải thiện quyền truy cập tới các năng lực phát triển AI để thúc đẩy đổi mới và khuyến khích sáng tạo ra các giải pháp được bản địa hóa cho các thách thức đặc thù ngữ cảnh,

  • hỗ trợ cho nghiên cứu AI cơ bản và nghiên cứu trong các lĩnh vực khác, chẳng hạn như phát triển thuốc,

  • định hình cấu trúc thị trường và giải quyết sự mất cân bằng của thị trường.

Hiện tại, sự thống trị thị trường trong toàn bộ công nghệ AI (tức là phần cứng, máy tính, tập dữ liệu, mô hình, điểm chuẩn và các công cụ khác) đang bị tập trung hóa cao độ và do rất ít công ty và khu vực thống trị. Điều này hạn chế các lợi ích tiềm năng về lợi ích công cộng của AI và làm trầm trọng thêm tình trạng bất bình đẳng về mặt cấu trúc trong và giữa các xã hội vì hầu hết các quốc gia đều không được tiếp cận với các nguồn lực phát triển AI quan trọng. Điều này đặc biệt đáng lo ngại vì nhiều quốc gia như vậy đang phải đối mặt với tình trạng thất bại của thị trường trong việc cung cấp các dịch vụ cơ bản. Hiện tại không có cơ hội thị trường nào cho các công ty công nghệ lớn có thể chứng minh cho các khoản đầu tư tư nhân vào các tập dữ liệu cục bộ địa phương, cụ thể theo lĩnh vực, đào tạo mô hình và phát triển sản phẩm có thể giải quyết các thách thức phát triển. Do đó, cần có các giải pháp tại địa phương.

Để giải quyết vấn đề hiện tại, cần tăng cường quyền truy cập tới các thành phần cơ sở hạ tầng AI cơ bản. Một số sáng kiến đang được triển khai, chẳng hạn như Nguồn lực nghiên cứu AI quốc gia tại Hoa Kỳ và Liên doanh điện toán hiệu suất cao của Liên minh châu Âu cùng sự hợp tác của họ với các đối tác châu Phi.

Tuy nhiên, quyền truy cập tới tính toán chỉ là một khía cạnh và đi kèm với các câu hỏi bổ sung liên quan đến việc tài trợ và xây dựng cơ sở hạ tầng máy tính có chủ quyền. Các lớp khác của ngăn xếp công nghệ AI, chẳng hạn như các tập dữ liệu, mô hình và chuẩn mực, cũng phải được giải quyết3. Lý tưởng nhất là thực hiện điều này theo cách nguồn mở để tạo điều kiện tiếp cận và đại diện công bằng. Nếu không có những can thiệp như vậy, hầu hết các quốc gia sẽ tiếp tục phải đối mặt với những rào cản to lớn để phát triển các giải pháp AI vì lợi ích công cộng có tác động cao có thể giải quyết các thách thức phát triển tại địa phương. Do đó, AI vì lợi ích công cộng không chỉ đòi hỏi phải có quy định có ý nghĩa để ngăn ngừa tác hại mà còn phải phân bổ nguồn lực công trên toàn bộ ngăn xếp công nghệ AI để đẩy nhanh lợi ích công cộng vượt ra ngoài lợi ích của thị trường tư nhân. Điều này cũng nằm trong truyền thống của các khoản đầu tư công trước đây vào công nghệ để mang lại lợi ích cho xã hội, chẳng hạn như phát minh ra Internet và các sứ mệnh đầu tiên đi vào không gian.

Một số tổ chức đã làm việc tuyệt vời tại giao điểm của những cuộc tranh luận này, bao gồm nhưng không giới hạn ở Viện AI Now Institute, Dự án An ninh Kinh tế, Tương lai Mở (Open Future), Dự án Trí tuệ Tập thểQuyền Mã hóa4.

Tuy nhiên, phần lớn điều này đòi hỏi các cuộc thảo luận nhiều sắc thái xung quanh phương tiện và mục đích, hiểu sâu hơn về ngăn xếp công nghệ AI và khả năng khái quát hóa các thành phần của nó, nhưng cũng cần các nguyên tắc chuẩn mực để hướng dẫn bất kỳ khoản đầu tư công nào vào ngăn xếp công nghệ AI vì lợi ích công cộng. Theo quan điểm của Ban thư ký Liên minh hàng hóa công cộng kỹ thuật số và công việc của chúng tôi trong việc hỗ trợ phát triển, triển khai và khả năng khám phá DPG AI, các điểm sau đây nêu bật những cân nhắc chính:

  1. Hiểu được mối quan hệ giữa AI vì lợi ích công cộng và hàng hóa công cộng kỹ thuật số - DPG (Digital Public Goods): DPG AI có thể đóng vai trò thiết yếu trong việc đảm bảo rằng các mô hình hoặc hệ thống AI Nguồn Mở có liên quan đến mục tiêu phát triển bền vững - SDG (Sustainable Development Goals) có sẵn trên toàn cầu. Chúng cung cấp cho khu vực công và tư nhân các công cụ để thúc đẩy lợi ích công cộng bằng cách sử dụng các hệ thống nguồn mở đã được thẩm định dưới dạng DPG AI được công nhận, được thiết kế để giải quyết các thách thức xã hội và môi trường. Tóm lại, tất cả DPG AI đều có thể phục vụ lợi ích công cộng nếu được áp dụng và quản lý có trách nhiệm, nhưng không phải mọi công nghệ AI vì lợi ích công cộng đều sẽ là hàng hóa công cộng kỹ thuật số do những hạn chế về tính mở của chúng (xem điểm tiếp theo).

  2. AI vì lợi ích công cộng không nhất thiết phải là nguồn mở: AI phục vụ lợi ích công cộng lý tưởng nhất phải là mã nguồn mở và tuân thủ Tiêu chuẩn DPG để đảm bảo các hoạt động phát triển có trách nhiệm5. Tuy nhiên, có thể có một số lý do khiến tính mở đầy đủ không được kỳ vọng. Những lý do này bao gồm nhưng không giới hạn ở quyền riêng tư của chủ thể dữ liệu và sự đánh đổi giữa lợi ích công cộng và lợi ích thương mại.

  3. AI vì lợi ích công cộng nên ưu tiên các mô hình nhỏ, cụ thể cho từng nhiệm vụ: Để phục vụ các cộng đồng địa phương bằng cách giải quyết các trường hợp sử dụng cụ thể và cho phép đại diện phù hợp, loại bỏ sự thiên vị bắt nguồn từ các tập dữ liệu lớn, không có cấu trúc và giảm thiểu các thách thức về môi trường phát sinh từ việc đào tạo các mô hình ngày càng lớn hơn hỗ trợ AI tạo sinh, cần tập trung vào các mô hình nhỏ, cụ thể cho từng nhiệm vụ. Do thiếu tính mở trong các mô hình AI tạo sinh, hiện đang là cơ sở cho nhiều ứng dụng, nên cách tiếp cận như vậy cũng sẽ hỗ trợ tăng DPG AI, vì các mô hình nhỏ hơn, được phát triển có trách nhiệm có thể tuân thủ dễ dàng hơn với định nghĩa nguồn mở và Tiêu chuẩn DPG.

  4. Đầu tư vào công nghệ AI để thúc đẩy AI vì lợi ích công cộng nên là hỗ trợ cho AI Nguồn Mở: Đầu tư công nên cho phép truy cập mở vào các tài nguyên phát triển AI mà không hoặc chỉ có rất ít sự kiểm soát, nhắm mục tiêu và mang lại lợi ích cho các cộng đồng, nhà nghiên cứu và doanh nghiệp vừa và nhỏ chưa được phục vụ đầy đủ. Như câu nói dành cho phần mềm: "tiền công, mã công". Điều tương tự cũng đúng đối với bất kỳ sự phát triển các hệ thống AI nào do công chúng tài trợ ở mức độ lớn nhất có thể. Nếu các công ty được xây dựng dựa trên nguồn tài trợ công, công chúng cũng nên nắm giữ cổ phần chi phối.

  5. Đầu tư công vào công nghệ AI nên áp dụng cách tiếp cận về Hạ tầng Công cộng Kỹ thuật số - DPI (Digital Public Infrastructure): Chúng cần mang tính chiến lược và tối đa hóa kết quả đầu ra bằng cách học hỏi từ việc triển khai cơ sở hạ tầng công cộng kỹ thuật số. Điều này có nghĩa là hỗ trợ các nền tảng và khối xây dựng thay vì các giải pháp, trường hợp sử dụng hoặc tổ chức riêng lẻ. Đầu tư công vào cơ sở hạ tầng AI nên xem xét các nguyên tắc kiến trúc DPI như khả năng tương tác, truy cập đa phương thức, cơ sở hạ tầng phi tập trung/liên kết và an toàn và bảo mật theo thiết kế.

  6. Cần có các nguyên tắc và điều kiện để đầu tư nguồn lực công vào AI: Các hướng dẫn này chỉ đạo việc cung cấp và tiếp cận các nguồn lực công khắp toàn bộ công nghệ AI và nên được phát triển trong một quy trình hợp tác, có sự tham gia của nhiều bên liên quan. Điều này bao gồm đảm bảo rằng các nguồn lực có thể tiếp cận được và trao quyền cho các nhóm yếu thế, rằng các kết quả phù hợp với các cân nhắc về tính bền vững, tập trung vào tác động chuyển đổi, v.v.

  7. Đầu tư công vào cơ sở hạ tầng AI có thể trở thành phương tiện cho AI dân chủ: Việc tiếp cận các nguồn lực phát triển AI bằng cách ủng hộ phương pháp tiếp cận nguồn mở chỉ là một chiều hướng của việc dân chủ hóa và định hướng sự phát triển của AI theo hướng vì lợi ích công cộng. Bằng cách liên kết các cộng đồng nguồn mở với các nhà hoạt động dân chủ, nguồn tài trợ cho cơ sở hạ tầng AI công có thể trở thành động lực cho sự phát triển tập thể vượt ra ngoài các cộng đồng nguồn mở và quản trị toàn diện.

--------------------

Các chú thích

1. DPGA đã đồng tổ chức một cộng đồng thực hành với UNICEF để định nghĩa AI DPG và xây dựng các khuyến nghị để cập nhật Tiêu chuẩn DPG. Các khuyến nghị sẽ được công khai vào mùa thu năm 2024, khi Sáng kiến Nguồn Mở công bố định nghĩa AI nguồn mở của mình. Báo cáo tạm thời có thể được tìm thấy tại đây và bài đăng trên blog nêu tóm tắt tiến trình đạt được tại đây.

2. Hiểu rằng chưa có định nghĩa nào được thống nhất cho các hệ thống AI Nguồn Mở, Sáng kiến Nguồn Mở (OSI) hiện đang tạo điều kiện cho một quy trình hợp tác mở để định nghĩa nó. Phiên bản dự thảo mới nhất có thể được tìm thấy tại đây.

3. Các ví dụ bao gồm dự án huy động cộng đồng cho dữ liệu giọng nói “Mozilla Common Voice”, cơ sở hạ tầng lưu trữ dữ liệu bản địa do người Iwi Māori xây dựng, dành cho người Iwi Māori họ LLM SEA-LION do chính phủ Singapore phát triển.

4. Báo cáo sắp tới của Coding Right có tên “AI Commons (Tài sản chung AI): nuôi dưỡng các giải pháp thay thế cho văn hóa độc quyền của Big Tech” đã xác định hơn 200 tổ chức, nhiều tổ chức trong số đó có trụ sở tại các quốc gia có đa số dân số trên toàn cầu, đang hướng tới một AI Commons (Tài sản chung AI) phi tập trung, ủng hộ một con đường thay thế, công bằng để phát triển AI. Xem thêm: https://codingrights.org/docs/Federated_AI_Commons_ecosystem_T20Policybriefing.pdf

5. Tiêu chuẩn DPG không giám sát việc triển khai hạ nguồn các sản phẩm được công nhận là hàng hóa công cộng kỹ thuật số. Bất kể thế nào, việc triển khai, giám sát và quản lý bất kỳ AI DPG nào cũng phải tuân theo các thông lệ đạo đức và có trách nhiệm để phục vụ lợi ích công cộng.

The rise of public interest AI, which broadly refers to AI systems that serve the long-term survival and well-being of humankind, and public resources for AI, which includes infrastructure and funding to AI developers and researchers, can potentially boost the development of innovative AI solutions that tackle urgent global challenges ranging from climate change to healthcare. Although technically separate from one another, both public interest AI and public resources intersect as they can accelerate the development, deployment, and inclusive governance of AI DPGs (1) —AI systems that are open-source (2), SDG-relevant, and do no harm by design. The following post reflects on this intersection between public interest AI, AI DPGs, and public funding for AI infrastructure. This piece was informed by the Bellagio Convening on Public Resources for AI held by the Rockefeller Foundation between June 3 and 7, 2024.

Ever since OpenAI launched ChatGPT, discussions regarding AI regulations have intensified among policymakers, technologists, and academics. This has resulted in tangible outcomes such as the EU AI Act and the US Executive Order on Safe, Secure, and Trustworthy Development and Use of Artificial Intelligence. Alongside the strong interest in AI regulation, there has been a recent shift towards questions related to public interest AI to ensure advancements in AI technologies are human-centred and serve the public good. This is shifting the conversation to move beyond discussing how to mitigate risks, as reflected in the aforementioned regulations. Concurrently, the term “public AI” emerged, referring to AI as public infrastructure that is made accessible by the public sector to benefit all, is publicly accountable and reflects society’s values.

Although there is no consensus, several desired objectives tied to the public interest and public AI include:

  • better enabling the use of AI to tackle urgent social and environmental challenges,

  • improving access to AI development capacities to spur innovation and foster the creation of localised solutions for context-specific challenges, 

  • supporting basic AI research and research in other fields such as drug development,

  • shaping market structures to address market imbalances

Currently, market dominance throughout the AI technology stack (i.e., hardware, compute, data sets, models, benchmarks, and other tools) is highly centralised and dominated by very few companies and regions. This limits AI’s potential public interest benefits and worsens structural inequalities within and between societies because most countries lack access to critical AI development resources. This is particularly concerning as many such countries are disproportionately facing market failures in delivering basic services. There is currently no market opportunity for big tech companies that would justify private investments in relevant local, domain-specific datasets, model training, and product development that could address development challenges. Therefore, local solutions are needed.

To shift the current problem, access to foundational AI infrastructure components needs to be increased. Several initiatives are underway, such as The National AI Research Resource in the US, and the European Union’s High-Performance Computing Joint Undertaking and their collaboration with African partners. However, access to compute is just one aspect and comes with additional questions regarding funding and building sovereign compute infrastructure. Other layers of the AI technology stack, such as data sets, models, and benchmarks, also must be addressed (3). Ideally, this is done in an open-source way to facilitate equitable access and representation. Without such interventions, most countries will continue to face enormous hurdles to develop high-impact public interest AI solutions that could address local development challenges. Thus, public-interest AI necessitates not only meaningful regulation to prevent harm but also the allocation of public resources across the AI technology stack to accelerate public benefits beyond private market interests. This also stands in the tradition of previous public investments in technology to benefit society, such as the invention of the internet and early missions to space. 

Several organisations do fantastic work at the intersection of these debates, including, but not limited to the AI Now Institute, the Economic Security Project, Open Future, The Collective Intelligence Project and Coding Rights (4). 

Yet, much of this requires nuanced discussions around means and ends, a deeper understanding of the AI technology stack and the generalizability of its components, but also normative principles to guide any public investments in the AI technology stack for public benefit. From the perspective of the Digital Public Goods Alliance Secretariat and our work on supporting the development, deployment and discoverability of AI DPGs, the following points highlight key considerations:

  1. Understanding the intersection of public interest AI and digital public goods: AI DPGs can play an essential role in ensuring that SDG-relevant open-source AI models or systems are available globally. They give the public and private sector the tools to advance public interest by using vetted open-source systems in the form of recognized AI DPGs that are designed to address social and environmental challenges. In a nutshell, all AI DPGs can serve the public interest if applied and governed responsibly, but not all public interest AI technology will be a digital public good because of limitations in their openness (see next point).

  2. Public interest AI is not open-source per se: AI that serves the public good should ideally be open-source and adhere to the DPG Standard to ensure responsible development practices (5). However, there might be several reasons why full openness is not desirable. These include, but are not limited to, the data subject’s rights to privacy, and trade-offs between public benefit and commercial interests.

  3. Public interest AI should favour small, task-specific models: To serve local communities by addressing specific use cases and enabling appropriate representation, eliminate bias stemming from large, unstructured datasets and mitigate environmental challenges stemming from the training of ever-larger models underpinning generative AI, focus should be laid on small, task-specific models. Given the lack of openness in generative AI models, which currently serve as a basis for many applications, such an approach would also support an increase in AI DPGs, given that smaller, responsibly developed models can comply more easily with the open-source definition and the DPG Standard. 

  4. Investments along the AI technology stack to advance public interest AI should be in support of open-source AI: Public investments should enable open access to AI development resources without or with very limited gatekeeping, targeting and benefiting specifically underserved communities, researchers and SMEs. As the saying goes for software: “public money, public code”. The same should be true for any publicly funded development of AI systems to the biggest extent possible. If companies are built based on public funding, the public should hold controlling shares

  5. Public investments along the AI technology stack should take a DPI approach: They need to be strategic and maximise outcomes by learning from implementations of digital public infrastructure. This means supporting platforms and building blocks rather than individual solutions, use cases, or organisations. Public investments in AI infrastructure should consider DPI architecture principles such as interoperability, multi-modal access, decentralised/federated infrastructure, and safety and security by design. 

  6. Principles and conditions for investing public resources in AI are needed: These guidelines direct the supply of and access to public resources across the AI technology stack and should be developed in a collaborative, multi-stakeholder process. This includes ensuring that resources are accessible and empower disadvantaged groups, that outcomes align with sustainability considerations, focus on transformational impact, and more.

  7. Public investments in AI infrastructure can become a vehicle for democratic AI: Access to AI development resources by favouring an open-source approach is just one dimension of democratising and gearing AI’s development towards the public interest. By linking open-source communities with democracy activists, public AI infrastructure funding can become a force for collective development beyond open-source communities and inclusive governance. 

Footnotes
1. The DPGA has been co-hosting a community of practice  with UNICEF to define AI DPGs and develop recommendations for updating the DPG Standard. The recommendations will be made public in fall 2024, when the Open Source Initiative released its open-source AI definition. The interim report can be found here and a blog post outlining the progress made here.

2. Understanding that there is no agreed-upon definition for open-source AI systems, the Open Source Initiative (OSI) is currently facilitating an open, collaborative process to define it. The latest draft version can be found here.

3. Examples include the crowd-sourcing project for voice data “Mozilla Common Voice”, the indigenous data storage infrastructure built by Iwi Māori, for Iwi Māori and the SEA-LION family of LLMs developed by the Singaporean government.

4. Coding Right’s forthcoming report “AI Commons: nourishing alternatives to Big Tech monoculture” identified more than 200 organisations, many of which are based in global majority countries, that work towards a decentralised AI Commons that favours an alternative, equitable pathway to AI development. See also: https://codingrights.org/docs/Federated_AI_Commons_ecosystem_T20Policybriefing.pdf

5. The DPG Standard does not monitor downstream implementation of products recognized as digital public goods. Regardless, deployment, monitoring and governance of any AI DPG must follow ethical and responsible practices to serve the public interest.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Hai, 3 tháng 3, 2025

Hàng hóa công cộng kỹ thuật số có thể giúp mở khóa tiềm năng lợi ích công cộng của AI như thế nào


How digital public goods can help unlock the public interest potential of AI

December 12, 2024

Theo: https://www.digitalpublicgoods.net/blog/how-digital-public-goods-can-help-unlock-the-public-interest-potential-of-ai

Bài được đưa lên Internet ngày: 12/12/2024

Author: Liv Marte Nordhaug, Secretariat CEO, Digital Public Goods Alliance

Trong vài tháng qua, đỉnh điểm là các hội thảo chuyên sâu tại Cuộc họp thường niên của Liên minh Hàng hóa Công cộng Kỹ thuật số - DPGA (Digital Public Goods Alliance) năm 2024 tại Singapore, Ban thư ký DPGA đã dành nhiều thời gian để triệu tập các cuộc thảo luận về trí tuệ nhân tạo (AI), đặc biệt liên quan đến cách hàng hóa công cộng kỹ thuật số có thể thúc đẩy AI vì lợi ích công cộng. Trong suốt các cuộc thảo luận này, những người tham gia đã nêu bật nhiều thách thức đang ngăn cản sự phát triển của AI vì lợi ích công cộng ở quy mô lớn. Đây là lý do tại sao vào năm 2025, chúng tôi muốn giúp tìm nguồn các công cụ nguồn mở có thể giảm bớt những rào cản này và trở thành một phần của các giải pháp cần thiết.

Mặc dù không có sự đồng thuận chính xác về định nghĩa AI vì lợi ích công cộng, nhưng hiểu biết chung được chấp nhận, như đã đề cập trên blog của Ban thư ký DPGA vào tháng 6, bao gồm những điều sau: "các mục tiêu mong muốn như cho phép sử dụng AI tốt hơn để giải quyết các thách thức xã hội và môi trường cấp bách, cải thiện khả năng tiếp cận các năng lực phát triển AI để thúc đẩy đổi mới và thúc đẩy việc tạo ra các giải pháp cục bộ địa phương cho các thách thức cụ thể theo bối cảnh, hỗ trợ nghiên cứu AI cơ bản và nghiên cứu trong các lĩnh vực khác như phát triển thuốc và định hình cấu trúc thị trường để giải quyết tình trạng mất cân bằng thị trường".

Với suy nghĩ này, có vẻ tự nhiên khi hàng hóa công cộng kỹ thuật số (DPG) đóng vai trò quan trọng trong việc theo đuổi AI vì lợi ích công cộng, nhưng điều đó không có nghĩa là mọi việc sẽ đơn giản. Như tôi đã nêu trên một blog DPGA khác trước đây, "việc duy trì một rào cản cao đối với dữ liệu đào tạo có khả năng dẫn đến ít hệ thống AI đáp ứng các tiêu chí Tiêu chuẩn DPG hơn. Tuy nhiên, tính liên quan của SDG, tính độc lập của nền tảng và tính không gây hại theo thiết kế là những tính năng giúp DPG khác biệt với các giải pháp nguồn mở khác—và vì những lý do đó, việc đưa dữ liệu đào tạo vào là cần thiết".

Trên cùng blog đó, tôi cũng đã viết rằng "với DPG, chúng tôi muốn giúp phát triển bối cảnh AI vì lợi ích công cộng khi hệ sinh thái hiểu rõ hơn về cách giải quyết những phức tạp liên quan đến dữ liệu mở và chia sẻ dữ liệu".

Tại Ban thư ký DPGA, chúng tôi tiếp tục tự hỏi bản thân và các chuyên gia có liên quan về cách chúng tôi có thể giúp giải quyết một số phức tạp này. Ở đây, tôi xin nêu bật quan điểm hiện tại của chúng tôi:

DPG là công cụ cho AI vì lợi ích công cộng

Chúng tôi muốn đẩy nhanh việc sử dụng DPG có thể đóng vai trò là công cụ để giải quyết các rào cản trong việc thúc đẩy AI vì lợi ích công cộng. Ví dụ, điều này có thể bao gồm các giải pháp cải thiện quản trị dữ liệu, tính minh bạch và trách nhiệm giải trình; sự đồng ý và cấp phép để đào tạo; tuân thủ quy định và các ưu tiên về chính sách. Chúng tôi sẽ nỗ lực để đưa các công cụ nguồn mở như vậy lên trước trong khi vẫn cam kết hoàn toàn thúc đẩy các hệ thống AI dưới dạng DPG, trong đó mỗi thành phần có liên quan của một hệ thống AI nhất định (bao gồm dữ liệu đào tạo) được công khai và các tiêu chí liên quan đến DPG khác được đáp ứng.

Một số rào cản hoàn toàn mang tính công nghệ, trong khi những rào cản khác liên quan đến các quy trình và chuẩn mực đã được thiết lập, bao gồm nhu cầu xây dựng nhận thức, kiến thức và lòng tin. Trong một số trường hợp, cần phải có những thay đổi về luật pháp hoặc các hình thức thủ tục pháp lý khác trước khi có thể thực hiện hành động có ý nghĩa, trong khi những thách thức khác có thể được giải quyết ngay lập tức - bằng các công cụ phù hợp. Sau đây là một số ví dụ về các thách thức hoặc chủ đề kỹ thuật mà chúng tôi đã nghe đề cập cho đến nay, trong đó DPG có thể hữu ích:

  • Trích xuất dữ liệu từ các định dạng không thể đọc được bằng máy (như PDF).

  • Xác định thông tin cấp phép, trạng thái phạm vi công cộng hoặc tín hiệu đồng ý của nội dung/dữ liệu.

  • Theo dõi nguồn gốc dữ liệu.

  • Kiểm tra và xác thực tập dữ liệu.

  • Thu thập và dán nhãn dữ liệu (như dữ liệu đa ngôn ngữ).

  • Tạo dữ liệu tổng hợp, ẩn danh và che giấu.

DPG, với vai trò là các giải pháp kỹ thuật số mở, có thể thích ứng, có tài liệu hướng dẫn có thể giúp tạo điều kiện tái sử dụng, có thể đóng vai trò quan trọng như các công cụ để giải quyết những thách thức chung đối với việc mở rộng AI vì lợi ích công cộng - cả trong tương lai gần và dài hạn. Đặc biệt, DPG có thể giúp mở khóa nhiều dữ liệu đào tạo mở chất lượng cao hơn và chia sẻ dữ liệu. Chúng cũng có thể giải quyết các thách thức khác về AI vì lợi ích công cộng như thử nghiệm và xác thực các hệ thống AI và có khả năng cung cấp các công cụ, tài nguyên hoặc đóng vai trò là ví dụ về cách giảm yêu cầu về sức mạnh tính toán để phát triển và triển khai AI, giúp AI dễ tiếp cận hơn trong các môi trường hạn chế về tài nguyên và giảm tiêu thụ năng lượng.

Lý tưởng nhất là chúng tôi muốn thấy sự phát triển của một bộ công cụ đồng tiến hóa gồm các công cụ nguồn mở bổ sung mà nhiều bên liên quan có thể sử dụng và điều chỉnh khi cần để giải quyết các thách thức cụ thể hoặc độc đáo của họ. Thành công trong việc xác định và/hoặc xây dựng các DPG có tác động cao nhất như một phần của bộ công cụ sẽ phụ thuộc vào việc huy động các nhóm chuyên gia và bên liên quan đa dạng cam kết thúc đẩy AI vì lợi ích công cộng để hợp tác. Chúng tôi tin rằng việc tập trung vào các trường hợp sử dụng sẽ rất quan trọng đối với những nỗ lực này.

Các trường hợp sử dụng tác động cao

Ban thư ký DPGA đã nhận được những khuyến nghị và hiểu biết hữu ích về nơi có nhiều cơ hội nhất để liên kết trong ba phiên họp AI vì lợi ích công cộng khác nhau tại Cuộc họp thành viên thường niên của DPGA tại Singapore.

Một điểm chung là trong khi có những thách thức cực kỳ phức tạp liên quan đến dữ liệu mở và chia sẻ dữ liệu, đặc biệt là khi liên quan đến những cân nhắc quan trọng về quyền riêng tư và dữ liệu cá nhân nhạy cảm, thì vẫn có những lĩnh vực khác có thể được giải quyết theo cách đơn giản hơn. Ví dụ, các lĩnh vực phần lớn không liên quan đến dữ liệu nhận dạng cá nhân, như hình ảnh vệ tinh, khoa học khí hậu và thiên nhiên mở, và thông tin chuỗi cung ứng có thể dễ dàng phát triển hơn và có giá trị đối với lợi ích công cộng của AI và các mục tiêu phát triển bền vững.

Một suy nghĩ khác được chia sẻ là trong khi nhiều loại thu thập dữ liệu có thể gây ra rủi ro về quyền riêng tư, ví dụ như dữ liệu giọng nói được sử dụng để phát triển các mô hình ngôn ngữ lớn, thì nhiều rủi ro về quyền riêng tư có thể được giải quyết nếu có các quy trình thu thập và quản lý bảo vệ quyền riêng tư được thiết kế tốt.

Cuối cùng, những người tham gia đã đưa ra một số ví dụ về nhu cầu xây dựng lòng tin giữa các viên chức khu vực công về cách AI có thể được sử dụng theo cách an toàn để cải thiện các dịch vụ công của họ. Bắt đầu từ quy mô nhỏ bằng cách sử dụng dữ liệu mở hiện có từ các tổ chức này để đào tạo một mô hình ngôn ngữ nhỏ nhằm giải quyết nhu cầu dịch vụ công cụ thể có thể là một cách giúp giải quyết mối quan tâm này và thúc đẩy sự thay đổi tích cực và lòng tin vào AI.

Dựa trên những thảo luận này và các thảo luận khác, chúng tôi đã đưa ra các trường hợp sử dụng tham chiếu sau đây về nơi DPG nên được xác định và/hoặc xây dựng thành công cụ cho AI vì lợi ích công cộng có tác động cao hơn:

  • Các mô hình ngôn ngữ lớn (LLM) đa ngôn ngữ bao gồm các ngôn ngữ chưa được phục vụ,

  • Các mô hình ngôn ngữ nhỏ (SLM) có thể giải quyết các nhu cầu cụ thể hơn, đặc biệt là trong cung cấp dịch vụ công,

  • Hành động vì khí hậu dựa trên nghiên cứu (giám sát, giảm thiểu, thích ứng).

Chúng tôi tin rằng các trường hợp sử dụng này phù hợp với Tầm nhìn của DPGA về việc thúc đẩy các mục tiêu phát triển bền vững và đóng góp cho một thế giới công bằng hơn. Điều quan trọng là khi chúng tôi tinh chỉnh các chủ đề này hơn nữa, chúng tôi sẽ đảm bảo rằng sự hiểu biết của chúng tôi về các nhu cầu và thách thức cấp bách liên quan đến từng trường hợp sử dụng tiếp tục được các bên liên quan từ các quốc gia có thu nhập thấp và trung bình, bao gồm cả cơ chế thành viên của DPGA, thông báo.

Chúng tôi sẽ khởi chạy quy trình tạo bộ công cụ này vào cuối tháng 2 năm 2025 và hy vọng bạn sẽ tham gia cùng chúng tôi trong hành trình này!

Over the course of the last few months, culminating with in-depth workshops at the recent 2024 Digital Public Goods Alliance Annual Members Meeting in Singapore, the DPGA Secretariat has spent a lot of time convening discussions on artificial intelligence (AI), in particular related to how digital public goods can advance public interest AI. Throughout these discussions, participants have highlighted multiple challenges that are preventing the advancement of public interest AI at scale. This is why in 2025 we want to help source open-source tools that can reduce these hurdles and be part of the solutions needed.

While there is no precise agreement on the definition of public interest AI, the generally accepted understanding, as mentioned in a June DPGA Secretariat blog, includes the following: “desired objectives such as better enabling the use of AI to tackle urgent social and environmental challenges, improving access to AI development capacities to spur innovation and foster the creation of localised solutions for context-specific challenges, supporting basic AI research and research in other fields such as drug development, and shaping market structures to address market imbalances”.

With this in mind, it feels natural that digital public goods (DPGs) should play a strong role in the pursuit of public interest AI, but that’s not to say it will be straightforward. As I previously highlighted in another DPGA blog, “maintaining a high bar on training data could potentially result in fewer AI systems meeting the DPG Standard criteria. However, SDG relevance, platform independence, and do-no-harm by design are features that set DPGs apart from other open source solutions—and for those reasons, the inclusion of training data is needed”.

In the same blog I also wrote that “with DPGs, we want to help evolve the public interest AI landscape as the ecosystem gains a better understanding of how to address complexities regarding open data and data sharing”.

At the DPGA Secretariat we have continued to ask ourselves and relevant experts how we can help move the needle on some of these complexities. Here, I highlight where our thinking currently stands:

DPGs as tools for public interest AI

We would like to fast-track the use of DPGs that can serve as tools for addressing the barriers to advancing public interest AI. This could for instance include solutions for improving data governance, transparency and accountability; consent and licensing for training; and regulatory compliance and policy priorities. We will work to surface such open source tools while remaining fully committed to advancing AI systems as DPGs, where each relevant component of a given AI system (including the training data) is made openly available and other DPG-relevant criteria are met.

Some barriers are purely technological, whereas others relate to established processes and norms, including a need to build awareness, knowledge and trust. In some cases, legislative changes or other forms of legal procedures are needed before meaningful action can be taken, whereas other challenges could be addressed right away – with the right tools. Here are some examples of technical challenges or topics we have heard mentioned so far, where DPGs could potentially be of use:

  • Extracting data from non-machine-readable formats (such as PDF).

  • Identifying licensing information, public domain status or consent signals of content/data.

  • Data provenance tracking.

  • Testing and validation datasets.

  • Collection and labelling of data (such as multilingual data).

  • Synthetic data generation, anonymization and masking.

DPGs, as open, adaptable digital solutions, with documentation that can help facilitate reuse, can play an important role as tools for addressing common challenges to scaling public interest AI – both in the near future and longer term. In particular DPGs can help unlock more and higher-quality open training data and data sharing. They can also address other public interest AI challenges such as the testing and validation of AI systems, and potentially provide tools, resources, or serve as examples for how to lower the computing power requirements for AI development and deployment, making AI more accessible in resource-constrained environments and reducing the energy footprint.

Ideally, we would like to see the development of a co-evolved toolkit of complementary open source tools that many stakeholders can use and adapt as needed to address their specific or unique challenges. Success in identifying and/or building the most high-impact DPGs as part of the toolkit will depend on mobilizing diverse groups of experts and stakeholders committed to advancing public interest AI to collaborate. We believe that focusing on use cases will be important for these efforts.

High-impact use cases

The DPGA Secretariat received helpful recommendations and insights on where the greatest opportunities for alignment are during the three different public interest AI-sessions at the DPGA’s Annual Members Meeting in Singapore.

One point of consensus was that while there are highly complex challenges pertaining to open data and data sharing, particularly when significant privacy considerations and sensitive personal data is involved, there are other sectors that can be addressed in a more straightforward manner. For example, areas that largely do not involve personally identifiable data, like satellite imagery, open climate and nature science, and supply chain information may be more straightforward to advance and valuable for public interest AI and the sustainable development goals.

Another reflection shared was that while many types of data collection could bring privacy risks, for instance voice data used for developing large language models, many privacy risks can be addressed if there are well designed privacy preserving collection and management processes in place.

Lastly, participants gave several examples of the need to build confidence among public sector officials in how AI can be used in a safe way to improve their public service offerings. Starting small by using existing open data from these institutions to train a small language model to address a specific public service need could be a way of helping address this concern and foster positive change and trust in AI.

Informed by these and other discussions we have arrived at the following reference use cases for where DPGs should be identified and/or built as tools for more high-impact public interest AI:

  • Multilingual large language models (LLMs) covering underserved languages,

  • Small language models (SLMs) that can address more specific needs, particularly in public service delivery,

  • Research-based climate action (monitoring, mitigation, adaptation).

We believe these use cases are well aligned with the DPGA Vision of advancing the sustainable development goals and contributing to a more equitable world. Importantly, as we refine these topics further, we will ensure that our understanding of pressing needs and challenges in relation to each use case continues to be informed by stakeholders from low- and middle-income countries, including from among the DPGA membership.

We will launch a process for creating this toolkit in late February 2025, and hope you will join us in this journey!

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Chủ Nhật, 2 tháng 3, 2025

Tài sản chung kỹ thuật số và Hàng hóa Công cộng Kỹ thuật số - Tìm thấy nền tảng chung cho các nhà hoạch định chính sách


Digital Commons and Digital Public Goods – Finding Common Ground for Policy-makers

January 30, 2025

Theo: https://www.digitalpublicgoods.net/blog/digital-commons-and-digital-public-goods-finding-common-ground-for-policymakers

Bài được đưa lên Internet ngày: 30/01/2025

Các tác giả:

Liv Marte Nordhaug – Digital Public Goods Alliance Secretariat CEO & NGI Commons DCTF Member, Nicholas Gates – Open Forum Europe, NGI Commons

Bài báo này do Liên minh Hàng hóa Công cộng Kỹ thuật số (Digital Public Goods Alliance)NGI Commons cùng viết. Bạn có thể thấy một phiên bản khác của bài báo này trên website của NGI Commons.

Tài sản chung kỹ thuật số (Digital Commons) có thể là một thuật ngữ mơ hồ đối với một số người, nhưng nó có lịch sử và di sản lâu đời. Lịch sử tương tự cũng đã định hình nên khái niệm hàng hóa công cộng kỹ thuật số – DPG (Digital Public Goods).

Trong 5 năm qua, đã và đang có nhận thức quốc tế ngày càng gia tăng đối với cả 2 khái niệm đó là thiết yếu cho một mô hình hợp tác kỹ thuật số công bằng hơn hoạt động phục vụ cho lợi ích công cộng. Khái niệm hàng hóa công cộng kỹ thuật số (DPG) được tham chiếu nổi bật trong Hiệp ước Kỹ thuật số Toàn cầu (Global Digital Compact) mà các quốc gia thành viên của Liên hiệp quốc (UN) đã thông qua tháng 9/2024, và công nhận của nhà nước về Tài sản chung Kỹ thuật số (Digital Commons) đã gia tăng, nổi bật nhất ở châu Âu, với sự thúc đẩy chính sách từ nhiệm kỳ chủ tịch EU 2022 của Pháp.

Trong bài viết này, chúng tôi mô tả những điểm chung của các khái niệm đó và vai trò của chúng như một công cụ chính sách để định hướng hỗ trợ và đầu tư, đồng thời làm rõ các đặc điểm nhận dạng riêng biệt của từng khái niệm. Chúng tôi cũng khẳng định rằng việc có nhiều công nghệ vừa là DPG vừa là Digital Commons sẽ giúp thúc đẩy bối cảnh công nghệ vì lợi ích chung.

Làm rõ các khái niệm: Tài sản chung kỹ thuật số & Hàng hóa công cộng kỹ thuật số

Để bắt đầu làm rõ các khái niệm đó và mối quan hệ của chúng với nhau, trước hết hãy xem xét tài sản chung kỹ thuật số (Digital Commons).

Tài sản chung kỹ thuật số (Digital Commons)

Lịch sử của tài sản chung kỹ thuật số lần vết ngược về với chủ nghĩa hợp tác (cooperativism) và sự cộng tác lúc khởi đầu của Internet và chia sẻ lịch sử với phong trào phần mềm nguồn mở, bắt đầu vào những năm 1980. Nó đã bắt đầu với các nền tảng cộng tác sớm như Usenet và các dự án mở như GNU Project (công bố năm 1983) và sự phát triển của nhân Linux (được phát hành lần đầu vào năm 1991). Các dự án ‘miễn phí’ đó đã thúc đẩy văn hóa quản trị và đồng sáng tạo được chia sẻ chung. Nó đã mở rộng khi ngày càng nhiều kiến thức đã được phát hành miễn phí theo các giấy phép mở, trở nên được coi như là kiến thức mở (Open Knowledge), ban đầu theo phong trào “Thông tin muốn trở thành miễn phí” (Information wants to be free).

Đến cuối những năm 1990, kiến thức mở nổi lên và khi đó các phong trào nguồn mở được định nghĩa tốt đã bắt đầu phù hợp hơn với các phong trào tài sản chung (như được Ostrom và Hess định nghĩa). Điều này đã dẫn tới khái niệm kiến thức mở và các công cụ nguồn mở đang không chỉ được xem là ‘miễn phí’ hay ‘nguồn mở’, mà như là Tài sản chung Kỹ thuật số (Digital Commons). Việc nhấn mạnh vào Kỹ thuật số như Tài sản chung đã mở rộng với sự nổi lên của Creative Commons, cho phép các giấy phép được tiêu chuẩn hóa đối với việc chia sẻ miễn phí sở hữu trí tuệ. Tài sản chung Kỹ thuật số phát triển hơn nữa với sự ra đời của các nền tảng như Wikipedia (ra mắt năm 2001) và các sáng kiến dữ liệu mở khác, tạo ra không gian nơi các nguồn tài nguyên được sở hữu, duy trì và chia sẻ trên trực tuyến một cách tập thể.

Theo quan niệm hiện tại, Tài sản chung Kỹ thuật số (Digital Commons) đề cập đến các nguồn tài nguyên kỹ thuật số cụ thể, cũng như các cộng đồng và phương thức quản trị hỗ trợ chúng. Theo quan điểm này, Digital Commons là các công nghệ cụ thể được xác định bởi sản xuất, quyền sở hữu và quản trị cộng đồng - tập trung nhiều hơn vào các sản phẩm, cơ sở hạ tầng, tiêu chuẩn, bit mã, v.v. riêng lẻ - cũng như các cộng đồng và quản trị các nguồn tài nguyên kỹ thuật số đó. Sự hiểu biết này đã được Chủ tịch EU năm 2022 của Pháp đặc biệt ủng hộ.

Các nguồn tài nguyên được phát triển dưới dạng Digital Commons vượt ra ngoài phạm vi 'xây dựng công khai' và hướng tới 'xây dựng cùng nhau công khai'. Trên thực tế, điều này có nghĩa là chia sẻ rõ ràng quyền quyết định với tất cả những người đóng góp và tối đa hóa khả năng sử dụng lại, mở đường cho việc cung cấp loại dịch vụ mà thông thường chỉ các nền tảng kỹ thuật số cho phép, mà không có sự tập trung quyền lực của các công ty lớn về công nghệ (Big Tech) hoặc phụ thuộc vào các nhà tích hợp hệ thống.

Điều này cũng có nghĩa là, như người đóng góp cho NGI Commons Jan Krewer đã nêu bật trong bài báo gần đây của ông cho NGI CommonsOpen Future, Digital Commons là nhà cung cấp lý tưởng cho mọi loại cơ sở hạ tầng kỹ thuật số 'công cộng' – PDI (Public Digital Infrastructures) hoặc cơ sở hạ tầng kỹ thuật số 'được thiết kế để tối đa hóa giá trị công cộng bằng cách kết hợp các thuộc tính công cộng thông qua quyền truy cập không hạn chế với các chức năng công cộng và quyền sở hữu công cộng'.

Hàng hóa Công cộng Kỹ thuật số – DPG (Digital Public Goods)

Đặt ‘kỹ thuật số’ sang một bên, bản thân khái niệm ‘hàng hóa công cộng’ bắt nguồn từ sự phân biệt kinh tế giữa hàng hóa liên quan đến tính cạnh tranh và tính độc quyền. Sự phân biệt này đã được sử dụng để lập luận cho việc quản lý công hay tư của chúng. Công trình của Elinor Ostrom về tài sản chung cho thấy giới hạn của quan điểm kinh tế này về hàng hóa; cụ thể là, để chỉ ra rằng chính các thể chế làm cho hàng hóa trở thành hàng hóa công hay tư. Và quan trọng nhất là, bên cạnh việc quản lý công hay tư, có nhiều cách để mọi người tự tổ chức và quản lý hàng hóa tập thể.

Theo một nghĩa nào đó, khái niệm về hàng hóa công cộng sẽ được áp dụng cho lĩnh vực kỹ thuật số là điều tất yếu. Nhận ra điều này, vào năm 2018-2019, Nhóm cấp cao về Hợp tác Kỹ thuật số đã đưa chủ đề này vào chương trình nghị sự hợp tác kỹ thuật số quốc tế với báo cáo khuyến nghị thành lập một liên minh và nền tảng cho hàng hóa công cộng kỹ thuật số. Dựa trên đà phát triển này, Lộ trình hợp tác kỹ thuật số của Tổng thư ký Liên hợp quốc được công bố vào năm 2020 đã nêu rằng hàng hóa công cộng kỹ thuật số là "phần mềm nguồn mở, tiêu chuẩn mở, dữ liệu mở, hệ thống AI mở và các bộ sưu tập nội dung mở tuân thủ quyền riêng tư và các luật và thông lệ tốt nhất hiện hành khác, không gây hại và giúp đạt được các Mục tiêu phát triển bền vững (SDG)". Tiêu chuẩn DPG, hỗ trợ hoạt động cho định nghĩa này, được Liên minh hàng hóa công cộng kỹ thuật số – DPGA (Digital Public Goods Alliance) gồm nhiều bên liên quan quản lý. Mặc dù định nghĩa DPGA bổ sung thêm một chiều hướng chuẩn mực với nguyên tắc không gây hại theo thiết kế và các Mục tiêu Phát triển Bền vững (SDG), nhưng nó vẫn dựa trên sự hiểu biết kinh tế ban đầu về hàng hóa công cộng do Ostrom và những người khác đưa ra, với nguyên tắc cốt lõi là không loại trừ và không cạnh tranh.

Tiêu chuẩn DPG là một bộ 9 chỉ số được sử dụng để xác định liệu các giải pháp nguồn mở có thể được coi là hàng hóa công cộng kỹ thuật số hay không. Các chỉ số liên quan đến ba khía cạnh chính của giải pháp công nghệ; 1) tính mở, được thể hiện bằng cả cấp phép, tài liệu cũng như tính độc lập khỏi các nền tảng độc quyền, 2) không gây hại theo thiết kế, bao gồm cách công nghệ được thiết kế để đáp ứng các tiêu chuẩn quốc tế và bảo vệ quyền riêng tư và bảo mật của người dùng, và 3) liên quan đến một hoặc nhiều trong số 17 Mục tiêu phát triển bền vững–SDG (Sustainable Development Goals).

Tất cả các DPG đã được xác minh là đáp ứng Tiêu chuẩn DPG đều được liệt kê trên Sổ đăng ký DPG, giúp chúng trở thành mở và có sẵn cho công chúng, để những người áp dụng tiềm năng có thể dễ dàng phát hiện ra chúng - bao gồm chính phủ, khu vực tư nhân, học viện và các tổ chức xã hội dân sự.

Vậy, sự khác biệt là gì?

Tóm lại, cách hiểu hiện đại về Digital Commons nhấn mạnh đến nhu cầu về các nguồn tài nguyên kỹ thuật số không chỉ được xây dựng công khai mà còn được quản lý, duy trì và hợp tác công khai. Tuy nhiên, tính đến năm 2024, khái niệm này không được vận hành thông qua một tiêu chuẩn rõ ràng, khiến khái niệm này dễ bị trôi dạt và sử dụng không nhất quán, bất chấp những nỗ lực của sáng kiến NGI Commons, Digital Commons EDIC và các sáng kiến khác - tất cả đều hướng đến việc xây dựng thêm sự hiểu biết và tính nhất quán về chính sách liên quan đến Digital Commons.

Để so sánh, khái niệm DPG được vận hành thông qua một tiêu chuẩn được phát triển thông qua một quy trình hợp tác dựa trên cộng đồng. Do đó, có thể xác minh xem một giải pháp kỹ thuật số nhất định có phải là DPG hay không. Tuy nhiên, ngoài việc đánh giá quyền sở hữu và việc đảm bảo bảo trì tích cực thông qua các đợt đánh giá hàng năm, Tiêu chuẩn DPG không xem xét đến việc quản lý một giải pháp nhất định.

Mặc dù nhiều DPG có một số hình thức quản lý cộng đồng, nhưng việc trở thành DPG không nhất thiết có nghĩa là nó được quản lý bởi hoặc vì cộng đồng. Việc đánh giá khía cạnh lợi ích công cộng của DPG chỉ giới hạn ở ba khía cạnh đã đề cập trước đó; tính mở, không gây hại theo thiết kế và sự liên quan đến SDG. Đây là nơi mà việc coi tài nguyên kỹ thuật số là tài sản chung trở nên quan trọng.

Ý tưởng cốt lõi của Digital Commons đặt tầm quan trọng đáng kể vào việc tự quản lý 'vì công chúng' và 'bởi công chúng' thông qua các thuộc tính công cộng và chức năng công cộng. Tuy nhiên, không có tiêu chuẩn cụ thể nào (như tiêu chuẩn để xác minh những gì là hoặc không phải là DPG) để xác minh mức độ quản lý hoặc tính mở (openness) của Digital Commons. Hơn nữa, nguyện vọng của Digital Commons đối với 'tính công khai' (publicness) cao hơn so với DPG nói chung, vì mô hình Digital Commons lý tưởng là mô hình sở hữu công cộng 'của và bởi công chúng' thông qua kiểm soát công khai, tài trợ công và sản xuất công khai. Trong khi hầu hết chủ sở hữu sản phẩm DPG thấy giá trị đáng kể trong cộng đồng và quản trị, thì DPG thực sự có thể được một thực thể duy nhất tài trợ và/hoặc quản trị miễn là quyền sở hữu được ghi lại.

Một ví dụ về điều này là các tiêu chuẩn mở (Open Standards). Các tiêu chuẩn mở, theo mọi định nghĩa, không chỉ dựa trên quyền truy cập mở vào tiêu chuẩn mà còn dựa trên quy trình có sự tham gia để xác định tiêu chuẩn đó. Trong khi một số định nghĩa chấp nhận cấp phép và phí, thì tất cả các định nghĩa dường như đều đồng ý rằng giá trị thực sự của các tiêu chuẩn nằm ở quy trình ra quyết định tập thể. Để biết thêm về quy trình này, hãy xem tóm tắt chính sách này từ Internet Society.

Có một logic đằng sau lý do tại sao. Nhiều người ủng hộ công nghệ mở, chẳng hạn như những người ủng hộ Phần mềm tự do nguồn mở – FOSS (Free and Open Source Software), cho rằng lợi ích của nguồn mở nằm ở việc tuân thủ bốn quyền tự do được nêu trong Định nghĩa phần mềm tự do của Richard Stallman, ví dụ như "người dùng có quyền tự do chạy, sao chép, phân phối, nghiên cứu, thay đổi và cải thiện phần mềm". Nói cách khác, việc quy định cách cộng đồng đó nên được điều hành sẽ phủ nhận giá trị nội tại của việc có thể làm bất cứ điều gì bạn muốn với nó. Khái niệm DPG thực sự xuất hiện để tối đa hóa cơ hội tái sử dụng và điều chỉnh đáng kể để đáp ứng các nhu cầu theo ngữ cảnh, một phần là để phản ứng với sự trùng lặp to lớn về nỗ lực và nguồn lực được thấy trong các sáng kiến công nghệ do phát triển quốc tế tài trợ. Do đó, định nghĩa FOSS đã định hình đáng kể Tiêu chuẩn DPG, mặc dù có thêm lớp không gây hại theo thiết kế và liên quan đến SDG.

Kết hợp cả hai lại với nhau

Chúng tôi thấy giá trị đáng kể trong việc làm nổi bật rõ ràng hơn sự liên kết chặt chẽ giữa Digital Commons và DPG không chỉ trong các cuộc thảo luận về chính sách mà còn bằng cách đưa ra các ví dụ về công nghệ đáp ứng cả hai định nghĩa. Bằng cách đưa ra những ví dụ này, chúng tôi tin rằng chúng tôi có thể cung cấp những hiểu biết quan trọng cho việc phát triển chính sách và phân bổ nguồn lực.

Tuy nhiên, vẫn có một số thách thức khi thực hiện điều này.

Việc xác định rõ ràng thế nào là nguồn tài trợ công và quản trị ‘đủ tốt’ cho Digital Commons là rất phức tạp vì nó phụ thuộc rất nhiều vào bối cảnh. Việc thiết lập và duy trì quy trình đánh giá như vậy trong một tổ chức đủ trung lập và độc lập cũng đòi hỏi nhiều nguồn lực. Do đó, không có tiêu chuẩn hoặc cơ quan đánh giá nào dành cho Digital Commons, ít nhất là cho đến nay. (Tuy nhiên, Liên đoàn Cơ sở hạ tầng Kỹ thuật số Châu Âu, hay EDIC, dành cho Digital Commons là một sự hợp tác đã được công bố nhằm mục đích thực hiện điều gì đó tương tự như vậy.) Nhưng có một sự hợp tác dành cho DPG. Điều này tạo ra không gian đáng kể để hai bên củng cố lẫn nhau, nếu có sự hỗ trợ mạnh mẽ về mặt chính sách để thực hiện điều đó.

Do đó, việc khuyến khích nhiều dự án Digital Commons hơn đề cử các công nghệ của họ để được xác minh là DPG có thể là một bước tiến hữu ích vì nó đảm bảo rằng một số yêu cầu tối thiểu nhất định luôn được đáp ứng và thông tin này được cung cấp một cách minh bạch. Nó cũng làm tăng khả năng khám phá các công nghệ Digital Commons đối với các loại bên liên quan khác nhau có liên quan để áp dụng và đóng góp trở lại cho các giải pháp.

Mặc dù không có tiêu chuẩn rõ ràng để đánh giá các công nghệ là Digital Commons, nhưng đúng là trong khi DPG phải được miễn phí cho tất cả mọi người sử dụng và sửa đổi, thì nó cũng phải có quyền truy cập vào nhiều hình thức hỗ trợ và tài nguyên khác nhau cần thiết để trở nên bền vững trong dài hạn. Có thể cân nhắc thêm về vấn đề này trong trung hạn. Một điểm khởi đầu có thể là xác định các DPG đang hoạt động như Digital Commons cũng như các DPG có thể hưởng lợi từ các cấu trúc quản trị và hỗ trợ rộng hơn và mang tính cộng tác hơn.

Một trường hợp thú vị là khi nhiều quốc gia đang triển khai cùng một DPG để xây dựng các thành phần cơ sở hạ tầng công cộng kỹ thuật số – DPI (Digital Public Infrastructure) nền tảng của họ, chẳng hạn như hệ thống nhận dạng kỹ thuật số hoặc trao đổi dữ liệu an toàn. Làm thế nào chúng ta có thể khuyến khích chia sẻ nhiều hơn về đổi mới cũng có lợi cho DPG cốt lõi? Cấu trúc quản trị nào có thể mang tính cộng tác và cho phép nhiều đầu vào khác nhau, đồng thời đảm bảo rằng các quốc gia cảm thấy họ có đủ quyền tự chủ trong cách xây dựng và triển khai các hệ thống này? Một lĩnh vực có liên quan cao khác liên quan đến các công nghệ rất quan trọng để tạo điều kiện cho diễn ngôn công khai, trong đó có một trường hợp rõ ràng cho các nền tảng truyền thông xã hội và truyền thông vừa là DPG vừa là Digital Commons.

Đây chỉ là một số cơ hội mà chúng tôi thấy có giá trị cao khi có nhiều công nghệ hướng tới cả DPG và Digital Commons do sự liên kết chặt chẽ thế mạnh độc đáo bổ sung của hai khái niệm này.

Hãy tham gia cùng chúng tôi để tìm hiểu thêm

Cả NGI Commons Consortium và Digital Public Goods Alliance sẽ có mặt tại Hội nghị thượng đỉnh chính sách nguồn mở EU 2025 sắp tới của OpenForum Europe (OFE) vào ngày 31/01/2025, cũng như Tuần lễ Nguồn Mở EU rộng lớn hơn. Trong Hội nghị thượng đỉnh chính sách, Tổng giám đốc điều hành của Ban thư ký DPGA, Liv Marte Nordhaug (đồng tác giả của bài viết này), sẽ chia sẻ suy nghĩ của mình về tầm quan trọng của cả DPG và Digital Commons trong một cuộc thảo luận tập trung vào chủ đề "Nguồn Mở và hợp tác kỹ thuật số toàn cầu: Định vị châu Âu là người dẫn đầu". Cuộc thảo luận đó sẽ được điều hành bởi Cố vấn chính sách của OpenForum Europe Nicholas Gates (cũng là đồng tác giả của bài viết này).

Cả hai tổ chức – OFE và DPGA – cũng sẽ có mặt tại địa phương trong suốt tuần lễ FOSDEM. OFE, thay mặt cho NGI Commons, đang đóng góp cho devroom về Nguồn Mở trong Bối cảnh lập pháp châu Âu, cũng như DPGA, đơn vị sẽ tham gia cùng OFE trong một cuộc thảo luận chung vào cuối phần Khu vực Công của devroom. DPGA sẽ có bài phát biểu quan trọng về Mở rộng các giải pháp Nguồn Mở để đạt được các mục tiêu phát triển bền vững: Lời kêu gọi hành động toàn cầu, tổ chức một gian hàng mà mọi người có thể ghé thăm để tìm hiểu thêm về DPG và tổ chức một sự kiện bên lề cho chủ sở hữu sản phẩm của DPG và Digital Commons.

Hãy đảm bảo rằng bạn tham gia Nền tảng Cộng đồng Digital Commons (DCCP) của NGI Commons để có những cuộc thảo luận như thế này. Và nếu bạn muốn tham gia vào công việc này, hãy đến tìm chúng tôi khi chúng tôi ở Brussels.

Authors:
Liv Marte Nordhaug – Digital Public Goods Alliance Secretariat CEO & NGI Commons DCTF Member, Nicholas Gates – Open Forum Europe, NGI Commons

This article is co-written by the Digital Public Goods Alliance and NGI Commons. You can find another version of this article on the NGI Commons website.

Digital Commons can be a fuzzy term to some, but it has a long history and legacy. The same history has also shaped the concept of digital public goods (DPGs).

Over the last five years, there has been growing international recognition of both these terms as essential to a more equitable digital cooperation model that operates in service of the public interest. The DPG concept is prominently referenced in the Global Digital Compact that UN Member States adopted in September 2024, and state recognition of Digital Commons has increased, most notably in Europe, with the policy push from France’s 2022 EU Presidency.

In this article, we describe the commonalities of these terms and their role as policy tools to channel support and investment, while also unpacking the unique identifying features of each concept. We also make the case that having more technologies that are both DPGs and Digital Commons will help advance the landscape of shared public interest technologies.

Unpacking the Concepts: Digital Commons and Digital Public Goods

To begin unpacking these concepts and their relationship to one another, let’s first look at Digital Commons.

Digital Commons

The history of Digital Commons traces back to cooperativism and collaboration of the early Internet and shares history with the open source software movement, beginning in the 1980s. It began with early collaborative platforms like Usenet and open projects like the GNU Project (announced in 1983) and the development of the Linux kernel (initially released in 1991). These ‘free’ projects fostered a culture of shared governance and co-creation. It expanded as more knowledge was released freely under open licenses, becoming regarded as open knowledge, initially under the movement that “Information wants to be free”.

Towards the end of the 1990s, the emerging open knowledge and by then well-defined open source movements began to align more with the commons movements (as defined by Ostrom and Hess). This led to the concept of open knowledge and open source tools being not just regarded as ‘free’ or ‘open source’ but as Digital Commons. The emphasis on Digital as Commons expanded with the rise of Creative Commons, enabling standardised licenses for freely sharing intellectual property. Digital Commons evolved further with the advent of platforms like Wikipedia (launched in 2001) and other open data initiatives, creating spaces where resources are collectively owned, maintained, and shared online.

In its current conception, Digital Commons refers to specific digital resources, as well as the communities and modes of governance that support them. In this view, the Digital Commons are specific technologies defined by communal production, ownership, and governance – placing more emphasis on individual products, infrastructure, standards, bits of code, etc – as well as the communities and governance of those digital resources. This understanding has been particularly championed by France’s 2022 EU Presidency.

Resources developed as Digital Commons go beyond ‘building in the open’ and more towards ‘building together in the open’. In practice, this means explicitly sharing decision power with all contributors and maximising reusability, paving the way to delivering the sort of services that only digital platforms usually enable, without the power concentration of Big Tech companies or dependency on systems integrators.

It also means, as NGI Commons contributor Jan Krewer highlighted in his recent paper for NGI Commons and Open Future, that Digital Commons are ideal providers for all types of ‘public’ digital infrastructures (PDI), or digital infrastructure which is ‘designed to maximise public value by combining public attributes through unrestricted access with public functions and public ownership’.

Digital Public Goods (DPGs)

Putting aside ‘digital’, the notion of ‘public goods’ itself is derived from the economic distinction between goods in regards to rivalry and exclusivity. This distinction has been used to argue for their public or private management. Elinor Ostrom’s work on commons shows the limits of this economic view of goods; namely, to show that it is institutions that make goods either public or private. And most importantly that, alongside public or private management, there are many ways for people to self-organize and collectively manage goods.

It was in some sense inevitable that the notion of public goods would be applied to the digital realm. Recognizing this, in 2018-2019 the High-level Panel on Digital Cooperation placed the topic firmly on the international digital cooperation agenda with its report recommending the creation of an alliance and platform for digital public goods. Building on this momentum, the UN Secretary General’s Roadmap for Digital Cooperation which was published in 2020, stated that digital public goods are “open-source software, open standards, open data, open AI systems, and open content collections that adhere to privacy and other applicable laws and best practices, do no harm, and help attain the Sustainable Development Goals (SDGs)”. The DPG Standard, which operationalizes this definition, is stewarded by the multi-stakeholder Digital Public Goods Alliance (DPGA). Although the DPGA definition adds a normative dimension with do no harm by design and the SDGs, it is still based on the original economic understanding of public goods advanced by Ostrom and others, with non-excludability and non-rivalry as core tenets.

The DPG Standard is a set of nine indicators that are used to determine whether or not open-source solutions can also be considered digital public goods. The indicators relate to three main aspects of a technology solution; 1) openness, which is represented by both licensing, documentation, as well as independence from proprietary platforms, 2) do no harm by design, including how the technology has been designed to meet international standards and protect privacy and user security, and 3) relevance to one or more of the 17 Sustainable Development Goals (SDGs).

All DPGs that have been verified to meet the DPG Standard are listed on the DPG Registry, making them open and available to the public, so they can be easily discovered by potential adopters – including governments, private sector, academia, and civil society organisations.

So, what’s the difference?

In brief, the modern understanding of Digital Commons emphasizes the need for digital resources to not just be built in the open, but to be governed, maintained, and collaborated on in the open. However, as of 2024, the concept is not operationalized through a clear standard, leaving it vulnerable to concept drift and inconsistent use, despite the efforts of the NGI Commons initiative, Digital Commons EDIC, and others – all of which seek to build more understanding and policy coherence related to Digital Commons.

By comparison, the DPG concept is operationalized through a standard that was developed through a collaborative, community-based process. As a result, it is possible to verify whether a given digital solution is a DPG or not. However, beyond assessing ownership and ensuring active maintenance through annual reviews, the DPG Standard does not consider the governance of a given solution.

While many DPGs have some form of community governance, being a DPG does not necessarily mean that it is governed by or for the community. The assessment of the public interest side of DPGs is limited to the three aspects mentioned earlier; openness, do-no-harm-by-design, and SDG-relevance. This is where thinking of digital resources as commons becomes important.

The central idea of Digital Commons places significant importance on being self-governed ‘for the public’ and ‘by the public’ through public attributes and public functions.That said, there isn’t a specific standard (like there is for verifying what is or is not a DPG) to verify degrees of governance or openness for Digital Commons. Moreover, the aspirations of Digital Commons towards ‘publicness’ are higher than for DPGs overall, as the ideal Digital Commons model is one of public ownership ‘of and by the public’ through public control, public funding, and public production. While most DPG product owners see significant value in community and governance, a DPG can indeed be funded and/or governed by a single-entity as long as ownership is documented.
One example of this is open standards. Open standards, in all definitions, are not only based on open access to the standard but on the participatory process to define the standard. While some definitions accept licensing and fees, all definitions seem to agree that the true value of standards lie in the collective decision-making process. For more on this process, check out this policy brief from the Internet Society.

There is a logic behind why. Many proponents of open technologies, such as Free and Open Source Software (FOSS) advocates, who argue that the benefit of open source lies in its adherence to the four freedoms outlined in Richard Stallman’s Free Software Definition, e.g. that ‘the users have the freedom to run, copy, distribute, study, change, and improve the software’. In other words, prescribing how that community ought to be run would negate the intrinsic value of being able to do whatever you wish to with it . The concept of DPGs indeed emerged to maximize the opportunity for reuse and significant adaptation to meet contextual needs, partly as a response to the tremendous duplication of efforts and resources seen in international development funded technology initiatives. Hence, the FOSS definition has significantly shaped the DPG Standard, albeit with the added layer of do no harm by design and relevance to the SDGs.

Bringing the two together

We see significant value in highlighting more clearly the strong alignment between Digital Commons and DPGs not only in policy discussions, but also by showing examples of technologies that meet both definitions. By showing these examples, we believe we can provide important insights for policy development and resource allocation.

There are some challenges in doing this, though.

Defining clearly what ‘good enough’ public funding and governance looks like for Digital Commons is complex, as it is highly context dependent. It is also resource intensive to establish and maintain such a review process in an adequately neutral and independent organization. Therefore, no standard or review-body exists for Digital Commons, at least not yet. (That said, the European Digital Infrastructure Consortium, or EDIC, for Digital Commons is an announced collaboration which seeks to do something like this.) But, there is one for DPGs. This creates significant space for the two to reinforce one another, if there is a strong policy backing for doing so.

Encouraging more Digital Commons projects to nominate their technologies to be verified as DPGs could therefore be a useful step forward, as it ensures that certain minimum requirements are consistently met, and makes this information available in a transparent manner. It also increases the discoverability of Digital Commons technologies to different types of stakeholders relevant for adopting and contributing back to the solutions.

Despite the lack of a clear standard for assessing technologies as Digital Commons, it ought to be true that while a DPG should be free for all to use and modify, it should also have access to diverse forms of support and resources needed to become sustainable for the long-term. More thought can be given to this in the medium-term. One starting point could be to identify DPGs which are already functioning as Digital Commons as well as DPGs that could benefit from broader and more collaborative governance and support structures.

One interesting case is where multiple countries are implementing the same DPG to build out their foundational digital public infrastructure (DPI) components, such as digital identity systems or secure data exchanges. How can we encourage more innovation sharing that also benefits the core DPG? What governance structures can be collaborative and allow diverse inputs, while ensuring that countries feel they have sufficient autonomy in how these systems are built and implemented? Another highly relevant domain relates to the technologies that are critical to enabling public discourse, where there is a clear case for social media and communication platforms that are both DPGs and Digital Commons.

These are just some of the opportunities we see where there is high value in having more technologies aspire to be both DPGs and Digital Commons given the high alignment and complementary unique strengths of these two concepts.

Join us to learn more

Both the NGI Commons Consortium and the Digital Public Goods Alliance will be on the ground at OpenForum Europe’s (OFE) upcoming EU Open Source Policy Summit 2025 on 31 January, as well as the broader EU Open Source Week. During the Policy Summit, the CEO of the DPGA Secretariat, Liv Marte Nordhaug (co-author of this article), will be sharing her thoughts on the importance of both DPGs and Digital Commons in a discussion centred on “Open Source and Global Digital Cooperation: Positioning Europe as a Leader”. That discussion will be moderated by OpenForum Europe Policy Advisor Nicholas Gates (also a co-author of this article).

Both organisations – OFE and the DPGA – will be on the ground during the entire FOSDEM weekend as well. OFE, on behalf of NGI Commons, is contributing to the devroom on Open Source in the European Legislative Landscape, as is the DPGA, who will be joining OFE in a fishbowl discussion at the end of the Public Sector part of the devroom. The DPGA will be giving a keynote talk on Scaling Open-Source Solutions to Achieve the Sustainable Development Goals: A Global Call to Action, hosting a stand which people can visit to learn more about DPGs, ,and organizing a side-event for product owners of DPGs and Digital Commons.

Make sure you join NGI Commons’ Digital Commons Community Platform (DCCP) to have these types of discussions. And if you want to get involved in this work, come find us while we are in Brussels.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com