Thứ Ba, 4 tháng 3, 2025

Hướng tới AI vì lợi ích công cộng: vai trò của DPG AI và các tài nguyên công cộng cho AI


Toward public interest AI: the role of AI DPGs and public resources for AI

June 30, 2024

Theo: https://www.digitalpublicgoods.net/blog/toward-public-interest-ai-the-role-of-ai-dpgs-and-public-resources-for-ai

Bài được đưa lên Internet ngày: 30/06/2024

Author: Lea Gimpel, Director of AI and Country Engagement (Visiting Fellow)

Tác giả: Lea Gimpel, Giám đốc AI và Tham gia quốc gia (Nghiên cứu viên thỉnh giảng)

Sự gia tăng của AI vì lợi ích công cộng, nói chung là các hệ thống AI phục vụ cho sự tồn tại và hạnh phúc lâu dài của loài người, và các nguồn lực công cho AI, bao gồm cơ sở hạ tầng và tài trợ cho các nhà phát triển và nghiên cứu AI, có khả năng thúc đẩy sự phát triển của các giải pháp AI sáng tạo giải quyết các thách thức toàn cầu cấp bách, từ biến đổi khí hậu đến chăm sóc sức khỏe. Mặc dù về mặt kỹ thuật tách biệt nhau, cả AI vì lợi ích công cộng và các nguồn lực công đều giao thoa vì chúng có thể đẩy nhanh quá trình phát triển, triển khai và quản trị toàn diện các DPG AI1 —các hệ thống AI là nguồn mở2, có liên quan đến SDG và không gây hại theo thiết kế. Bài đăng sau đây phản ánh về sự giao thoa này giữa AI vì lợi ích công cộng, DPG AI và tài trợ công cho cơ sở hạ tầng AI. Bài viết này được thông báo bởi Hội nghị Bellagio về các nguồn lực công cho AI do Quỹ Rockefeller tổ chức từ ngày 3 đến ngày 7/06/2024.

Kể từ khi OpenAI ra mắt ChatGPT, các cuộc thảo luận liên quan đến các quy định về AI đã trở nên sôi nổi hơn giữa các nhà hoạch định chính sách, nhà công nghệ và học giả. Điều này đã dẫn đến những kết quả hữu hình như Đạo luật AI của EUSắc lệnh hành pháp của Hoa Kỳ về Phát triển và Sử dụng Trí tuệ nhân tạo An toàn, Bảo mật và Đáng tin cậy. Bên cạnh sự quan tâm mạnh mẽ đến quy định về AI, gần đây đã có sự chuyển dịch sang các câu hỏi liên quan đến AI vì lợi ích công cộng để đảm bảo những tiến bộ trong công nghệ AI lấy con người làm trung tâm và phục vụ lợi ích công cộng. Điều này đang chuyển hướng cuộc trò chuyện để vượt ra ngoài việc thảo luận về cách giảm thiểu rủi ro, như được phản ánh trong các quy định đã đề cập ở trên. Đồng thời, thuật ngữ "AI công cộng" (Public AI) xuất hiện, ám chỉ AI là cơ sở hạ tầng công cộng được khu vực công tạo điều kiện tiếp cận để mang lại lợi ích cho tất cả mọi người, chịu trách nhiệm trước công chúng và phản ánh các giá trị của xã hội.

Mặc dù chưa có sự đồng thuận, vài mục tiêu mong muốn gắn với Ai công cộng và vì lợi ích công cộng bao gồm:

  • xúc tác tốt hơn cho việc sử dụng Ai để xử lý các thách thức cấp bách về xã hội và môi trường,

  • cải thiện quyền truy cập tới các năng lực phát triển AI để thúc đẩy đổi mới và khuyến khích sáng tạo ra các giải pháp được bản địa hóa cho các thách thức đặc thù ngữ cảnh,

  • hỗ trợ cho nghiên cứu AI cơ bản và nghiên cứu trong các lĩnh vực khác, chẳng hạn như phát triển thuốc,

  • định hình cấu trúc thị trường và giải quyết sự mất cân bằng của thị trường.

Hiện tại, sự thống trị thị trường trong toàn bộ công nghệ AI (tức là phần cứng, máy tính, tập dữ liệu, mô hình, điểm chuẩn và các công cụ khác) đang bị tập trung hóa cao độ và do rất ít công ty và khu vực thống trị. Điều này hạn chế các lợi ích tiềm năng về lợi ích công cộng của AI và làm trầm trọng thêm tình trạng bất bình đẳng về mặt cấu trúc trong và giữa các xã hội vì hầu hết các quốc gia đều không được tiếp cận với các nguồn lực phát triển AI quan trọng. Điều này đặc biệt đáng lo ngại vì nhiều quốc gia như vậy đang phải đối mặt với tình trạng thất bại của thị trường trong việc cung cấp các dịch vụ cơ bản. Hiện tại không có cơ hội thị trường nào cho các công ty công nghệ lớn có thể chứng minh cho các khoản đầu tư tư nhân vào các tập dữ liệu cục bộ địa phương, cụ thể theo lĩnh vực, đào tạo mô hình và phát triển sản phẩm có thể giải quyết các thách thức phát triển. Do đó, cần có các giải pháp tại địa phương.

Để giải quyết vấn đề hiện tại, cần tăng cường quyền truy cập tới các thành phần cơ sở hạ tầng AI cơ bản. Một số sáng kiến đang được triển khai, chẳng hạn như Nguồn lực nghiên cứu AI quốc gia tại Hoa Kỳ và Liên doanh điện toán hiệu suất cao của Liên minh châu Âu cùng sự hợp tác của họ với các đối tác châu Phi.

Tuy nhiên, quyền truy cập tới tính toán chỉ là một khía cạnh và đi kèm với các câu hỏi bổ sung liên quan đến việc tài trợ và xây dựng cơ sở hạ tầng máy tính có chủ quyền. Các lớp khác của ngăn xếp công nghệ AI, chẳng hạn như các tập dữ liệu, mô hình và chuẩn mực, cũng phải được giải quyết3. Lý tưởng nhất là thực hiện điều này theo cách nguồn mở để tạo điều kiện tiếp cận và đại diện công bằng. Nếu không có những can thiệp như vậy, hầu hết các quốc gia sẽ tiếp tục phải đối mặt với những rào cản to lớn để phát triển các giải pháp AI vì lợi ích công cộng có tác động cao có thể giải quyết các thách thức phát triển tại địa phương. Do đó, AI vì lợi ích công cộng không chỉ đòi hỏi phải có quy định có ý nghĩa để ngăn ngừa tác hại mà còn phải phân bổ nguồn lực công trên toàn bộ ngăn xếp công nghệ AI để đẩy nhanh lợi ích công cộng vượt ra ngoài lợi ích của thị trường tư nhân. Điều này cũng nằm trong truyền thống của các khoản đầu tư công trước đây vào công nghệ để mang lại lợi ích cho xã hội, chẳng hạn như phát minh ra Internet và các sứ mệnh đầu tiên đi vào không gian.

Một số tổ chức đã làm việc tuyệt vời tại giao điểm của những cuộc tranh luận này, bao gồm nhưng không giới hạn ở Viện AI Now Institute, Dự án An ninh Kinh tế, Tương lai Mở (Open Future), Dự án Trí tuệ Tập thểQuyền Mã hóa4.

Tuy nhiên, phần lớn điều này đòi hỏi các cuộc thảo luận nhiều sắc thái xung quanh phương tiện và mục đích, hiểu sâu hơn về ngăn xếp công nghệ AI và khả năng khái quát hóa các thành phần của nó, nhưng cũng cần các nguyên tắc chuẩn mực để hướng dẫn bất kỳ khoản đầu tư công nào vào ngăn xếp công nghệ AI vì lợi ích công cộng. Theo quan điểm của Ban thư ký Liên minh hàng hóa công cộng kỹ thuật số và công việc của chúng tôi trong việc hỗ trợ phát triển, triển khai và khả năng khám phá DPG AI, các điểm sau đây nêu bật những cân nhắc chính:

  1. Hiểu được mối quan hệ giữa AI vì lợi ích công cộng và hàng hóa công cộng kỹ thuật số - DPG (Digital Public Goods): DPG AI có thể đóng vai trò thiết yếu trong việc đảm bảo rằng các mô hình hoặc hệ thống AI Nguồn Mở có liên quan đến mục tiêu phát triển bền vững - SDG (Sustainable Development Goals) có sẵn trên toàn cầu. Chúng cung cấp cho khu vực công và tư nhân các công cụ để thúc đẩy lợi ích công cộng bằng cách sử dụng các hệ thống nguồn mở đã được thẩm định dưới dạng DPG AI được công nhận, được thiết kế để giải quyết các thách thức xã hội và môi trường. Tóm lại, tất cả DPG AI đều có thể phục vụ lợi ích công cộng nếu được áp dụng và quản lý có trách nhiệm, nhưng không phải mọi công nghệ AI vì lợi ích công cộng đều sẽ là hàng hóa công cộng kỹ thuật số do những hạn chế về tính mở của chúng (xem điểm tiếp theo).

  2. AI vì lợi ích công cộng không nhất thiết phải là nguồn mở: AI phục vụ lợi ích công cộng lý tưởng nhất phải là mã nguồn mở và tuân thủ Tiêu chuẩn DPG để đảm bảo các hoạt động phát triển có trách nhiệm5. Tuy nhiên, có thể có một số lý do khiến tính mở đầy đủ không được kỳ vọng. Những lý do này bao gồm nhưng không giới hạn ở quyền riêng tư của chủ thể dữ liệu và sự đánh đổi giữa lợi ích công cộng và lợi ích thương mại.

  3. AI vì lợi ích công cộng nên ưu tiên các mô hình nhỏ, cụ thể cho từng nhiệm vụ: Để phục vụ các cộng đồng địa phương bằng cách giải quyết các trường hợp sử dụng cụ thể và cho phép đại diện phù hợp, loại bỏ sự thiên vị bắt nguồn từ các tập dữ liệu lớn, không có cấu trúc và giảm thiểu các thách thức về môi trường phát sinh từ việc đào tạo các mô hình ngày càng lớn hơn hỗ trợ AI tạo sinh, cần tập trung vào các mô hình nhỏ, cụ thể cho từng nhiệm vụ. Do thiếu tính mở trong các mô hình AI tạo sinh, hiện đang là cơ sở cho nhiều ứng dụng, nên cách tiếp cận như vậy cũng sẽ hỗ trợ tăng DPG AI, vì các mô hình nhỏ hơn, được phát triển có trách nhiệm có thể tuân thủ dễ dàng hơn với định nghĩa nguồn mở và Tiêu chuẩn DPG.

  4. Đầu tư vào công nghệ AI để thúc đẩy AI vì lợi ích công cộng nên là hỗ trợ cho AI Nguồn Mở: Đầu tư công nên cho phép truy cập mở vào các tài nguyên phát triển AI mà không hoặc chỉ có rất ít sự kiểm soát, nhắm mục tiêu và mang lại lợi ích cho các cộng đồng, nhà nghiên cứu và doanh nghiệp vừa và nhỏ chưa được phục vụ đầy đủ. Như câu nói dành cho phần mềm: "tiền công, mã công". Điều tương tự cũng đúng đối với bất kỳ sự phát triển các hệ thống AI nào do công chúng tài trợ ở mức độ lớn nhất có thể. Nếu các công ty được xây dựng dựa trên nguồn tài trợ công, công chúng cũng nên nắm giữ cổ phần chi phối.

  5. Đầu tư công vào công nghệ AI nên áp dụng cách tiếp cận về Hạ tầng Công cộng Kỹ thuật số - DPI (Digital Public Infrastructure): Chúng cần mang tính chiến lược và tối đa hóa kết quả đầu ra bằng cách học hỏi từ việc triển khai cơ sở hạ tầng công cộng kỹ thuật số. Điều này có nghĩa là hỗ trợ các nền tảng và khối xây dựng thay vì các giải pháp, trường hợp sử dụng hoặc tổ chức riêng lẻ. Đầu tư công vào cơ sở hạ tầng AI nên xem xét các nguyên tắc kiến trúc DPI như khả năng tương tác, truy cập đa phương thức, cơ sở hạ tầng phi tập trung/liên kết và an toàn và bảo mật theo thiết kế.

  6. Cần có các nguyên tắc và điều kiện để đầu tư nguồn lực công vào AI: Các hướng dẫn này chỉ đạo việc cung cấp và tiếp cận các nguồn lực công khắp toàn bộ công nghệ AI và nên được phát triển trong một quy trình hợp tác, có sự tham gia của nhiều bên liên quan. Điều này bao gồm đảm bảo rằng các nguồn lực có thể tiếp cận được và trao quyền cho các nhóm yếu thế, rằng các kết quả phù hợp với các cân nhắc về tính bền vững, tập trung vào tác động chuyển đổi, v.v.

  7. Đầu tư công vào cơ sở hạ tầng AI có thể trở thành phương tiện cho AI dân chủ: Việc tiếp cận các nguồn lực phát triển AI bằng cách ủng hộ phương pháp tiếp cận nguồn mở chỉ là một chiều hướng của việc dân chủ hóa và định hướng sự phát triển của AI theo hướng vì lợi ích công cộng. Bằng cách liên kết các cộng đồng nguồn mở với các nhà hoạt động dân chủ, nguồn tài trợ cho cơ sở hạ tầng AI công có thể trở thành động lực cho sự phát triển tập thể vượt ra ngoài các cộng đồng nguồn mở và quản trị toàn diện.

--------------------

Các chú thích

1. DPGA đã đồng tổ chức một cộng đồng thực hành với UNICEF để định nghĩa AI DPG và xây dựng các khuyến nghị để cập nhật Tiêu chuẩn DPG. Các khuyến nghị sẽ được công khai vào mùa thu năm 2024, khi Sáng kiến Nguồn Mở công bố định nghĩa AI nguồn mở của mình. Báo cáo tạm thời có thể được tìm thấy tại đây và bài đăng trên blog nêu tóm tắt tiến trình đạt được tại đây.

2. Hiểu rằng chưa có định nghĩa nào được thống nhất cho các hệ thống AI Nguồn Mở, Sáng kiến Nguồn Mở (OSI) hiện đang tạo điều kiện cho một quy trình hợp tác mở để định nghĩa nó. Phiên bản dự thảo mới nhất có thể được tìm thấy tại đây.

3. Các ví dụ bao gồm dự án huy động cộng đồng cho dữ liệu giọng nói “Mozilla Common Voice”, cơ sở hạ tầng lưu trữ dữ liệu bản địa do người Iwi Māori xây dựng, dành cho người Iwi Māori họ LLM SEA-LION do chính phủ Singapore phát triển.

4. Báo cáo sắp tới của Coding Right có tên “AI Commons (Tài sản chung AI): nuôi dưỡng các giải pháp thay thế cho văn hóa độc quyền của Big Tech” đã xác định hơn 200 tổ chức, nhiều tổ chức trong số đó có trụ sở tại các quốc gia có đa số dân số trên toàn cầu, đang hướng tới một AI Commons (Tài sản chung AI) phi tập trung, ủng hộ một con đường thay thế, công bằng để phát triển AI. Xem thêm: https://codingrights.org/docs/Federated_AI_Commons_ecosystem_T20Policybriefing.pdf

5. Tiêu chuẩn DPG không giám sát việc triển khai hạ nguồn các sản phẩm được công nhận là hàng hóa công cộng kỹ thuật số. Bất kể thế nào, việc triển khai, giám sát và quản lý bất kỳ AI DPG nào cũng phải tuân theo các thông lệ đạo đức và có trách nhiệm để phục vụ lợi ích công cộng.

The rise of public interest AI, which broadly refers to AI systems that serve the long-term survival and well-being of humankind, and public resources for AI, which includes infrastructure and funding to AI developers and researchers, can potentially boost the development of innovative AI solutions that tackle urgent global challenges ranging from climate change to healthcare. Although technically separate from one another, both public interest AI and public resources intersect as they can accelerate the development, deployment, and inclusive governance of AI DPGs (1) —AI systems that are open-source (2), SDG-relevant, and do no harm by design. The following post reflects on this intersection between public interest AI, AI DPGs, and public funding for AI infrastructure. This piece was informed by the Bellagio Convening on Public Resources for AI held by the Rockefeller Foundation between June 3 and 7, 2024.

Ever since OpenAI launched ChatGPT, discussions regarding AI regulations have intensified among policymakers, technologists, and academics. This has resulted in tangible outcomes such as the EU AI Act and the US Executive Order on Safe, Secure, and Trustworthy Development and Use of Artificial Intelligence. Alongside the strong interest in AI regulation, there has been a recent shift towards questions related to public interest AI to ensure advancements in AI technologies are human-centred and serve the public good. This is shifting the conversation to move beyond discussing how to mitigate risks, as reflected in the aforementioned regulations. Concurrently, the term “public AI” emerged, referring to AI as public infrastructure that is made accessible by the public sector to benefit all, is publicly accountable and reflects society’s values.

Although there is no consensus, several desired objectives tied to the public interest and public AI include:

  • better enabling the use of AI to tackle urgent social and environmental challenges,

  • improving access to AI development capacities to spur innovation and foster the creation of localised solutions for context-specific challenges, 

  • supporting basic AI research and research in other fields such as drug development,

  • shaping market structures to address market imbalances

Currently, market dominance throughout the AI technology stack (i.e., hardware, compute, data sets, models, benchmarks, and other tools) is highly centralised and dominated by very few companies and regions. This limits AI’s potential public interest benefits and worsens structural inequalities within and between societies because most countries lack access to critical AI development resources. This is particularly concerning as many such countries are disproportionately facing market failures in delivering basic services. There is currently no market opportunity for big tech companies that would justify private investments in relevant local, domain-specific datasets, model training, and product development that could address development challenges. Therefore, local solutions are needed.

To shift the current problem, access to foundational AI infrastructure components needs to be increased. Several initiatives are underway, such as The National AI Research Resource in the US, and the European Union’s High-Performance Computing Joint Undertaking and their collaboration with African partners. However, access to compute is just one aspect and comes with additional questions regarding funding and building sovereign compute infrastructure. Other layers of the AI technology stack, such as data sets, models, and benchmarks, also must be addressed (3). Ideally, this is done in an open-source way to facilitate equitable access and representation. Without such interventions, most countries will continue to face enormous hurdles to develop high-impact public interest AI solutions that could address local development challenges. Thus, public-interest AI necessitates not only meaningful regulation to prevent harm but also the allocation of public resources across the AI technology stack to accelerate public benefits beyond private market interests. This also stands in the tradition of previous public investments in technology to benefit society, such as the invention of the internet and early missions to space. 

Several organisations do fantastic work at the intersection of these debates, including, but not limited to the AI Now Institute, the Economic Security Project, Open Future, The Collective Intelligence Project and Coding Rights (4). 

Yet, much of this requires nuanced discussions around means and ends, a deeper understanding of the AI technology stack and the generalizability of its components, but also normative principles to guide any public investments in the AI technology stack for public benefit. From the perspective of the Digital Public Goods Alliance Secretariat and our work on supporting the development, deployment and discoverability of AI DPGs, the following points highlight key considerations:

  1. Understanding the intersection of public interest AI and digital public goods: AI DPGs can play an essential role in ensuring that SDG-relevant open-source AI models or systems are available globally. They give the public and private sector the tools to advance public interest by using vetted open-source systems in the form of recognized AI DPGs that are designed to address social and environmental challenges. In a nutshell, all AI DPGs can serve the public interest if applied and governed responsibly, but not all public interest AI technology will be a digital public good because of limitations in their openness (see next point).

  2. Public interest AI is not open-source per se: AI that serves the public good should ideally be open-source and adhere to the DPG Standard to ensure responsible development practices (5). However, there might be several reasons why full openness is not desirable. These include, but are not limited to, the data subject’s rights to privacy, and trade-offs between public benefit and commercial interests.

  3. Public interest AI should favour small, task-specific models: To serve local communities by addressing specific use cases and enabling appropriate representation, eliminate bias stemming from large, unstructured datasets and mitigate environmental challenges stemming from the training of ever-larger models underpinning generative AI, focus should be laid on small, task-specific models. Given the lack of openness in generative AI models, which currently serve as a basis for many applications, such an approach would also support an increase in AI DPGs, given that smaller, responsibly developed models can comply more easily with the open-source definition and the DPG Standard. 

  4. Investments along the AI technology stack to advance public interest AI should be in support of open-source AI: Public investments should enable open access to AI development resources without or with very limited gatekeeping, targeting and benefiting specifically underserved communities, researchers and SMEs. As the saying goes for software: “public money, public code”. The same should be true for any publicly funded development of AI systems to the biggest extent possible. If companies are built based on public funding, the public should hold controlling shares

  5. Public investments along the AI technology stack should take a DPI approach: They need to be strategic and maximise outcomes by learning from implementations of digital public infrastructure. This means supporting platforms and building blocks rather than individual solutions, use cases, or organisations. Public investments in AI infrastructure should consider DPI architecture principles such as interoperability, multi-modal access, decentralised/federated infrastructure, and safety and security by design. 

  6. Principles and conditions for investing public resources in AI are needed: These guidelines direct the supply of and access to public resources across the AI technology stack and should be developed in a collaborative, multi-stakeholder process. This includes ensuring that resources are accessible and empower disadvantaged groups, that outcomes align with sustainability considerations, focus on transformational impact, and more.

  7. Public investments in AI infrastructure can become a vehicle for democratic AI: Access to AI development resources by favouring an open-source approach is just one dimension of democratising and gearing AI’s development towards the public interest. By linking open-source communities with democracy activists, public AI infrastructure funding can become a force for collective development beyond open-source communities and inclusive governance. 

Footnotes
1. The DPGA has been co-hosting a community of practice  with UNICEF to define AI DPGs and develop recommendations for updating the DPG Standard. The recommendations will be made public in fall 2024, when the Open Source Initiative released its open-source AI definition. The interim report can be found here and a blog post outlining the progress made here.

2. Understanding that there is no agreed-upon definition for open-source AI systems, the Open Source Initiative (OSI) is currently facilitating an open, collaborative process to define it. The latest draft version can be found here.

3. Examples include the crowd-sourcing project for voice data “Mozilla Common Voice”, the indigenous data storage infrastructure built by Iwi Māori, for Iwi Māori and the SEA-LION family of LLMs developed by the Singaporean government.

4. Coding Right’s forthcoming report “AI Commons: nourishing alternatives to Big Tech monoculture” identified more than 200 organisations, many of which are based in global majority countries, that work towards a decentralised AI Commons that favours an alternative, equitable pathway to AI development. See also: https://codingrights.org/docs/Federated_AI_Commons_ecosystem_T20Policybriefing.pdf

5. The DPG Standard does not monitor downstream implementation of products recognized as digital public goods. Regardless, deployment, monitoring and governance of any AI DPG must follow ethical and responsible practices to serve the public interest.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Không có nhận xét nào:

Đăng nhận xét

Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.