Thứ Ba, 30 tháng 9, 2025

Triển khai tín hiệu CC


CC Signals Implementation

Theo: https://creativecommons.org/ai-and-the-commons/cc-signals/implementation/

Hãy cùng tìm hiểu những suy nghĩ ban đầu của chúng tôi dưới đây, sau đó giúp định hình những gì sẽ diễn ra tiếp theo! Chúng tôi đang tìm kiếm ý tưởng, phản hồi và câu hỏi của bạn về các khía cạnh pháp lý, kỹ thuật và xã hội của công việc này.

Chúng tôi đặc biệt muốn thu thập ý kiến đóng góp cho các câu hỏi sau:

  • Các tín hiệu CC hướng đến việc yêu cầu các nhà phát triển AI hành động có đi có lại. Bạn thấy tính có đi có lại trong hệ sinh thái AI như thế nào? Làm thế nào chúng ta có thể cải thiện các tín hiệu được đề xuất để đạt được tính có đi có lại tốt hơn?

  • Quản trị cộng đồng sẽ là chìa khóa để xác định thời điểm và cách thức áp dụng các tín hiệu CC. Bạn nghĩ các quyết định của người quản lý nội dung nên được đưa ra như thế nào? Ưu tiên của ai là quan trọng trong những quyết định này?

  • Các tín hiệu CC ưu tiên việc chuẩn hóa và khả năng đọc máy để tăng tính hữu ích của chúng, nhưng điều này đi kèm với chi phí. Bạn nghĩ chúng ta nên cân nhắc sự đánh đổi giữa các cân nhắc cụ thể theo ngữ cảnh và mục tiêu của hành động tập thể nhằm thúc đẩy thay đổi hành vi của những người tái sử dụng hoạt động ở quy mô lớn như thế nào?

Hãy tham gia bằng cách chia sẻ phản hồi của bạn.

Các tín hiệu CC

Bắt đầu tại đây: Nếu bạn chưa đọc, hãy đọc qua bối cảnh và những cân nhắc đang định hình sự phát triển của tín hiệu CC. Bạn cũng có thể tải xuống báo cáo của chúng tôi.

Giờ bạn đã có kiến thức nền, hãy cùng tìm hiểu chi tiết.

Ý tưởng đằng sau tín hiệu CC rất đơn giản. Sử dụng tín hiệu CC, người quản lý một bộ sưu tập nội dung lớn có thể thể hiện một tập hợp các tiêu chí mà các nhà phát triển AI phải đáp ứng. Các tiêu chí được tổ chức xung quanh các khía cạnh khác nhau của tính có đi có lại và nhằm mục đích thúc đẩy hành động thiết thực và có ý nghĩa.

Tín hiệu CC được thiết kế để cả máy móc và con người đều có thể hiểu được.

Bộ tín hiệu CC


Dự án này lấy cảm hứng từ các khái niệm cơ bản thường được nhắc đến trong các cuộc tranh luận về AI—sự đồng thuận, đền bù và ghi công trạng—nhưng theo một góc nhìn cụ thể. Cách tiếp cận của chúng tôi được thúc đẩy bởi mục tiêu tăng cường và duy trì khả năng tiếp cận tri thức của công chúng.

Mỗi tín hiệu bao gồm các điều kiện mà nội dung có thể được sử dụng để máy móc sử dụng lại được. Đây là những tiêu chí mà các nhà phát triển AI phải đáp ứng để sử dụng nội dung cho mục đích phát triển AI. Tất cả các tiêu chí được thiết kế để thúc đẩy tính có đi có lại theo những cách vừa có ý nghĩa vừa thiết thực, xét đến quy mô máy móc sử dụng lại được. Đề xuất ban đầu của chúng tôi bao gồm các yếu tố tín hiệu sau:

Credit — Ghi công trạng: Bạn phải ghi nhận công trạng phù hợp dựa trên phương pháp, phương tiện và bối cảnh sử dụng của bạn.

Direct Contribution — Đóng góp trực tiếp: Bạn phải hỗ trợ bằng tiền hoặc hiện vật cho Bên khai báo để họ phát triển và duy trì tài sản, dựa trên định giá thiện chí, có tính đến việc bạn sử dụng tài sản đó và khả năng tài chính của bạn.

Ecosystem Contribution — Đóng góp cho hệ sinh thái: Bạn phải hỗ trợ bằng tiền hoặc hiện vật cho hệ sinh thái mà bạn được hưởng lợi, dựa trên định giá thiện chí, có tính đến việc bạn sử dụng tài sản đó và khả năng tài chính của bạn.

Open — Mở: Hệ thống AI được sử dụng phải là mở. Ví dụ: các hệ thống AI phải đáp ứng Khung Mô hình Mở (MOF) Loại II, MOF Loại I hoặc Định nghĩa AI Nguồn Mở (OSAID).

Lưu ý: Việc ghi công trạng được đưa vào trong mỗi tín hiệu vì chúng tôi tin rằng đây là một hình thức có đi có lại cơ bản, mang lại lợi ích cho chu trình tri thức rộng hơn. Trong đề xuất này, các tín hiệu khác loại trừ lẫn nhau. Danh sách các tín hiệu được giới hạn một cách có chủ ý để tập thể các nhà quản lý dữ liệu và cộng đồng nắm giữ dữ liệu của họ có thể thống nhất trong việc kêu gọi áp dụng chúng với các nhà phát triển AI. Điều này cuối cùng sẽ xây dựng các mạng lưới cho hành động tập thể, đòi hỏi sự có đi có lại trong hệ sinh thái AI.

Cách thức hoạt động của Tín hiệu CC

Ai đang áp dụng tín hiệu:

Bên Khai báo là người chỉ định cách thức máy móc nên sử dụng bộ sưu tập nội dung. Đôi khi, Bên Khai báo sẽ nắm giữ bản quyền hoặc có thẩm quyền đại diện cho chủ sở hữu quyền đối với nội dung đó. Trong những trường hợp này, tín hiệu CC có thể có hiệu lực pháp lý tùy thuộc vào khu vực pháp lý cụ thể. Trong trường hợp bộ sưu tập nội dung bao gồm nội dung từ nhiều tác giả, Bên Khai báo có trách nhiệm phối hợp với cộng đồng của mình để xác định tín hiệu phù hợp.

Phạm vi sử dụng máy móc được tín hiệu đề cập:

Bên Khai báo (Declaring Party) áp dụng tín hiệu CC cho một tập hợp các danh mục tiêu chuẩn bao gồm việc sử dụng máy móc, từ các danh mục chung đến các danh mục cụ thể hơn, chẳng hạn như Khai thác Văn bản và Dữ liệu, Đào tạo AI, Đào tạo AI Tạo sinh và Suy luận AI. Để tối đa hóa khả năng tương tác toàn cầu, các danh mục này sẽ không được Creative Commons định nghĩa. Thay vào đó, chúng sẽ dựa trên các tiêu chuẩn toàn cầu đang được Lực lượng Đặc nhiệm Kỹ thuật Internet (IETF) phát triển. Khung tín hiệu CC được thiết kế để phát triển khi các danh mục tiêu chuẩn được hoàn thiện. Danh mục được chọn sẽ tạo nên phạm vi hoạt động mà công cụ dự định giải quyết.

Tín hiệu nào được áp dụng:

Bên Khai báo lựa chọn trong số các tín hiệu CC khả dụng. Sau khi được chọn, tín hiệu phản ánh sở thích của Bên Khai báo về việc sử dụng lại của máy móc. Điều này có nghĩa là Bên Khai báo tuyên bố rằng hạng mục máy móc sử dụng lại đã chọn được cho phép theo các điều khoản của các yếu tố tín hiệu cụ thể. Bốn tổ hợp tín hiệu được đề xuất là:

Ghi công trạng

Ghi công trạng + Đóng góp Trực tiếp

Ghi công trạng + Đóng góp Hệ sinh thái

Ghi công trạng + Mở

Tương tự như giấy phép CC, tín hiệu CC sẽ có thể đọc được bằng máy và người. Phần giải thích dễ hiểu về những gì xảy ra khi một tín hiệu được áp dụng sẽ được gọi là một tuyên bố (declaration). Sẽ có một tuyên bố cho mỗi tín hiệu, với các biến thể dựa trên việc Bên Tuyên bố có thẩm quyền bản quyền hay không và phạm vi sử dụng lại của máy móc cụ thể được chọn. Chuỗi mã được sử dụng để áp dụng tín hiệu CC cho một tập dữ liệu sẽ được gọi là biểu thức sử dụng nội dung (content usage expression).

Cân nhắc về mặt pháp lý

Tín hiệu CC được thiết kế như các công cụ toàn cầu, có nghĩa là chúng hoạt động trên các hệ thống pháp lý hoạt động khác nhau. Trong bối cảnh máy móc sử dụng lại, luật bản quyền bị hạn chế, không chắc chắn và không nhất quán giữa các khu vực pháp lý. Do đó, việc áp dụng tín hiệu CC có thể có hiệu lực pháp lý khác nhau tùy thuộc vào người áp dụng và trong bối cảnh nào.

Khi bản quyền tồn tại và được áp dụng, tín hiệu CC nhằm mục đích tận dụng sức mạnh của bản quyền mà không làm tăng thêm sức mạnh của nó.

Vấn đề không phải là tạo ra các quyền sở hữu mới; mà giống như việc xác định các quy tắc ứng xử cho máy móc hơn.

Để biết thêm chi tiết, vui lòng xem báo cáo. Nghiên cứu và phân tích sâu hơn về các tác động pháp lý của tín hiệu CC sẽ là trọng tâm chính trong nỗ lực của chúng tôi trong những tháng tới.

Cân nhắc kỹ thuật

Tín hiệu CC được thiết kế dựa trên các tiêu chuẩn kỹ thuật đang được Lực lượng Đặc nhiệm Kỹ thuật Internet (IETF) phát triển. Chúng tôi đã đưa các cân nhắc kỹ thuật và thành phần của tín hiệu CC trên GitHub.

Tuân thủ Tín hiệu CC

Tín hiệu Tín dụng

Việc ghi nhận và xác định nguồn gốc trong bối cảnh các mô hình AI lớn rất phức tạp, khó khăn và phát triển nhanh chóng khi công nghệ phát triển. Tuy nhiên, điều này không có nghĩa là khái niệm ghi công trạng nên bị coi là không liên quan hoặc bất khả thi trong bối cảnh AI. Chúng tôi tìm cách thiết lập các chuẩn mực xung quanh những gì có thể, không để sự hoàn hảo trở thành kẻ thù của điều tốt. Giống như điều kiện ghi nhận trong giấy phép CC, chúng tôi hình dung yếu tố tín hiệu ghi công trạng được ban hành theo bất kỳ cách thức hợp lý nào. Chúng tôi dự định phát triển hướng dẫn và các phương pháp hay nhất về ghi công trạng trong các giai đoạn tiếp theo của công việc này, dựa trên tiến độ mà những người khác trong lĩnh vực này đang đạt được. Hiện tại, ở mức tối thiểu, chúng tôi kỳ vọng tín hiệu này yêu cầu người dùng lại trích dẫn tập dữ liệu đào tạo. Đối với các kỹ thuật cho phép mô hình truy xuất thông tin để trả lời các truy vấn, chẳng hạn như thế hệ tăng cường truy xuất (RAG) và các trường hợp sử dụng khác mà về mặt kỹ thuật có thể kết nối nội dung với các đầu ra cụ thể, đầu ra phải trích dẫn bộ sưu tập dưới dạng nguồn có liên kết.

Đóng góp trực tiếp

Đây không phải là một giao dịch thương mại. Nó được thiết kế để tạo ra một cơ cấu cho sự đóng góp tài chính hoặc hiện vật nhằm hỗ trợ tính bền vững của Bên Tuyên bố. Việc áp dụng tín hiệu CC không nên được xem như một mô hình kinh doanh, hay thậm chí là một cách để thu hồi chi phí một cách đáng tin cậy. Các khoản đóng góp được dự định sẽ tương xứng, cả với loại hình và quy mô cụ thể máy móc sử dụng lại, cũng như với khả năng tài chính của bên thực hiện. Cũng như với việc ghi công trạng, chúng tôi dự định sẽ đưa ra hướng dẫn và các phương pháp hay nhất cho việc đóng góp trực tiếp khi tín hiệu CC được phát triển.

Tín hiệu Đóng góp cho Hệ sinh thái

Điều này được thiết kế để thúc đẩy những đóng góp hỗ trợ cho cộng đồng nói chung. Mặc dù cách diễn đạt ban đầu còn rất mở, chúng tôi hy vọng và kỳ vọng rằng các chuẩn mực, phương pháp hay nhất, và thậm chí cả những cấu trúc mới, mang tính tập thể, có thể phát triển xung quanh khái niệm này trong các lĩnh vực khác nhau và cho các loại hình tái sử dụng khác nhau. Mục tiêu là khuyến khích việc cho đi, truyền tải chuẩn mực có đi có lại theo những cách giúp duy trì hệ sinh thái cho tất cả mọi người.

Tín hiệu Mở

Yếu tố tín hiệu này phản ánh thực tế rằng việc tạo ra các mô hình AI mở - bằng cách công bố trọng số mô hình, mã hoặc tập dữ liệu để người khác sử dụng và xây dựng - là một hình thức có đi có lại. Với những tiến bộ mà các bên khác trong lĩnh vực này đã đạt được trong việc cung cấp các định nghĩa có ý nghĩa về tính mở, đề xuất của chúng tôi cho tín hiệu này cụ thể hơn về những gì cần thiết để tuân thủ nó.

Khuyến khích sự tuân thủ của các nhà phát triển AI

Chúng tôi nhận thấy rằng các tín hiệu CC sẽ dựa vào sự tham gia tự nguyện của các nhà phát triển AI để tuân thủ nó. Có nhiều lý do để hoài nghi về việc tuân thủ, đặc biệt là khi nó không phải là yêu cầu pháp lý, và luôn có và sẽ luôn có những tác nhân xấu. Tuy nhiên, chúng tôi thấy nhiều lý do để tin rằng việc áp dụng là có khả năng.

Thứ nhất, đã có tiền lệ. Mặc dù việc tuân thủ không phải lúc nào cũng hoàn hảo, robots.txt đã hoạt động trong nhiều năm như một cách để mã hóa các kỳ vọng chuẩn mực về - và giúp duy trì khế ước xã hội cho - việc máy móc tái sử dụng nội dung trên web. Chúng tôi cũng thấy sự thành công của việc cấp phép CC là bằng chứng cho thấy sự tham gia tự nguyện là khả thi. Mặc dù giấy phép CC được xây dựng dựa trên luật bản quyền và do đó mang theo rủi ro vi phạm bản quyền, nhưng trên thực tế, chúng hoạt động hiệu quả vì mọi người đã lựa chọn tuân thủ chúng. Các vụ kiện tụng liên quan đến việc thực thi giấy phép CC rất hiếm, và phần lớn liên quan đến những người kiện tụng không hành động một cách thiện chí. Thay vào đó, hiện nay có hàng chục tỷ tác phẩm được cấp phép CC có sẵn trong cộng đồng vì chúng dựa trên những quan niệm trực quan về sự công bằng và mang tính xã hội khi nói đến việc chia sẻ và tái sử dụng kiến thức.

Cũng có những lý do rõ ràng tại sao các tác nhân có lý trí nên tôn trọng và tuân thủ các tín hiệu ưu tiên. Như chúng tôi đã viết trước đó trong báo cáo này, dữ liệu từ khắp các trang web công cộng là một thành phần quan trọng trong việc phát triển các mô hình AI quy mô lớn. Nếu những người phát triển AI không tôn trọng mong muốn của người sáng tạo, họ có nguy cơ loại bỏ động lực chia sẻ và phân phối rộng rãi các tác phẩm của mình. Theo thời gian, điều này sẽ làm giảm tính chính xác, an toàn và tính phổ biến của các mô hình và dịch vụ mà họ xây dựng. Điều này sẽ đặc biệt nghiêm trọng đối với các công ty nhỏ, công ty khởi nghiệp, tổ chức phi lợi nhuận và các nhà nghiên cứu học thuật, những người không có đủ nguồn lực để dựa vào các thỏa thuận cấp phép tốn kém.

Hãy chia sẻ phản hồi của bạn ngay bây giờ trên GitHub.

Dive into our early thinking below, then help shape what comes next! We’re looking for your ideas, feedback, and questions on the legal, technical, and social layers of this work.

We’d especially like to gather input on the following questions:

  • CC signals are aimed at demanding reciprocal action by AI developers. What does reciprocity in the AI ecosystem look like to you? How can we improve the proposed signals to better achieve reciprocity?

  • Community governance will be key to determining when and how CC signals are applied. How do you think decisions by content stewards should be made? Whose preferences matter in these decisions?

  • CC signals prioritize standardization and machine readability to increase their utility, but this comes with costs. How do you think we should consider the tradeoff between context-specific considerations and the goal of collective action that spurs behavioral change by reusers operating at a massive scale?

Get involved by sharing your feedback.

The CC Signals

Start here: If you haven’t already, read through the context and considerations that are informing the development of CC signals. You can also download our report.

Now that you have the background, let’s dig into the details.

The idea behind CC signals is simple. Using CC signals, a steward of a large collection of content can express a set of criteria that AI developers must meet. The criteria are organized around different dimensions of reciprocity, and are intended to drive meaningful, practical action.

CC signals are designed to be interpretable by machines, as well as humans. 

The Suite of CC Signals

This project draws inspiration from fundamental concepts often referenced in the AI debate—consent, compensation, and credit— but with a particular angle. Our approach is driven by the goal of increasing and sustaining public access to knowledge.

Each signal includes the conditions by which content can be used for machine reuse. These are criteria that AI developers must meet in order to use the content for AI development. All of the criteria are designed to promote reciprocity in ways that are both meaningful and practical given the scale of machine reuse. Our initial proposal includes the following signal elements:

Credit: You must give appropriate credit based on the method, means, and context of your use.

Direct Contribution: You must provide monetary or in-kind support to the Declaring Party for their development and maintenance of the assets, based on a good faith valuation taking into account your use of the assets and your financial means.

Ecosystem Contribution: You must provide monetary or in-kind support back to the ecosystem from which you are benefiting, based on a good faith valuation taking into account your use of the assets and your financial means.

Open: The AI system used must be open. For example, AI systems must satisfy the Model Openness Framework (MOF) Class II, MOF Class I, or the Open Source AI Definition (OSAID).

Note: Credit is included in each signal because we believe it is a fundamental form of reciprocity, one that benefits the broader knowledge cycle. In this proposal, the other signals are mutually exclusive. The list of signals is intentionally limited so that the collective of data stewards and their communities data holding communities can align in calling for their adoption with AI developers. This will ultimately build networks for collective action, requiring reciprocity within the AI ecosystem.

How the CC Signals Work

Who is applying the signal:

A Declaring Party is someone who specifies how a content collection should be used by machines. Sometimes, the Declaring Party will hold copyright or have authority to represent rightsholders in the content. In these cases, a CC signal may have legal effect depending on the particular jurisdiction. In cases where a collection of content includes content from multiple authors, it will be the responsibility of the Declaring Party to coordinate among its community to determine the appropriate signal(s).

The scope of machine uses addressed by the signal:

The Declaring Party applies CC signals to a set of standard categories that encompass machine use, from general categories to more specific categories, such as Text and Data Mining, AI Training, Generative AI Training, and AI Inference. In order to maximize global interoperability, these categories will not be defined by Creative Commons. Instead, they will be based upon global standards being developed by the Internet Engineering Task Force (IETF). The CC signals framework is designed to evolve as the standard categories are finalized. The selected category makes up the scope of what activity the tool is intended to address.

What signal is applied:

The Declaring Party selects among the available CC signals. Once selected, the signal reflects the Declaring Party’s preferences regarding machine reuse. This means that the Declaring Party says that the selected category of machine reuse is allowed under the terms of the particular signal elements. The four proposed signal combinations are:

Credit
Credit + Direct Contribution
Credit + Ecosystem Contribution
Credit + Open

Similar to the CC licenses, CC signals will be both machine and human readable. The human-readable explanation of what happens when a signal is applied will be called a declaration. There will be a declaration for each signal, with variations based on whether the Declaring Party has copyright authority and the particular scope of machine reuse selected. The string of code used to apply a CC signal to a dataset will be called a content usage expression.

Legal Considerations

CC signals are designed as global tools, which means they operate across legal systems that work differently. In the context of machine reuse, copyright law is limited, uncertain, and inconsistent across jurisdictions. As a result, applying a CC signal is likely to have a different legal effect depending on who applies it and in what context.

Where copyright exists and is applicable, CC signals are intended to leverage the power of copyright without increasing its power.

This is not about creating new property rights; it is more like defining manners for machines.

For more detail, please see the report. Further research and analysis about the legal implications of CC signals will be a major focus of our efforts in the coming months.

Technical Considerations

CC signals are designed to build upon technical standards being developed by the Internet Engineering Task Force (IETF). We have included technical considerations and components of the CC signals on GitHub.

Adhering to CC Signals

Credit Signal

Attribution and provenance in the context of large AI models is complex, difficult, and rapidly evolving as technologies develop. However, this does not mean that the concept of credit should be seen as irrelevant or impossible in the context of AI. We seek to establish norms around what is possible, not letting the perfect be the enemy of the good. Like the attribution condition in the CC licenses, we imagine the credit signal element being enacted in any reasonable manner. We plan to develop guidance and best practices around credit in future stages of this work, drawing on the progress being made in this area by others in the field. For now, at a minimum, we expect this signal to require citation of the training dataset by the reuser. For techniques that enable models to retrieve information in response to queries, such as retrieval augmented generation (RAG), and other use cases where it is technically feasible to connect content with particular outputs, outputs must cite the collection as a source with a link.

Direct Contribution

This is not intended as a commercial transaction. It is designed to create a structure for financial or in-kind contribution to support the sustainability of the Declaring Party. The application of CC signals should not be seen as a business model, or even a way to reliably recoup costs. The contributions are intended to be proportionate, both to the particular type and scale of machine reuse, and to the financial means of the party undertaking it. As with credit, we plan to produce guidance and best practices for direct contribution as CC signals develop.

Ecosystem Contribution Signals

This is designed to spur contributions that support the commons as a whole. While the initial phrasing is very open-ended, we hope and expect that norms, best practices, and even new, collective-minded structures could grow around this notion in different sectors and for different types of reuses. The aim is to encourage a practice of giving back, infusing a norm of reciprocity in ways that will help sustain the ecosystem for all.

Open Signal

This signal element reflects the fact that making AI models open—by releasing model weights, code, or datasets for others to use and build on—is a form of reciprocity.  Given the progress made by others in the field to provide meaningful definitions of openness, our proposal for this signal is more specific about what is required to adhere to it.

Incentivizing Adherence by AI Developers

We recognize that CC signals will rely on willing participation by AI developers to adhere to it. There are many reasons to be cynical about adherence, particularly when it is not legally required, and there are and will always be bad actors. However, we see many reasons to believe that uptake is likely.

For one thing, there is precedent. Although adherence hasn’t always been perfect, robots.txt functioned for many years as a way to encode normative expectations about—and help maintain the social contract for—machine reuse of content on the web. We also see the success of CC licensing as evidence that voluntary buy-in is possible. While CC licenses are built atop copyright law and therefore carry the weight of copyright infringement risk, in reality they work because people have chosen to adhere to them. Litigation involving enforcement of CC licenses is rare, and much of it involves litigants who are not operating in good faith. Instead, there are now tens of billions of CC-licensed works available in the commons because they are grounded in intuitive notions about what is fair and prosocial when it comes to sharing and reuse of knowledge.

There are also clear reasons why rational actors should respect and adhere to preference signals. As we’ve written earlier in this report, data from across the public web is a key component in developing large AI models. If those developing AI do not respect the wishes of creators, they risk eliminating incentives for people to share and widely distribute their works. Over time, this will compromise the accuracy, safety and currency of the models and services they build. This will be particularly acute for small firms, startups, nonprofits, and academic researchers, who would not have the resources to instead rely on costly licensing deals.

Share your feedback now on GitHub.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Hai, 29 tháng 9, 2025

Tín hiệu CC: Một khế ước mới với xã hội cho kỷ nguyên AI


CC Signals: A New Social Contract for the Age of AI

Theo: https://creativecommons.org/ai-and-the-commons/cc-signals/

TL;DR – Tín hiệu CC là gì?

Tín hiệu CC là một khung được đề xuất để giúp các quản trị viên nội dung thể hiện cách họ muốn tác phẩm của mình được sử dụng trong đào tạo AI—nhấn mạnh tính có đi có lại, sự công nhận và tính bền vững trong việc máy móc sử dụng lại. Chúng hướng đến việc bảo tồn kiến thức mở bằng cách khuyến khích hành vi AI có trách nhiệm mà không hạn chế sự đổi mới.

Thích quá! Tôi có thể thể hiện sự ủng hộ của mình như thế nào? Cảm ơn bạn! Có nhiều cách để bạn thể hiện sự ủng hộ của mình, bao gồm:

  • Tài trợ: Quyên góp định kỳ hàng năm thông qua Vòng tròn Cơ sở Hạ tầng Mở (Open Infrastructure Circle) của chúng tôi. Công việc này sẽ đòi hỏi một lượng lớn nguồn lực, trong nhiều năm, để thực hiện được.

  • Tham gia: Thể hiện sự quan tâm sớm trong việc hỗ trợ hoặc triển khai tín hiệu CC bằng cách tham gia vào các bước phát triển tiếp theo.

  • Khuếch đại: Mời một chuyên gia CC đến thuyết trình, tham gia hội thảo hoặc có bài phát biểu chính về AI và cộng đồng, chia sẻ về kỷ nguyên AI, AI và bản quyền, và tín hiệu CC bằng cách gửi email đến communications@creativecommons.org.

Tôi quan tâm. Tôi muốn tìm hiểu thêm. Chúng tôi luôn sẵn sàng hỗ trợ bạn! Để có phân tích chi tiết, hãy tải xuống báo cáo của chúng tôi: Từ Nội dung Con người đến Dữ liệu Máy móc: Giới thiệu Tín hiệu CC (bản dịch sang tiếng Việt). Để tìm hiểu sâu hơn về các thành phần kỹ thuật của tín hiệu CC, hãy truy cập trang Triển khai Tín hiệu CC.

Tại sao nên sử dụng Tín hiệu CC: Bối cảnh & Cân nhắc


Đây là một thách thức cực kỳ phức tạp và rủi ro rất lớn. Cần có nhiều giải pháp giao thoa và liên kết với nhau, và may mắn thay, có rất nhiều tổ chức vì lợi ích công cộng cùng chung tay trong cuộc chiến này. Sự tham gia của CC chỉ vào một phần của câu đố đó, nhưng lại là một phần quan trọng.

Sau đây là những gì chúng tôi đã phân tích để đưa ra giải pháp đề xuất.

AI phụ thuộc vào dữ liệu web công khai. Nhưng ai đặt ra quy tắc?

Dữ liệu hỗ trợ AI được tạo ra bởi con người và cộng đồng. Ngày nay, hàng tỷ trang web cung cấp năng lượng cho các hệ thống AI. Điều này đã diễn ra nhanh chóng ở quy mô chưa từng có. Nó cũng diễn ra mà không có sự tham gia của người sáng tạo nội dung và người quản lý, vượt xa kỳ vọng hợp lý của mọi người về cách tác phẩm của họ sẽ được sử dụng khi họ chia sẻ chúng công khai.

Máy móc sử dụng nội dung web không phải là điều mới mẻ. Vậy điều gì đã thay đổi?

Máy móc từ lâu đã truy cập và biên soạn nội dung web để xây dựng công cụ tìm kiếm và kho lưu trữ kỹ thuật số. Tuy nhiên, ngày nay, máy móc không chỉ thu thập dữ liệu web để làm cho nó dễ tìm kiếm hơn hoặc giúp khám phá những hiểu biết mới - chúng cung cấp các thuật toán làm thay đổi căn bản (và đe dọa) thế giới web mà chúng ta biết.

Trí tuệ nhân tạo (AI) đang vượt xa khế ước xã hội. Tại sao điều này lại quan trọng đối với tài sản chung (the commons)?

Các chuẩn mực chi phối cách máy móc sử dụng dữ liệu đã lỗi thời và đang bị đe dọa. Hệ sinh thái AI hiện tại không còn phù hợp với khế ước xã hội vốn đã chi phối tài sản chung kỹ thuật số (digital commons) từ lâu: chúng ta chia sẻ một cách cởi mở, nhưng chúng ta mong đợi sự tôn trọng, công nhận và có đi có lại. Điều này đã dẫn đến những phản ứng dữ dội (dễ hiểu) đối với những tiến bộ trong AI, từ nhiều loại hình bao vây đến việc đơn giản là không chia sẻ gì cả.

Nếu ai cũng chặn quyền truy cập, ai cũng thua. Làm thế nào chúng ta có thể tránh khỏi con đường này?

Tương lai của tài sản chung hiện đang bị đe dọa. Điều này không bền vững và không dẫn đến tương lai mà chúng ta mong muốn. Tài sản chung là một trong những tài sản chung được chia sẻ lớn nhất của chúng ta. Việc tiếp cận tri thức không rào cản là nền tảng cho khám phá khoa học, dân chủ và đóng vai trò như một liều thuốc giải độc cho thông tin sai lệch và xuyên tạc. Nếu nội dung không còn được công khai hoặc trở nên rủi ro và không chắc chắn hơn khi sử dụng, nó sẽ chỉ dành cho những người có tiền. Ngoài việc cản trở khả năng tiếp cận tri thức của con người, chúng tôi lo ngại rằng việc chuyển sang cấp phép hạn chế sẽ dẫn đến một hệ sinh thái AI kém công bằng, đa dạng và cạnh tranh hơn.

Luật bản quyền không bao giờ có mục đích làm điều này. Vậy giải pháp là gì?

Ý tưởng, sự thật và các nền tảng kiến thức khác không thể bị sở hữu. Việc mở rộng bản quyền để kiểm soát đào tạo AI có nguy cơ kìm hãm sự đổi mới và tiếp cận tri thức. Tương lai phụ thuộc vào những kỳ vọng chung và việc tái sử dụng có trách nhiệm. Bất kỳ giải pháp khả thi nào cũng cần phải có cơ sở pháp lý, khả năng tương tác về mặt kỹ thuật và được hỗ trợ bởi hành động tập thể của con người. Chúng ta cần một khế ước xã hội mới cho thời đại AI. Vấn đề không chỉ nằm ở bộ dữ liệu hay giấy phép — mà còn ở việc bảo vệ tri thức mở, niềm tin và sự công bằng trong thời đại kỹ thuật số.

Tìm hiểu sâu hơn

Bạn muốn biết toàn bộ bối cảnh đằng sau tín hiệu CC?

Đọc Từ Nội dung Con người đến Dữ liệu Máy móc: Giới thiệu Tín hiệu CC (bản dịch sang tiếng Việt)

Chúng tôi đang Đấu tranh cho Cộng đồng: Tín hiệu CC là một phần của Giải pháp

Sự phát triển của tín hiệu CC dựa trên:

  • Niềm tin rằng có nhiều mục đích chính đáng cho việc máy móc sử dụng lại nội dung mà nội dung đó cần được bảo vệ;

  • Một hệ sinh thái giải quyết tốt hơn những mối quan tâm chính đáng của những người tạo ra và quản lý tri thức của con người là điều khả thi và cần thiết.

Các tín hiệu CC lấy cảm hứng từ các khái niệm cơ bản thường được nhắc đến trong cuộc tranh luận về AI—sự đồng thuận, đền bù và thừa nhận ghi công—nhưng với một góc độ cụ thể. Cách tiếp cận của chúng tôi được thúc đẩy bởi mục tiêu tăng cường và duy trì khả năng tiếp cận tri thức của công chúng.

Các yếu tố tín hiệu CC được đề xuất được cấu trúc để phản ánh các khía cạnh khác nhau của tính có đi có lại: ghi công trạng, tính bền vững về tài chính và các hình thức đóng góp phi tiền tệ. Chúng không nhằm mục đích hạn chế hoặc giới hạn các loại hình đào tạo AI hoặc các loại hình sử dụng khác (ví dụ: khai thác văn bản và dữ liệu) mà máy móc có thể thực hiện. Thay vào đó, chúng được thiết kế để khuyến khích các hành động đền đáp lại.

Bạn có tò mò về cách các tín hiệu CC có thể định hình lại tương lai của AI không?

Hãy tìm hiểu những suy nghĩ ban đầu của chúng tôi—sau đó giúp định hình những gì sẽ xảy ra tiếp theo! Chúng tôi đang tìm kiếm ý tưởng, phản hồi và câu hỏi của bạn về các khía cạnh pháp lý, kỹ thuật và xã hội của công trình này.

Hành động tập thể

Chuẩn mực xã hội được cho là khía cạnh quan trọng nhất của quản trị con người. Chúng quyết định cách chúng ta hành xử, cách chúng ta thuộc về và cách chúng ta đưa ra quyết định trong hầu hết mọi khía cạnh của cuộc sống.

Chuẩn mực có thể rất mạnh mẽ, nhưng chúng đòi hỏi hành động tập thể. Chúng ta cảnh giác với những người sáng tạo và bộ sưu tập nội dung, mỗi bên đều cố gắng định hình cách sử dụng tác phẩm của họ theo hàng ngàn cách khác nhau và không tương thích. Một sở thích duy nhất, được thể hiện một cách độc đáo, sẽ không quan trọng trong thời đại máy móc.

Điều đó không có nghĩa là tiếng nói của từng cá nhân không quan trọng. Trong nhiều trường hợp, một bộ sưu tập duy nhất sẽ chứa đựng các tác phẩm của nhiều người đóng góp.

Sức mạnh đến từ sự phối hợp và đoàn kết. Chúng ta càng thống nhất giữa các lĩnh vực, cộng đồng và địa lý, chúng ta càng có nhiều đòn bẩy để tác động đến chính sách và thực tiễn AI.

TL;DR – What are CC signals?

CC signals are a proposed framework to help content stewards express how they want their works used in AI training—emphasizing reciprocity, recognition, and sustainability in machine reuse. They aim to preserve open knowledge by encouraging responsible AI behavior without limiting innovation.

Love it! How can I show my support? Thank you! There are multiple ways that you can show your support including:

  • Fund: Make an annual recurring donation via our Open Infrastructure Circle. This work will require a large amount of resourcing, over many years, to make happen.

  • Join: Express early interest in supporting or implementing CC signals by getting involved in the next steps of development.

  • Amplify: Invite a CC expert to present, join a panel, or give a keynote address on AI and the commons, sharing in the age of AI, AI and copyright, and CC signals by sending an email to communications@creativecommons.org.

I’m interested. I want to learn more. We’ve got you! For a detailed analysis, download our report From Human Content to Machine Data: Introducing CC Signals. To dig into the more technical components of CC signals, head over to the CC Signals Implementation page.

Why CC Signals: Context & Considerations

This is an extremely complex challenge and the stakes are huge. Many intersecting and interconnected solutions are required, and thankfully, there are many public interest organizations joined together in this fight. CC’s involvement in only one part of the puzzle, but a critical one.

Here’s what we’ve been analyzing to inform our proposed solution.

AI depends on public web data. But who sets the rules?

The data that powers AI was created by people and communities. Today, billions of webpages fuel AI systems. This has happened quickly at an unprecedented scale. It has also happened without the involvement of content creators and stewards, reaching beyond people’s reasonable expectations for how their works would be used when they shared them publicly.

Machine use of web content is not new. So what’s changed?

Machines have long accessed and compiled web content to build search engines and digital archives. However, today, machines don’t just crawl the web to make it more searchable or to help unlock new insights—they feed algorithms that fundamentally change (and threaten) the web we know.

AI is outpacing the social contract. Why does this matter for the commons?

The norms that govern how machines use data are out of date and under threat. The current AI ecosystem is out of alignment with the social contract that has long governed the digital commons: we share openly, but we do so expecting respect, recognition, and reciprocity. This has resulted in (understandable) backlash against advances in AI that range from various types of enclosure to simply not sharing at all.

If everyone blocks access, everyone loses. How can we avoid this path?

The future of the commons is now under threat. This isn’t sustainable, and it isn’t leading to the future we want. The commons is one of our greatest shared assets. Barrier-free access to knowledge underpins scientific discovery, democracy, and acts as an antidote to mis and disinformation. If content is no longer publicly available or otherwise becomes more risky and uncertain to use, it becomes solely accessible to those with deep pockets. In addition to impeding human access to knowledge, we’re concerned that a shift to restrictive licensing would result in a less fair, diverse, and competitive AI ecosystem.

Copyright law was never meant to do this. So what’s the solution?

Ideas, facts, and other building blocks of knowledge cannot be owned. Expanding copyright to control AI training risks stifling innovation and access to knowledge. The future depends on shared expectations and responsible reuse. Any viable solution needs to be legally grounded, technically interoperable, and backed by the collective action of humans. We need a new social contract for the age of AI. This isn’t just about datasets or licenses — it’s about safeguarding open knowledge, trust, and equity in the digital age.

Dive Deeper
Want the full context behind CC signals?
Read
From Human Content to Machine Data: Introducing CC Signals

We’re Fighting for the Commons: CC Signals Is Part of the Solution

The development of CC signals is based on:

  • The belief that there are many legitimate purposes for machine reuse of content that must be protected;

  • An ecosystem that better addresses the legitimate concerns of those creating and stewarding human knowledge is both possible and necessary.

CC signals draw inspiration from fundamental concepts often referenced in the AI debate—consent, compensation, and credit—but with a particular angle. Our approach is driven by the goal of increasing and sustaining public access to knowledge.

The proposed CC signal elements are structured to reflect different dimensions of reciprocity: credit, financial sustainability, and non-monetary forms of contribution. They do not aim to limit or restrict the types of AI training or other types of uses (for example,  text and data mining) that machines can undertake. Instead, they are designed to incentivize actions in return.

Curious how CC signals could reshape the future of AI?

Dive into our early thinking—then help shape what comes next! We’re looking for your ideas, feedback, and questions on the legal, technical, and social layers of this work.

Collective Action

Social norms are arguably the single most important aspect of human governance. They dictate how we behave, how we belong, and how we make decisions across nearly every aspect of our lives.

Norms can be powerful, but they require collective action. We’re wary of creators and collections of content each trying to shape how their works are used in thousands of different, incompatible ways. A single preference, uniquely expressed, is inconsequential in the machine age.

That doesn’t mean individual voices don’t matter. In many cases, a single collection will contain works by many contributors.

Power comes from coordination and solidarity. The more we align across sectors, communities, and geographies, the more leverage we gain to influence AI policy and practice.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Chủ Nhật, 28 tháng 9, 2025

Vì sao cần tín hiệu CC: Bản cập nhật


Why CC Signals: An Update

Posted 02 July 2025 by Creative Commons

Theo: https://creativecommons.org/2025/07/02/why-cc-signals-an-update/

Bài được đưa lên Internet ngày: 02/07/2025

Xin chân thành cảm ơn tất cả mọi người đã tham dự buổi khởi động dự án tín hiệu CC tuần trước. Chúng tôi đã nhận được rất nhiều phản hồi và rất trân trọng những ý kiến đóng góp đó. Chúng tôi đang lắng nghe tất cả và hy vọng các bạn sẽ tiếp tục đồng hành cùng chúng tôi trong quá trình hoàn thiện khung này.

Một số ý kiến đóng góp tập trung vào các chi tiết cụ thể của đề xuất tín hiệu CC, đưa ra những câu hỏi mang tính xây dựng và đề xuất các ý tưởng cải thiện tín hiệu CC trong thực tế. Tuy nhiên, loại phản hồi nổi bật nhất lại đề cập đến một điều sâu sắc hơn nhiều so với bản thân tín hiệu CC – thực tế là rất nhiều điều về AI dường như đang xảy ra với tất cả chúng ta, chứ không phải với hoặc vì tất cả chúng ta, và kỳ vọng của những người sáng tạo và cộng đồng đang có nguy cơ bị lu mờ bởi những lợi ích to lớn.

Cảm xúc này không làm chúng tôi ngạc nhiên. Chúng tôi cũng cảm nhận được điều đó. Trên thực tế, đó là lý do tại sao chúng tôi thực hiện dự án này. Mục tiêu của CC luôn là phát triển và duy trì sự thịnh vượng chung của tri thức và văn hóa. Chúng tôi muốn mọi người có thể chia sẻ và học hỏi lẫn nhau mà không bị hoặc cảm thấy bị lợi dụng. Tín hiệu CC là một phần mở rộng của sứ mệnh đó trong bối cảnh AI đang phát triển này.

Chúng tôi tin rằng các hoạt động hiện tại của các công ty AI gây ra mối đe dọa cho tương lai của sự thịnh vượng chung. Nhiều người sáng tạo và cộng đồng tri thức đang cảm thấy bị phản bội bởi cách AI đang được phát triển và triển khai. Kết quả là mọi người đang chuyển sang sự khép kín, một điều dễ hiểu. Cuối cùng, chúng tôi lo ngại rằng mọi người sẽ không còn muốn chia sẻ công khai nữa.

Tín hiệu CC là bước đầu tiên để giảm thiểu thiệt hại này bằng cách trao quyền chủ động hơn cho những người tạo và lưu trữ nội dung. Không giống như giấy phép CC, chúng được thiết kế rõ ràng để báo hiệu những kỳ vọng ngay cả khi luật bản quyền không đề cập hoặc không rõ ràng, khi luật không áp dụng và khi luật khác nhau tùy theo khu vực pháp lý. Chúng tôi đã lắng nghe những người sáng tạo muốn chia sẻ tác phẩm của họ nhưng cũng lo ngại về việc bị lợi dụng. Tín hiệu CC cung cấp một cách để người sáng tạo thể hiện những sắc thái đó. Tín hiệu CC được xây dựng dựa trên các tiêu chuẩn đang phát triển để thể hiện sở thích sử dụng AI (ví dụ: thông qua robots.txt). Những người sáng tạo muốn từ chối hoàn toàn việc tái sử dụng máy móc không cần sử dụng tín hiệu CC. Tín hiệu CC dành cho những người muốn tiếp tục chia sẻ, nhưng có kèm theo một số điều khoản.

Thách thức mà tất cả chúng ta đang phải đối mặt trong thời đại AI này là làm thế nào để bảo vệ tính toàn vẹn và sức sống của tài sản chung. Những nỗ lực lắng nghe mà chúng ta đã thực hiện cho đến nay, trên khắp các cộng đồng sáng tạo và mạng lưới tri thức mở, đã dẫn chúng ta đến đây, với những tín hiệu CC. Cam kết chung của chúng ta là bảo vệ tài sản chung để nó vẫn là không gian cho sự sáng tạo, hợp tác và đổi mới của con người, đồng thời làm rõ kỳ vọng của chúng ta rằng những người khai thác tài sản chung sẽ phải đền đáp lại.

Mục tiêu của chúng tôi là ủng hộ nguyên tắc có đi có lại, đồng thời duy trì các giá trị của chúng tôi rằng kiến thức và sự sáng tạo không nên bị coi là hàng hóa.

Mục tiêu của chúng tôi là tìm ra con đường giữa một thế giới tự do không mất tiền cho tất cả mọi người và một mạng lưới Internet của những bức tường thu phí.

Bản quyền sẽ không đưa chúng ta đến đó. Và cũng không nên như vậy. Và chúng tôi không nghĩ rằng ranh giới của bản quyền cho chúng ta biết tất cả những gì chúng ta cần biết về việc định hướng thời điểm này. Chỉ trong tuần này, Open Future đã công bố một báo cáo kêu gọi vượt ra ngoài bản quyền trong cuộc tranh luận này, trên con đường hướng tới một thế giới tri thức chung lành mạnh.

Đây là khởi đầu của cuộc trò chuyện, chứ không phải kết thúc. Chúng tôi đang lắng nghe. Theo những gì chúng tôi được biết, tín hiệu CC, hay một cái gì đó tương tự, là cơ chế thực tế tốt nhất để tránh hai cái bẫy kép: khai thác hoàn toàn hoặc bao vây hoàn toàn, cả hai đều gây tổn hại đến tài sản chung. Chúng tôi chia sẻ tiến độ hiện tại vì chúng tôi muốn tìm hiểu cách thiết kế nó để đáp ứng nhu cầu của bạn. Chúng tôi mời bạn tiếp tục chia sẻ phản hồi để chúng ta có thể cùng nhau định hình tín hiệu CC theo cách phù hợp với các cộng đồng đa dạng.

Trong những tháng tới, chúng tôi sẽ cung cấp thêm chi tiết về cách phát triển tín hiệu CC, bao gồm các chủ đề chính mà chúng tôi đang nghe, cùng với những câu hỏi mà chúng tôi đang khám phá và các bước tiếp theo của chúng tôi.

Thanks to everyone who attended our CC signals project kickoff last week. We’re receiving plenty of feedback, and we appreciate the insights. We are listening to all of it and hope that you continue to engage with us as we seek to make this framework fit for purpose.

Some of the input focuses on the specifics of the CC signals proposal, offering constructive questions and suggesting ideas for improving CC signals in practice. The most salient type of feedback, however, is touching on something far deeper than the CC signals themselves – the fact that so much about AI seems to be happening to us all, rather than with or for us all, and that the expectations of creators and communities are at risk of being overshadowed by powerful interests.

This sentiment is not a surprise to us. We feel it, too. In fact, it is why we are doing this project. CC’s goal has always been to grow and sustain the thriving commons of knowledge and culture. We want people to be able to share with and learn from each other, without being or feeling exploited. CC signals is an extension of that mission in this evolving AI landscape.

We believe that the current practices of AI companies pose a threat to the future of the commons. Many creators and knowledge communities are feeling betrayed by how AI is being developed and deployed. The result is that people are understandably turning to enclosure. Eventually, we fear that people will no longer want to share publicly at all.

CC signals are a first step to reduce this damage by giving more agency to those who create and hold content. Unlike the CC licenses, they are explicitly designed to signal expectations even where copyright law is silent or unclear, when it does not apply, and where it varies by jurisdiction. We have listened to creators who want to share their work but also have concerns about exploitation. CC signals provide a way for creators to express those nuances. The CC signals build on top of developing standards for expressing AI usage preferences (e.g., via robots.txt). Creators who want to fully opt out of machine reuse do not need to use a CC signal. CC signals are for those who want to keep sharing, but with some terms attached.

The challenge we’re all facing in this age of AI is how to protect the integrity and vitality of the commons. The listening we’ve been doing so far, across creator communities and open knowledge networks, has led us here, to CC signals. Our shared commitment is to protect the commons so that it remains a space for human creativity, collaboration, and innovation, and to make clear our expectation that those who draw from it give something in return.

Our goal is to advocate for reciprocity while upholding our values that knowledge and creativity should not be treated as commodities.

Our goal is to find a path between a free-for-all and an internet of paywalls.

Copyright will not get us there. Nor should it. And we don’t think the boundaries of copyright tell us everything we need to know about navigating this moment. Just this week, Open Future released a report that calls for going beyond copyright in this debate, on the path to a healthy knowledge commons.

This is the beginning of the conversation, not the end. We are listening. From what we have heard, CC signals, or something like it, is the best practical mechanism to avoid the dual traps of total exploitation or total enclosure, both of which damage the commons. We have shared our current progress because we want to learn how to design it to meet your needs. We invite you to continue sharing feedback so we can shape CC signals together in a way that works for diverse communities.

In the months ahead, we’ll be providing more detail about how CC signals are developing, including key themes we are hearing, along with the questions we are exploring and our next steps.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Sáu, 26 tháng 9, 2025

Giới thiệu Tín hiệu CC: Một khế ước mới với xã hội cho kỷ nguyên AI


Introducing CC Signals: A New Social Contract for the Age of AI

by Creative Commons, Posted 25 June 2025

Theo: https://creativecommons.org/2025/06/25/introducing-cc-signals-a-new-social-contract-for-the-age-of-ai/

Bài được đưa lên Internet ngày: 25/06/2025

CC Signals © 2025 by Creative Commons is licensed under CC BY 4.0

Creative Commons (CC) hôm nay công bố khởi động dự án tín hiệu CC, một khung tín hiệu ưu tiên mới được thiết kế để tăng cường tính tương hỗ và duy trì một cộng đồng sáng tạo trong thời đại AI. Việc phát triển tín hiệu CC đại diện cho một bước tiến lớn trong việc xây dựng một hệ sinh thái AI công bằng và bền vững hơn, dựa trên lợi ích chung. Bước đi này là kết quả của nhiều năm tham vấn và phân tích. Khi chúng tôi bước vào giai đoạn làm việc mới này, chúng tôi đang tích cực tìm kiếm ý kiến đóng góp từ công chúng.

Khi trí tuệ nhân tạo (AI) chuyển đổi cách thức kiến thức được tạo ra, chia sẻ và tái sử dụng, chúng ta đang ở ngã ba đường sẽ định hình tương lai của việc tiếp cận kiến thức và sáng tạo chung. Một con đường dẫn đến việc khai thác dữ liệu và làm xói mòn tính mở; con đường còn lại dẫn đến một mạng internet bị rào cản bởi các bức tường phí. Tín hiệu CC mang đến một con đường khác, dựa trên các giá trị tinh tế của cộng đồng được tập thể thể hiện.

Dựa trên cùng những nguyên tắc đã tạo nên giấy phép CC và hàng chục tỷ tác phẩm được cấp phép mở trực tuyến, tín hiệu CC sẽ cho phép chủ sở hữu tập dữ liệu thể hiện mong muốn của họ về cách thức máy móc có thể tái sử dụng nội dung của họ dựa trên một tập hợp các tùy chọn hạn chế nhưng có ý nghĩa, được định hình vì lợi ích công cộng. Chúng vừa là một công cụ kỹ thuật, pháp lý, vừa là một đề xuất xã hội: một lời kêu gọi về một khế ước mới giữa những người chia sẻ dữ liệu và những người sử dụng dữ liệu đó để đào tạo các mô hình AI.

"Tín hiệu CC được thiết kế để duy trì sự công bằng trong thời đại AI", Anna Tumadóttir, Giám đốc điều hành của Creative Commons, cho biết. "Cũng giống như giấy phép CC đã giúp xây dựng web mở, chúng tôi tin rằng tín hiệu CC sẽ giúp định hình một hệ sinh thái AI mở dựa trên sự có đi có lại."

Tín hiệu CC nhận ra rằng sự thay đổi đòi hỏi sự phối hợp ở cấp độ hệ thống. Chúng là những công cụ được xây dựng để máy móc và con người có thể đọc được, đồng thời linh hoạt trong các bối cảnh pháp lý, kỹ thuật và chuẩn mực. Tuy nhiên, cốt lõi của tín hiệu CC là huy động sức mạnh của tập thể. Mặc dù các tín hiệu CC có thể khác nhau về khả năng thực thi, ràng buộc pháp lý trong một số trường hợp và mang tính chuẩn mực trong những trường hợp khác, việc áp dụng chúng sẽ luôn mang giá trị đạo đức, khẳng định rằng chúng ta cho đi, chúng ta nhận lại, chúng ta lại cho đi, và tất cả chúng ta cùng nhau vượt qua.

"Nếu chúng ta cam kết hướng tới một tương lai nơi tri thức vẫn còn mở, chúng ta cần cùng nhau kiên trì theo đuổi một hình thức mới của việc cho đi và nhận lại", bà Sarah Hinchliff Pearson, Tổng Cố vấn của Creative Commons, cho biết. "Một sở thích đơn lẻ, được thể hiện một cách riêng biệt, sẽ không quan trọng trong thời đại máy móc. Nhưng cùng nhau, chúng ta có thể yêu cầu một cách khác."

Giờ đây, chúng ta đã sẵn sàng để nhận phản hồi

Thông tin thêm về tín hiệu CC và các quyết định thiết kế ban đầu có sẵn trên trang web CC. Chúng tôi cam kết phát triển tín hiệu CC một cách minh bạch và đồng hành cùng các đối tác và cộng đồng. Chúng tôi đang tích cực tìm kiếm phản hồi và ý kiến đóng góp của cộng đồng trong vài tháng tới khi chúng tôi hướng tới việc ra mắt phiên bản alpha vào tháng 11 năm 2025.

Tham gia

Tham gia thảo luận và chia sẻ phản hồi của bạn

Để đóng góp ý kiến về đề xuất tín hiệu CC hiện tại, hãy truy cập kho lưu trữ tín hiệu CC trên GitHub. Bạn có thể tham gia theo một số cách sau:

  1. Đọc về việc triển khai kỹ thuật tín hiệu CC

  2. Tham gia thảo luận để chia sẻ phản hồi về dự án tín hiệu CC

  3. Gửi vấn đề để được đề xuất chỉnh sửa trực tiếp

Tham dự buổi họp cộng đồng về tín hiệu CC

Chúng tôi mời cộng đồng tham gia để được giải thích ngắn gọn về khung tín hiệu CC, sau đó chúng tôi sẽ mở cửa cho bạn chia sẻ phản hồi và đặt câu hỏi.

Thứ Ba, ngày 15 tháng 7

18–19 giờ UTC

Đăng ký tại đây.

Thứ Ba, ngày 29 tháng 7

13–14 giờ UTC

Đăng ký tại đây.

Thứ Sáu, ngày 15 tháng 8

15–16 giờ UTC

Đăng ký tại đây.

Ủng hộ phong trào

CC là một tổ chức phi lợi nhuận. Hãy giúp chúng tôi xây dựng tín hiệu CC bằng cách quyên góp.

Thời đại AI đòi hỏi những công cụ mới, chuẩn mực mới và hình thức hợp tác mới. Với tín hiệu CC, chúng tôi đang xây dựng một tương lai nơi kiến thức được chia sẻ tiếp tục phát triển mạnh mẽ. Hãy tham gia cùng chúng tôi.

Xem thêm: Từ nội dung của con người đến dữ liệu của máy móc. Giới thiệu tín hiệu CC

Creative Commons (CC) today announces the public kickoff of the CC signals project, a new preference signals framework designed to increase reciprocity and sustain a creative commons in the age of AI. The development of CC signals represents a major step forward in building a more equitable, sustainable AI ecosystem rooted in shared benefits. This step is the culmination of years of consultation and analysis. As we enter this new phase of work, we are actively seeking input from the public.

As artificial intelligence (AI) transforms how knowledge is created, shared, and reused, we are at a fork in the road that will define the future of access to knowledge and shared creativity. One path leads to data extraction and the erosion of openness; the other leads to a walled-off internet guarded by paywalls. CC signals offer another way, grounded in the nuanced values of the commons expressed by the collective.

Based on the same principles that gave rise to the CC licenses and tens of billions of works openly licensed online, CC signals will allow dataset holders to signal their preferences for how their content can be reused by machines based on a set of limited but meaningful options shaped in the public interest. They are both a technical and legal tool and a social proposition: a call for a new pact between those who share data and those who use it to train AI models.

CC signals are designed to sustain the commons in the age of AI,” said Anna Tumadóttir, CEO, Creative Commons. “Just as the CC licenses helped build the open web, we believe CC signals will help shape an open AI ecosystem grounded in reciprocity.”

CC signals recognize that change requires systems-level coordination. They are tools that will be built for machine and human readability, and are flexible across legal, technical, and normative contexts. However, at their core CC signals are anchored in mobilizing the power of the collective. While CC signals may range in enforceability, legally binding in some cases and normative in others, their application will always carry ethical weight that says we give, we take, we give again, and we are all in this together.

If we are committed to a future where knowledge remains open, we need to collectively insist on a new kind of give-and-take,” said Sarah Hinchliff Pearson, General Counsel, Creative Commons. “A single preference, uniquely expressed, is inconsequential in the machine age. But together, we can demand a different way.”

Now Ready for Feedback

More information about CC signals and early design decisions are available on the CC website. We are committed to developing CC signals transparently and alongside our partners and community. We are actively seeking public feedback and input over the next few months as we work toward an alpha launch in November 2025.

Get Involved

Join the discussion & share your feedback

To give feedback on the current CC signals proposal, hop over to the CC signals GitHub repository. You can engage in a few ways:

  1. Read about the technical implementation of CC signals

  2. Join the discussion to share feedback about the CC signals project

  3. Submit an issue for any suggested direct edits

Attend a CC signals town hall

We invite our community to join us for a brief explanation of the CC signals framework, and then we will open the floor to you to share feedback and ask questions.

Tuesday, July 15
6–7 PM UTC
Register here.

Tuesday, July 29
1–2 PM UTC
Register here.

Friday, Aug 15
3–4 PM UTC
Register here.

Support the movement

CC is a nonprofit. Help us build CC signals with a donation.

The age of AI demands new tools, new norms, and new forms of cooperation. With CC signals, we’re building a future where shared knowledge continues to thrive. Join us.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Năm, 25 tháng 9, 2025

AI và tài sản chung: Một danh sách đọc

Distorted Forest Path © của Lone Thomasky & Bits&Bäume được cấp giấy phép CC BY 4.0

AI and the Commons: A Reading List

Posted 03 September 2025 by Jack Hardinges, Rebecca Ross, Sarah Hinchliff Pearson

Theo: https://creativecommons.org/2025/09/03/ai-and-the-commons-a-reading-list/

Bài được đưa lên Internet ngày:

Các mô hình AI lớn đang tác động như thế nào đến tài sản chung (commons) kỹ thuật số và chúng ta nên ứng phó ra sao? Là một phần trong nỗ lực hỗ trợ các nhà sáng tạo và quản lý nội dung thích ứng với tương lai AI đang mở ra, chúng tôi xin chia sẻ một số bài viết và ý tưởng đang định hình tư duy của chúng tôi.

Tại CC, chúng tôi đặt mục tiêu bảo vệ và duy trì tài sản chung kỹ thuật số trước những phát triển của trí tuệ nhân tạo.

Gần đây, chúng tôi đã giới thiệu một khuôn khổ mới, tín hiệu CC (CC signals), nhằm cung cấp một phương thức mới cho những người quản lý các bộ sưu tập nội dung lớn, thể hiện mong muốn của họ về cách máy móc (và con người điều khiển chúng) nên đóng góp trở lại cho các tài sản chung.

Trong quá trình phát triển phương pháp tiếp cận của mình, chúng tôi lấy cảm hứng từ công việc của các đối tác, cộng đồng và các bên liên quan khác. Chúng tôi đặc biệt quan tâm đến những nỗ lực nhằm tìm hiểu:

  • Cách thức các công cụ thu thập dữ liệu AI đang định hình lại web

  • Bản quyền, lao động, giám sát và sự phản kháng

  • Tác động của một nền kinh tế mới về cấp phép dữ liệu

  • Những ý tưởng mới nổi cho AI đạo đức hơn và quản trị dữ liệu đồng thuận

Chúng tôi đang đọc (rất nhiều!) về những chủ đề này, để giúp đảm bảo rằng tín hiệu CC trở thành một phần của bộ giải pháp đa dạng nhằm bảo vệ cộng đồng trong tương lai AI đang phát triển. Dưới đây là một số bài viết đang định hình tư duy của chúng tôi:

Chúng tôi rất mong bạn cùng đọc và học hỏi, chia sẻ suy nghĩ và đóng góp thêm các bài viết và tài nguyên khác vào danh sách này! Hãy kết nối với chúng tôi trên LinkedIn, Bluesky, hoặc Mastodon.

Distorted Forest Path © by Lone Thomasky & Bits&Bäume is licensed under CC BY 4.0

What effect are large AI models having on the digital commons and how should we respond? As part of our work to support creators and stewards of content to adapt to the unfolding AI future, we’re sharing some of the writing and ideas that are shaping our thinking.

Here at CC, we have the goal of defending and sustaining the digital commons in the face of developments in artificial intelligence.

We’ve recently introduced a new framework, CC signals, to offer a new way for stewards of large collections of content to indicate their preferences for how machines (and the humans controlling them) should contribute back to the commons.

As we develop our approach, we’re taking inspiration from the work of our partners, community, and other stakeholders. We’re particularly interested in efforts to understand:

  • How AI scrapers are reshaping the web

  • Copyright, labor, surveillance, and resistance

  • The effects of a new economy of data licensing

  • Emerging ideas for more ethical AI and consensual data governance

We’re reading (a lot!) on these topics, to help ensure that CC signals become part of a diverse set of solutions for protecting the commons in the unfolding AI future. Here’s some of the writing that’s shaping our thinking:

We’d love for you to read and learn alongside us, share your thoughts, and contribute other articles and resources to this list! Connect with us on LinkedIn, Bluesky, or Mastodon.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Tư, 24 tháng 9, 2025

‘Vượt ra ngoài AI & Bản quyền, việc cấp vốn cho một hệ sinh thái thông tin bền vững’ - bản dịch sang tiếng Việt


Là bản dịch sang tiếng Việt tài liệu của Open Future, xuất bản tháng 6/2025 với giấy phép CC BY 4.0 Quốc tế.

Sách trắng này khám phá tác động của việc triển khai ngày càng tăng Trí tuệ Nhân tạo - AI (Artificial Intelligence) trong môi trường thông tin số đối với tính bền vững của việc sản xuất thông tin của con người.

Sau hơn hai năm trong kỷ nguyên AI tạo sinh, một số thách thức và cơ hội ở cấp độ vĩ mô do công nghệ phát triển nhanh chóng này đặt ra đang bắt đầu trở nên rõ ràng hơn. Trong bối cảnh này, "vĩ mô" đề cập đến các khía cạnh cấu trúc và xã hội về tác động của AI - đánh dấu sự chuyển dịch khỏi những mối quan tâm ở cấp độ cá nhân vốn đã chi phối phần lớn các diễn ngôn công khai.

Mặc dù các cuộc tranh luận thường tập trung vào việc liệu AI có thay thế lao động sáng tạo hay không, liệu cá nhân có nên được phép từ chối sử dụng dữ liệu hay không, hay liệu tự động hóa có dẫn đến tình trạng thất nghiệp tràn lan hay không, bài báo này lại có một cách tiếp cận khác. Tác giả cố tình gạt sang một bên những lo ngại mang tính suy đoán, chẳng hạn như rủi ro hiện sinh - điều mà ông rất hoài nghi - và những tác động rộng hơn đến nhân quyền. Điều này không phải vì chúng không quan trọng, mà vì chúng nằm ngoài phạm vi phân tích này.

Thay vào đó, bài báo này tập trung vào tác động của AI tạo sinh - đặc biệt là các mô hình nền tảng - đối với hệ sinh thái và nền kinh tế thông tin (kỹ thuật số). Các lập luận được trình bày trong bài báo này chủ yếu liên quan đến Mô hình Ngôn ngữ Lớn – LLM (Large Language Model) và các phương pháp tiếp cận liên quan, vốn đang chi phối phần lớn các cuộc thảo luận về chính sách AI và tác động của AI đối với xã hội.

Cụ thể, bài báo đặt câu hỏi: Sự chuyển đổi này có ý nghĩa gì đối với cách chúng ta cấu trúc quyền truy cập thông tin? Và nó ảnh hưởng như thế nào đến tính bền vững lâu dài của việc sản xuất thông tin trong một xã hội phụ thuộc vào một kho kiến thức chung lành mạnh, đa dạng và dễ tiếp cận? Trong khuôn khổ này, bài báo sẽ trình bày bốn điểm chính:

Thứ nhất, tác động của các mô hình AI đối với cách con người sản xuất, truy cập và tiêu thụ thông tin vẫn còn bị đánh giá thấp, đặc biệt là khi nói đến việc kiểm soát thông tin (khía cạnh chính sách thông tin) và việc thương mại hóa kho kiến thức chung (khía cạnh bền vững kinh tế).

Thứ hai, nhu cầu cấp thiết và thiết yếu về các mô hình và cơ sở hạ tầng AI công cộng - tức là các mô hình và cơ sở hạ tầng AI được triển khai thông qua nguồn tài trợ công và được quản lý vì lợi ích công cộng.

Thứ ba, để hiểu được tác động của AI đối với việc sản xuất thông tin bền vững, cần phải có sự hiểu biết rộng về hệ sinh thái thông tin - một hệ sinh thái bao gồm nhiều chủ thể đóng góp vào nguồn lực chung kỹ thuật số.

Thứ tư, việc đảm bảo tính bền vững kinh tế đòi hỏi các cơ chế phân phối lại vượt ra ngoài luật bản quyền - cụ thể là một hệ thống thuế được kích hoạt khi các dịch vụ AI thương mại được triển khai, chuyển doanh thu trở lại cho tất cả những người đóng góp vào nguồn lực chung thông tin.

Tự do tải về bản dịch sang tiếng Việt của tài liệu có 25 trang tại địa chỉ: https://www.dropbox.com/scl/fi/9g5epz6q4udieaqv8scm3/250630_Beyond-AI-and-copyright-funding-a-sustainable-information-ecosystem_Vi-16092025.pdf?rlkey=sj8sah44yf8f0xr3oeqkigbe1&st=ytdpv7gf&dl=0

Xem thêm:

Blogger: Lê Trung Nghĩa

letrungnghia.foss@gmail.com