Thứ Năm, 4 tháng 12, 2025

“Có” với các khoản phí dịch vụ minh bạch, “Không” với các khoản phí yêu cầu các tác giả phải trả để thực thi các quyền của họ


Yes” to Transparent Service Fees, “No” to Fees That Charge Authors to Exercise Their Rights

22/10/2025

Theo: https://www-coalition--s-org.translate.goog/blog/yes-to-transparent-service-fees-no-to-fees-that-charge-authors-to-exercise-their-rights/?_x_tr_sl=en&_x_tr_tl=vi&_x_tr_hl=vi&_x_tr_pto=tc

Bài được đưa lên Internet ngày: 22/10/2025

Viện Kỹ sư Điện và Điện tử (IEEE) và Hiệp hội Hóa học Hoa Kỳ (ACS) đã đưa ra các loại phí mới nhắm vào các tác giả thực hiện quyền tự lưu trữ bản thảo đã được chấp nhận theo giấy phép CC BY. Liên minh S phản đối các khoản phí này vì chúng phạt các tác giả tuân thủ chính sách truy cập mở.

Bài đăng trên blog này của Bodo Stern (Trưởng phòng Sáng kiến Chiến lược tại Viện Y khoa Howard Hughes) và Rachel Bruce (Trưởng phòng Chiến lược Nghiên cứu Mở, Cơ quan Nghiên cứu và Đổi mới Vương quốc Anh) đề xuất một giải pháp thay thế: thay thế các khoản phí vi phạm các quyền này bằng một mô hình minh bạch, dựa trên dịch vụ. Liệu mô hình tính phí theo dịch vụ như vậy cho các dịch vụ thẩm định có phải là một hướng đi tốt hơn không?

Chúng ta hãy bắt đầu cuộc trò chuyện.

Đầu năm nay, Viện Kỹ sư Điện và Điện tử (IEEE) đã giới thiệu Phí Giấy phép Kho lưu trữ mới, thu phí tác giả khi thực hiện một hình thức truy cập mở "xanh" bằng cách tự lưu trữ các bản thảo đã được tác giả chấp nhận theo giấy phép mở (CC BY). Năm 2023, Hiệp hội Hóa học Hoa Kỳ (ACS) đã áp dụng một khoản phí tương tự gọi là Phí Phát triển Bài báo . Cả hai khoản phí này đều nhằm mục đích cung cấp một lộ trình tuân thủ thay thế cho các tác giả có nhà tài trợ yêu cầu truy cập mở theo giấy phép CC BY. Lộ trình truyền thống - truy cập mở "vàng" - yêu cầu tác giả phải trả phí xử lý bài báo (APC) để được xuất bản truy cập mở trên tạp chí.

ACS và IEEE biện minh cho những khoản phí mới này là bao gồm những gì ACS gọi là "dịch vụ tiền chấp nhận", bao gồm quản lý bình duyệt ngang hàng, hỗ trợ phát triển bản thảo và thực hiện các kiểm tra chất lượng khác. Dưới đây, chúng tôi sử dụng một thuật ngữ trung lập hơn, dịch vụ thẩm định, không ngụ ý xác nhận hay giám tuyển.

Các khoản phí mới là phản ứng với một thực tế đang ngày càng gia tăng: các nhà tài trợ và các tổ chức thúc đẩy truy cập mở đang nhấn mạnh vào quyền của tác giả trong việc chia sẻ bản thảo đã được chấp nhận của họ một cách công khai và ngay lập tức trên các kho lưu trữ. Ví dụ, chiến lược duy trì quyền của cOAlition S đảm bảo quyền của các tác giả được cOAlition S tài trợ để tự lưu trữ bản thảo theo giấy phép CC BY trong các kho lưu trữ được chỉ định để tuân thủ chính sách truy cập mở của cOAlition S, Kế hoạch S. Vì việc gửi kho lưu trữ là miễn phí đối với các tác giả, về nguyên tắc, họ có thể thực hiện các nhiệm vụ truy cập mở mà không phải trả APC. Đối mặt với sự thay đổi này, có vẻ như ACS và IEEE đã quyết định rằng nếu họ không thể ngăn chặn các tác giả chia sẻ hợp pháp bản thảo, thì ít nhất họ có thể tính phí cho việc đó.

Các khoản phí này không được xây dựng để chi trả cho một dịch vụ hợp pháp mà là hình phạt đối với các tác giả có ý định thực hiện quyền mà họ đã có.”

Nhiều người khác đã nêu rõ lý do tại sao những khoản phí này lại gây ra vấn đề và tại sao các nhà tài trợ và tổ chức khó có thể chi trả chúng (xem blog cOAlition Sblog COAR ). Về bản chất, vấn đề rất đơn giản: những khoản phí này không được xây dựng để chi trả cho một dịch vụ hợp pháp—chúng là một hình phạt đối với các tác giả có ý định thực hiện quyền mà họ đã có.

Biến một ý tưởng tồi thành một ý tưởng hay

Việc coi quyền sở hữu của tác giả như một khoản mục phải thanh toán là một cơ hội bị bỏ lỡ. Một mô hình thu phí dịch vụ cho dịch vụ thẩm định được thiết kế chu đáo và minh bạch thể là một giải pháp thay thế khả thi và thậm chí là sáng tạo - miễn là nó được áp dụng một cách công bằng thay vì chọn lọc và không tìm cách khai thác các quyền mà tác giả đã sở hữu.

Hãy lấy bình duyệt ngang hàng làm ví dụ. Cả ACS và IEEE đều coi đây là một dịch vụ được trả công thấp khi tác giả chọn đăng bản thảo đã được tác giả chấp nhận với giấy phép CC BY. Nếu bình duyệt ngang hàng được cung cấp như một dịch vụ thẩm định độc lập, nó có thể được tài trợ theo cách có nguyên tắc và toàn diện hơn mà không ảnh hưởng đến truy cập mở xanh. Nhưng để điều này hoạt động, mọi tác giả sử dụng dịch vụ phải được đối xử bình đẳng—phí không thể được áp dụng một cách chọn lọc chỉ cho những người sau đó chọn gửi bản thảo của họ vào kho lưu trữ.

Mô hình thu phí dịch vụ cũng đòi hỏi trách nhiệm giải trình. Việc chỉ ra bản thảo đã được tác giả chấp nhận hoặc một phiên bản hồ sơ lưu trữ làm bằng chứng cho quá trình bình duyệt là không đủ - đây là những dấu hiệu gián tiếp và thường không rõ ràng của quá trình. Thay vào đó, kết quả thực tế của quá trình bình duyệt - báo cáo của người bình duyệt và phản hồi của tác giả - nên được coi là hồ sơ công khai về dịch vụ được cung cấp. Những tài liệu này cung cấp bằng chứng trực tiếp nhất về cả công sức bỏ ra lẫn giá trị gia tăng về học thuật.

Không phải tất cả các dịch vụ thẩm định đều yêu cầu mức độ minh bạch này. Ví dụ, phản hồi và đánh giá diễn ra trước khi bản thảo được công bố rộng rãi - chẳng hạn như trước khi xuất hiện trên máy chủ bản thảo trước xuất bản (Preprint Server) - có thể được giữ bí mật. Tuy nhiên, bình duyệt ngang hàng có tổ chức đóng một vai trò riêng biệt: nó làm nổi bật các diễn ngôn học thuật xung quanh một bài báo - bao gồm cả bình luận phê bình và các quan điểm khác biệt - vốn là một phần của nền tảng tri thức hỗ trợ cho các nghiên cứu sâu hơn. Để hỗ trợ học thuật tích lũy và minh bạch, bình duyệt ngang hàng nên được trình bày rõ ràng và có thể trích dẫn, cùng với công trình mà nó đánh giá.

Mô hình thu phí dịch vụ sẽ cho phép các tạp chí nhận được khoản bồi thường hợp lý cho các dịch vụ thẩm định, đồng thời cho phép tác giả đáp ứng các yêu cầu truy cập mở thông qua việc tự lưu trữ trên các kho lưu trữ.”

Mô hình thu phí dịch vụ cung cấp một giải pháp thiết thực cho sự căng thẳng dài lâu giữa truy cập mở xanh và kinh tế tạp chí truyền thống. Nó cho phép các tạp chí nhận được thù lao xứng đáng cho các dịch vụ thẩm định—chẳng hạn như điều phối bình duyệt—đồng thời cho phép tác giả đáp ứng các yêu cầu truy cập mở thông qua việc tự lưu trữ trên các kho lưu trữ.

Ai nên trả tiền?

Mô hình thu phí dịch vụ này tách biệt hai chức năng cốt lõi mà các mô hình kinh doanh hiện tại gộp chung lại: thẩm định mà tác giả đối mặtgiám tuyển người đọc đối mặt . Vì thẩm định do tác giả khởi xướng, nên việc họ hoặc tổ chức của họ chi trả chi phí là hợp lý, trong khi độc giả tài trợ cho việc giám tuyển, ví dụ thông qua tường phí đăng ký. Sự sắp xếp này cải thiện các APC và tường phí hiện nay theo một số cách: Phí thẩm định, gắn liền với việc thực hiện dịch vụ thay vì chấp nhận bản thảo, sẽ thấp hơn và ít gây xung đột hơn so với APC. APC bị thổi phồng vì các tác giả được chấp nhận thực hiện việc trợ cấp chéo cho các bài nộp bị từ chối và chúng dễ gây xung đột vì các tác giả trả tiền cho sự xác nhận có chọn lọc mà họ có quyền lợi cố hữu. Trong khi đó, tường phí trong mô hình này sẽ chỉ áp dụng cho nội dung tạp chí, trong khi truy cập mở xanh đảm bảo rằng nghiên cứu được bình duyệt ngang hàng vẫn có sẵn miễn phí trong các kho lưu trữ.

Tuy nhiên, bất kỳ hệ thống nào mà tác giả hoặc độc giả phải chịu chi phí trực tiếp đều có nguy cơ làm gia tăng bất bình đẳng - dù là bằng cách áp đặt các rào cản "trả tiền để chơi" đối với các nhà nghiên cứu thiếu kinh phí hay hạn chế quyền truy cập của độc giả vào nội dung được giám tuyển. Việc chuyển sang tài trợ tập thể hoặc tài trợ theo tổ chức có thể giảm thiểu những rủi ro này, đồng thời duy trì cả sự công bằng và minh bạch trong quá trình thẩm định và giám tuyển.

Chúng ta phải nói 'không' với các khoản phí cơ hội gây bất lợi cho tác giả khi khẳng định quyền của họ—và nói 'có' với các khoản phí dịch vụ công bằng, minh bạch và có thể xác minh được”

Để đẩy nhanh quá trình chuyển đổi sang quyền truy cập mở đầy đủ và công bằng, chúng ta phải nói "không" với các khoản phí cơ hội gây bất lợi cho tác giả khi khẳng định quyền của họ—và nói "có" với các khoản phí dịch vụ công bằng, minh bạch và có thể xác minh được, phản ánh giá trị thực mà các nhà xuất bản cung cấp.

“Có” với Phí Dịch vụ Minh bạch, “Không” với Phí Yêu cầu Tác giả Thực hiện các Quyền của Họ Chia sẻ trên X

Bài viết liên quan

Bodo Stern

Bodo Stern là Trưởng phòng Sáng kiến Chiến lược tại Viện Y khoa Howard Hughes (HHMI). Ông làm việc trực tiếp với chủ tịch và đội ngũ điều hành cấp cao của HHMI để xây dựng và thực hiện các sáng kiến và định hướng chiến lược của tổ chức, tập trung vào việc tăng cường đầu tư của HHMI vào nghiên cứu và giáo dục khoa học. Bodo cũng chịu trách nhiệm về các hoạt động hợp tác từ thiện của Viện nhằm thúc đẩy khoa học. Trước đây, ông từng là giám đốc phát triển và chiến lược của HHMI. Trước khi gia nhập HHMI, Bodo đã có tám năm làm giám đốc nghiên cứu tại Trung tâm Sinh học Hệ thống Harvard, nơi ông giúp quản lý Chương trình Bauer Fellows, một sáng kiến độc đáo mang đến cho các nhà khoa học trẻ cơ hội điều hành các nhóm nghiên cứu độc lập. Ông cũng từng là biên tập viên khoa học cấp cao tại Cell. Bodo có bằng Tiến sĩ về hóa sinh tại University College, London và bằng Thạc sĩ về hóa sinh tại Đại học Tübingen, Đức. Nghiên cứu chính của ông khám phá cách các tế bào sửa lỗi nhiễm sắc thể trong quá trình phân chia tế bào.

Xem tất cả các bài viết của Bodo Stern

Rachel Bruce

Rachel Bruce là Trưởng bộ phận Chiến lược Nghiên cứu Mở tại UKRI (UKRI). Bà làm việc trực tiếp với đội ngũ điều hành UKRI để lãnh đạo và định hình các chính sách và đầu tư cho nghiên cứu mở trên toàn UKRI và toàn Vương quốc Anh, nhằm thúc đẩy nghiên cứu tốt hơn và có tác động hơn. Rachel đã làm việc trong lĩnh vực chính sách giáo dục và nghiên cứu, tập trung vào học bổng kỹ thuật số và phát triển cơ sở hạ tầng, tại nhiều tổ chức quốc gia, bao gồm Hội đồng Tài trợ Giáo dục Đại học (trước đây là Jisc) và Bộ Năng lượng Doanh nghiệp và Chiến lược Công nghiệp (BEIS). Bà đã chỉ đạo các chương trình quốc gia và quốc tế hỗ trợ sáng tạo, tiếp cận và tác động đến tri thức, nhiều chương trình trong số đó đã mang lại các dịch vụ bền vững lâu dài. Bà là một nhà khoa học thông tin, chuyên gia về khoa học mở và từng là cố vấn cho Ủy ban Châu Âu. Rachel hiện là đại diện của Vương quốc Anh trong Ban Chỉ đạo Đám mây Khoa học Mở Châu Âu.

Xem tất cả các bài viết của Rachel Bruce

The Institute of Electrical and Electronics Engineers (IEEE) and the American Chemical Society (ACS) have introduced new fees targeting authors who exercise their right to self-archive accepted manuscripts under a CC BY license. cOAlition S opposes these charges because they penalize authors for complying with open access policies. 

This blog post by Bodo Stern (Chief of Strategic Initiatives at the Howard Hughes Medical Institute) and Rachel Bruce (Head of Open Research Strategy, UK Research and Innovation) proposes an alternative: replace these rights-infringing fees with a transparent, service-based model. Would such a fee-for-service model for appraisal services be a better way forward?

Let’s open the conversation.

Earlier this year, the Institute of Electrical and Electronics Engineers (IEEE) introduced a new Repository License Fee, which charges authors for practicing a form of ‘green’ open access by self-archiving their author accepted manuscripts with an open license (CC BY). In 2023, the American Chemical Society (ACS) implemented a similar charge called the Article Development Charge. Both fees purport to offer an alternative compliance path for authors whose funders require open access under a CC BY license. The traditional path – ‘gold’ open access – requires authors to pay an article processing charge (APC) for open access publication in the journal.

ACS and IEEE justify these new charges as covering what ACS calls “pre-acceptance services”, which include managing peer review, supporting manuscript development, and performing other quality checks. Below, we use a more neutral term, appraisal services, which implies neither endorsement nor curation.

The new fees are a response to a growing reality: funders and institutions that promote open access are emphasizing authors’ rights to share their accepted manuscripts openly and immediately on repositories. The cOAlition S rights retention strategy, for example, secures the rights of cOAlition S-funded authors to self-archive manuscripts under a CC BY license in designated repositories to comply with the open access policy of cOAlition S, Plan S. Since repository deposition is cost-free for authors, they can, in principle, fulfill open access mandates without paying APCs. Faced with this shift, it seems ACS and IEEE have decided that if they can’t stop authors from legally sharing manuscripts, they can at least charge them for doing so.

These fees are not structured to cover a legitimate service—they are a penalty for authors who intend to exercise a right they already have.”

Others have already laid out why these fees are problematic and why funders and institutions are unlikely to cover them (see cOAlition S blog and COAR blog). In essence, the issue is simple: these fees are not structured to cover a legitimate service—they are a penalty for authors who intend to exercise a right they already have.

Turning a Bad Idea into a Good One

Treating an author’s inherent right as a billable item is a missed opportunity. A thoughtfully designed and transparent fee-for-service model for appraisal services could offer a viable and even innovative alternative—provided it is applied equitably rather than selectively and does not seek to exploit rights authors already possess.

Let’s take peer review as an example. Both ACS and IEEE cite it as an undercompensated service when authors choose to post an author accepted manuscript with a CC BY license. If peer review were offered as a standalone appraisal service, it could be funded in a more principled and inclusive way that does not interfere with green open access. But for this to work, every author who uses the service must be treated equally—fees cannot be selectively applied only to those who later choose to deposit their manuscripts in repositories.

A fee-for-service model also demands accountability. Pointing to an author accepted manuscript or a version of record as evidence of peer review is insufficient—these are indirect and often opaque markers of the process. Instead, the actual outputs of peer review—the reviewer reports and author responses—should serve as the public record of the service provided. These documents offer the most direct evidence of both the labor involved and the scholarly value added.

Not all appraisal services demand this level of transparency. For example, feedback and assessments that take place before a manuscript’s public debut—say, before it appears on a preprint server—can reasonably remain confidential. But organized peer review occupies a distinct role: it surfaces scholarly discourse around an article—including critical commentary and divergent views—which are part of the intellectual scaffolding that supports further inquiry. To support cumulative, transparent scholarship, peer review should be visible and citable, alongside the work it evaluates.

A fee-for-service model would enable journals to receive fair compensation for appraisal services while allowing authors to meet open access mandates through self-archiving on repositories.”

A fee-for-service model offers a practical solution to the long-standing tension between green open access and traditional journal economics. It enables journals to receive fair compensation for appraisal services—such as coordinating peer review—while allowing authors to meet open access mandates through self-archiving on repositories.

Who Should Pay?

This fee-for-service model disentangles two core functions that current business models conflate: author-facing appraisal and reader-facing curation. Because appraisal is initiated by authors, it is reasonable for them or their institutions to cover its cost, while readers fund curation, for example through subscription paywalls. This arrangement improves on today’s APCs and paywalls in several ways: Appraisal fees, tied to service execution rather than manuscript acceptance, would be lower and less conflict-prone than APCs. APCs are inflated because accepted authors cross-subsidize rejected submissions, and they are conflict-prone since authors pay for a selective endorsement in which they have a vested interest. Meanwhile, paywalls in this model would apply only to journal content, while green open access ensures that peer-reviewed research remains freely available in repositories.

Nonetheless, any system in which authors or readers bear direct costs risks perpetuating inequities—whether by imposing pay-to-play barriers on underfunded researchers or restricting reader access to curated content. Moving toward collective or institutional funding could mitigate these risks while sustaining both fairness and openness in appraisal and curation.

We must say ‘no’ to opportunistic fees that penalize authors for asserting their rights—and ‘yes’ to fair, transparent, and verifiable service fees”

To accelerate the shift to full and equitable open access, we must say ‘no’ to opportunistic fees that penalize authors for asserting their rights—and ‘yes’ to fair, transparent, and verifiable service fees that reflect the real value publishers provide.

“Yes” to Transparent Service Fees, “No” to Fees That Charge Authors to Exercise Their Rights Share on X

Related articles

Bodo Stern

Bodo Stern is the Chief of Strategic Initiatives at Howard Hughes Medical Institute (HHMI). He works directly with HHMI’s president and senior executive team to formulate and execute the organization’s strategic initiatives and direction, with emphasis on enhancing HHMI’s investment in research and science education. Bodo is also responsible for the Institute’s philanthropic collaborations to advance science. He previously served as HHMI’s chief development and strategy officer. Before joining HHMI, Bodo served for eight years as director of research affairs at the Harvard Center for Systems Biology, where he helped to manage the Bauer Fellows Program, a unique initiative that gives young scientists the opportunity to run independent research groups. He also has worked as a senior scientific editor at Cell. Bodo earned a PhD in biochemistry from University College, London, and an MA in biochemistry from the University of Tübingen, in Germany. His primary research explored how cells correct chromosome errors during cell division.

Rachel Bruce

Rachel Bruce is Head of Open Research Strategy at UK Research and Innovation (UKRI). She works directly with the UKRI executive team to lead and shape policies and investments for open research across UKRI and the wider UK to promote better and more impactful research. Rachel has worked in education and research policy, with a focus on digital scholarship and infrastructure development, across national organisations, including the former Higher Education Funding Council, Jisc and the Department of Business Energy and Industrial Strategy (BEIS). She has directed national and international programmes that support knowledge creation, access, and impact, many of which have resulted in long-term sustainable services. She is an information scientist and expert in open science and has been an adviser to the European Commission. Rachel is currently the UK representative on the European Open Science Cloud Steering Board.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Tư, 3 tháng 12, 2025

Người sáng tạo sẽ sớm có khả năng yêu cầu thanh toán để sử dụng cho việc đào tạo AI

Creators Will Soon Be Able to Demand Payment for AI Training Use

Written by Fiona Jackson , Jun 27, 2025

Theo: https://www.eweek.com/news/creative-commons-signals/

Bài được đưa lên Internet ngày: 27/06/2025

Image: iStock/stefanamer

Creative Commons, tổ chức phi lợi nhuận đứng sau các giấy phép mở được sử dụng rộng rãi nhất thế giới, đã phát triển một khuôn khổ mới cho phép người sáng tạo bày tỏ rõ ràng rằng họ không đồng ý cho tác phẩm của mình được sử dụng để đào tạo các mô hình trí tuệ nhân tạo.

Được gọi là tín hiệu CC (CC Signals), hệ thống này cho phép chủ sở hữu nội dung đính kèm siêu dữ liệu có thể đọc được bằng máy đối với các tác phẩm kỹ thuật số của họ, thể hiện mong muốn của họ cho việc sử dụng lại của AI. Họ có thể chọn "Có", tức là họ đồng ý cho phép sử dụng tác phẩm trong đào tạo, hoặc "Không", tức là họ không đồng ý, và sau đó thêm một trong bốn điều kiện để sử dụng:

  • Công trạng (Credit): Phải ghi nhận công lao phù hợp.

  • Đóng góp trực tiếp (Direct Contribution): Phải cung cấp hỗ trợ tài chính cho chủ sở hữu tác phẩm.

  • Đóng góp cho hệ sinh thái (Ecosystem Contribution): Phải cung cấp hỗ trợ tài chính cho hệ sinh thái mà AI đang được hưởng lợi thông qua việc sử dụng tác phẩm làm dữ liệu đào tạo.

  • Mở (Open): Hệ thống AI được sử dụng phải là hệ thống mở.

Phải cung cấp sự ghi nhận công trạng cho chủ sở hữu tác phẩm với cả bốn tín hiệu. Tín hiệu này cũng có thể chỉ ra phạm vi sử dụng AI mà nhãn áp dụng, chẳng hạn như khai thác văn bản và dữ liệu, đào tạo AI tạo sinh hoặc suy luận AI.

Các nhà phát triển AI, người thu thập dữ liệu (scraper) hoặc người tổng hợp dữ liệu có thể quét nội dung để tìm tín hiệu CC bằng các phương pháp được chuẩn hóa, chẳng hạn như tiêu đề HTTP và siêu dữ liệu. Những phương pháp này không thay thế các giấy phép bản quyền như CC-BY hoặc CC0 mà được thêm vào.

Các tín hiệu CC hiện không có hiệu lực thi hành mà hoạt động như các dấu hiệu xã hội và đạo đức, tương tự như giấy phép CC. Creative Commons cho biết trong một bài đăng trên blog rằng khuôn khổ này cung cấp một giải pháp thay thế cho sự bùng nổ đào tạo AI, ngoài việc "trích xuất dữ liệu và làm xói mòn tính mở" hoặc "một mạng Internet bị ngăn cách bởi các bức tường phí".

"Nếu chúng ta cam kết hướng tới một tương lai nơi kiến thức vẫn mở, chúng ta cần cùng nhau kiên trì với một hình thức cho và nhận mới", Sarah Hinchliff Pearson, cố vấn chung của Creative Commons, cho biết trong blog. "Một sở thích riêng lẻ, được thể hiện một cách độc đáo, sẽ không quan trọng trong thời đại máy móc. Nhưng cùng nhau, chúng ta có thể yêu cầu một cách khác."

Creative Commons cho biết các tín hiệu CC là kết quả của "nhiều năm tham vấn và phân tích", nhưng vẫn đang tìm kiếm phản hồi từ công chúng trong vài tháng tới. Hy vọng có thể chính thức ra mắt khuôn khổ này vào tháng 11.

Các nhà sáng tạo và các công ty AI đang tranh cãi về cách tiếp cận dữ liệu đào tạo

Sự xuất hiện của AI trong vài năm qua đã chứng kiến sự đối đầu giữa ngành công nghệ và sáng tạo. Các công ty công nghệ muốn các mô hình AI của họ hữu ích nhất có thể, điều này đồng nghĩa với việc cung cấp cho chúng một lượng lớn dữ liệu mới do con người tạo ra. Họ cũng đang chạy đua để đổi mới và vượt qua các đối thủ cạnh tranh, dù biết là việc xin phép hoặc trả tiền cho người sáng tạo có thể làm chậm họ lại và làm giảm lợi nhuận.

Trong khi đó, những người sáng tạo, vốn e ngại việc cung cấp các công cụ có thể cạnh tranh với họ, vẫn nhìn thấy tiềm năng được đền bù xứng đáng và đóng góp vào các mô hình có thể thúc đẩy tiến bộ có ý nghĩa trong các lĩnh vực như y tế và giáo dục.

Các cuộc chiến pháp lý và tranh luận về bản quyền đang diễn ra trên khắp trên thế giới khi tòa án và các nhà lập pháp vật lộn để tìm cách giải quyết mâu thuẫn cơ bản này giữa đổi mới và quyền sáng tạo. Anthropic, Meta, Perplexity, Stability AI, Midjourney, và OpenAI (rất, rất, rất nhiều lần) nằm trong số các nhà phát triển AI đã phải đối mặt với các hành động pháp lý từ các nghệ sĩ, hãng tin và nhạc sĩ vì sử dụng tác phẩm của họ mà không có sự đồng ý. Công ty khởi nghiệp của Sam Altman đã ký một số thỏa thuận cấp phép với các nhà xuất bản để tránh rắc rối thêm.

Các nền tảng trực tuyến đang cố gắng kiểm soát ở cấp độ cá nhân

Một số nền tảng đã thực hiện các thay đổi đối với cơ sở hạ tầng kỹ thuật và chính sách của họ để kiểm soát chặt chẽ hơn việc thu thập dữ liệu AI từ nội dung của người dùng. X đã thay đổi chính sách bảo mật vào đầu tháng này để không cho phép sử dụng nội dung X để "tinh chỉnh hoặc đào tạo một mô hình nền tảng hoặc mô hình cận biên".

Reddit đã cập nhật các tệp robots.txt của mình vào năm ngoái để chặn các bot và trình thu thập dữ liệu AI trái phép, đồng thời vẫn tiếp tục cho phép các tác nhân có thiện chí như các nhà nghiên cứu và Internet Archive truy cập. Tháng này, Reddit đã kiện Anthropic vì liên tục thu thập dữ liệu diễn đàn của mình mà không được phép.

Công ty an ninh mạng Cloudflare đã ra mắt các công cụ được thiết kế để phá vỡ trình thu thập dữ liệu web AI và cho phép chủ sở hữu trang web xem và kiểm soát tần suất các mô hình AI sử dụng nội dung trang web của họ. Giám đốc điều hành Matthew Prince đã chỉ trích tình trạng hiện tại của Internet, nơi người đọc phải đối mặt với các bức tường phí và quảng cáo xâm nhập, trong khi các trình thu thập dữ liệu AI được sử dụng nội dung miễn phí. Ông hy vọng sẽ đảo ngược mô hình này bằng cách ra mắt một thị trường Cloudflare, nơi chủ sở hữu trang web có thể bán quyền truy cập vào nội dung của họ để đào tạo AI. Bạn muốn biết các trang web đang phản đối việc thu thập dữ liệu AI như thế nào? Đọc thêm trên eWeek về phong trào ngày càng phát triển nhằm ngăn chặn các bot đào tạo.

Fiona Jackson

Fiona Jackson là một cây bút tin tức, bắt đầu sự nghiệp báo chí tại hãng thông tấn SWNS, sau đó làm việc tại MailOnline, một công ty quảng cáo, và TechnologyAdvice. Công việc của cô trải dài từ mảng quan tâm đến con người đến đưa tin về công nghệ tiêu dùng, và xuất hiện trên các phương tiện truyền thông nổi tiếng như TechHQ, The Independent, Daily Mail và The Sun.

Creative Commons, the nonprofit behind the world’s most widely used open licenses, has developed a new framework that allows creators to clearly express that they do not consent to their work being used to train artificial intelligence models.

Known as CC signals, the system enables content owners to attach machine-readable metadata to their digital works, signalling their preferences for AI reuse. They can either indicate “Yes,” they are happy for it to be used in training, or “No,” they are not, and then add one of four conditions for use:

  • Credit: Appropriate credit must be given.

  • Direct Contribution: Monetary support must be provided to the work owner.

  • Ecosystem Contribution: Monetary support must be provided to the ecosystem that the AI is benefiting from through the use of the work as training data.

  • Open: The AI system used must be open.

Credit must be provided to the work owner with all four signals. The signal can also indicate the scope of AI usage the labels apply to, such as text and data mining, generative AI training, or AI inference.

AI developers, scrapers, or dataset aggregators can scan content for CC signals using standardised methods, like HTTP headers and metadata. These do not replace copyright licenses such as CC-BY or CC0 but are layered on top.

The CC signals are not currently enforceable but act more as social and ethical markers, similar to CC licenses. Creative Commons said in a blog post that the framework provides an alternative response to the proliferation of AI training other than “data extraction and the erosion of openness” or “a walled-off internet guarded by paywalls.”

“If we are committed to a future where knowledge remains open, we need to collectively insist on a new kind of give-and-take,” Sarah Hinchliff Pearson, general counsel, Creative Commons, said in the blog. “A single preference, uniquely expressed, is inconsequential in the machine age. But together, we can demand a different way.”

Creative Commons said that CC signals are the result of “years of consultation and analysis,” but it is still seeking public feedback over the next few months. It hopes to formally launch the framework in November.

Creators and AI companies at war over training data approaches

The emergence of AI over the past few years has seen the tech and creative industries butt heads. Tech companies want their AI models to be as useful as possible, which means feeding them vast amounts of fresh, human-created data. They’re also racing to innovate and outpace competitors, knowing that asking permission or paying creators could slow them down and cut into profits.

Meanwhile, creators, wary of powering tools that may eventually compete with them, still see potential in being fairly compensated and in contributing to models that could drive meaningful progress in fields like medicine and education.

Legal battles and copyright debates are unfolding around the world as courts and lawmakers grapple with how to resolve this fundamental tension between innovation and creative rights. Anthropic, Meta, Perplexity, Stability AI, Midjourney, and OpenAI (many, many, many times) are among the AI developers that have faced legal action from the likes of artists, news outlets, and musicians for using their work without consent. Sam Altman’s startup has signed a number of licensing deals with publishers to avoid further trouble.

Online platforms are trying to take control at an individual level

A number of platforms have made changes to their technical infrastructure and policies to gain more control over AI data scraping of their users’ content. X changed its privacy policy earlier this month to disallow the use of X content to “fine-tune or train a foundation or frontier model.”

Reddit updated its robots.txt files last year to block unauthorised AI bots and crawlers, while continuing to allow access for good-faith actors like researchers and the Internet Archive. It sued Anthropic this month for repeatedly crawling its forums without permission.

Cybersecurity company Cloudflare has launched tools designed to disrupt AI web crawlers and let website owners see and control how often AI models use their site’s content. CEO Matthew Prince has criticised the current state of the internet, where human readers face paywalls and intrusive ads, while AI scrapers get to consume content for free. He hopes to turn this model on its head by launching a Cloudflare marketplace where website owners can sell access to their content for AI training. Want to know how websites are pushing back against AI scraping? Read more on eWeek about the growing movement to block training bots.

Fiona Jackson is a news writer who started her journalism career at SWNS press agency, later working at MailOnline, an advertising agency, and TechnologyAdvice. Her work spans human interest and consumer tech reporting, appearing in prominent media outlets such as TechHQ, The Independent, Daily Mail, and The Sun.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com


Thứ Ba, 2 tháng 12, 2025

Chúng tôi hỏi, các bạn trả lời: Phản hồi của của bạn định hình Tín hiệu CC như thế nào

We Asked, You Answered: How Your Feedback Shapes CC Signals

By Rebecca Ross; Posted 27 August 2025


Signals © 2021 by Hugo Parasol is licensed under CC BY-NC-SA 2.0

Theo: https://creativecommons.org/2025/08/27/we-asked-you-answered-how-your-feedback-shapes-cc-signals/

Bài được đưa lên Internet ngày: 27/08/2025

Vào tháng 6, chúng tôi đã khởi động giai đoạn phản hồi công khai về đề xuất của mình cho Tín hiệu CC (CC Signals). Tín hiệu CC là một khuôn khổ tín hiệu ưu tiên được thiết kế để duy trì sự công bằng và đảm bảo việc chia sẻ kiến thức liên tục trong thời đại AI.

Mục tiêu là cung cấp cho những người nắm giữ các tập dữ liệu lớn một cách để thiết lập các tiêu chí về cách dữ liệu của họ có thể được sử dụng trong các mô hình đào tạo AI. Ví dụ, người nắm giữ tập dữ liệu có thể muốn yêu cầu bất kỳ khóa đào tạo AI nào sử dụng dữ liệu của họ phải ghi rõ nguồn gốc (ví dụ: thừa nhận ghi công tác giả), hoặc mô hình AI kết quả phải là mô hình mở. Giống như giấy phép CC, tín hiệu CC được xây dựng dựa trên ý tưởng "giữ lại một số quyền" (Some Rights Reserved) và người sáng tạo và người nắm giữ kiến thức xứng đáng có những lựa chọn có ý nghĩa về cách sử dụng tác phẩm của họ. Bạn có thể tìm hiểu thêm trên trang web của chúng tôi.

Kể từ sự kiện khởi động, chúng tôi đã lắng nghe rất kỹ các phản hồi. Chúng tôi đã nhận được phản hồi từ hàng trăm người sáng tạo, thủ thư, chuyên gia công nghệ, chuyên gia pháp lý và những người ủng hộ mở. Chúng tôi đã yêu cầu phản hồi và các bạn đã đáp ứng! Tiếng nói của các bạn - ủng hộ, hoài nghi, thất vọng hoặc tò mò - đều rất quan trọng trong việc định hình cách phát triển tín hiệu CC. Chúng tôi muốn tóm tắt những gì chúng tôi đã nghe và cách thức phản hồi này được tiếp thu và giải quyết.

Những gì chúng tôi đã nghe

Trong các cuộc trò chuyện, một số chủ đề đã nổi lên:

Lo ngại rằng CC đang ưu tiên các công ty AI hơn người sáng tạo. Một mối lo ngại thường trực là các tín hiệu CC dường như tạo ra sự hợp pháp cho việc đào tạo AI mà không làm đủ để bảo vệ người sáng tạo.

Sự nhầm lẫn và bất đồng về giấy phép CC và đào tạo AI. Chúng tôi đã nghe thấy sự thất vọng rằng các giấy phép CC không được diễn giải hoặc thực thi theo cách mà một số người sáng tạo mong đợi.

Những lời kêu gọi mạnh mẽ về việc từ chối. Nhiều người thắc mắc tại sao bản dự thảo tín hiệu CC không bao gồm tùy chọn từ chối.

Việc lịch sự yêu cầu các nhà phát triển AI bồi hoàn để đổi lấy bộ dữ liệu là không đủ. Chúng tôi đã nghe thấy những nghi ngờ về tính hiệu quả của tín hiệu CC trong thực tế, do có nhiều bằng chứng cho thấy các công ty AI phớt lờ bản quyền, giấy phép và thậm chí cả các giao thức kỹ thuật như robots.txt.

Phê bình rộng rãi hơn về vai trò của AI trong xã hội. Có nhiều quan điểm khác nhau về AI trong cộng đồng CC. Nhiều người trong số các bạn kiên quyết đứng về phía chống AI. Đối với những tiếng nói này, không có khuôn khổ kỹ thuật nào, chẳng hạn như tín hiệu CC, có vẻ phù hợp nếu không có luật pháp và quy định chặt chẽ hơn.

Chúng tôi chưa rõ công cụ này dành cho ai và các trường hợp sử dụng mà nó nhắm đến. Đương nhiên, nhu cầu của một cá nhân sáng tạo, chẳng hạn như một nghệ sĩ, khá khác biệt so với những người hoạt động ở cấp độ tổ chức hoặc tập thể. Chúng tôi đã lắng nghe rất rõ ràng rằng các tín hiệu CC, theo quan niệm hiện tại, không đáp ứng được nhu cầu đa dạng của từng cá nhân sáng tạo.

Yêu cầu làm rõ. Nhiều người đã yêu cầu thêm chi tiết về việc triển khai và tính tương hợp, bao gồm cả tầm nhìn dài hạn của chúng tôi về các tín hiệu CC như một phần trong sứ mệnh rộng lớn hơn của chúng tôi.

Chúng tôi hiểu những vấn đề này mang tính cá nhân sâu sắc đến mức nào đối với nhiều người trong số các bạn, đặc biệt là các nghệ sĩ và nhà sáng tạo, những người cảm thấy tác phẩm của mình bị sử dụng mà không có sự đồng ý và đang tìm cách phản kháng. Sự thất vọng đó là có thật, và chúng tôi rất coi trọng điều đó.

Những việc chúng tôi sẽ làm tiếp theo

✔️Cải thiện sự rõ ràng về lập trường của CC. Chúng tôi biết nhiều bạn lo lắng rằng CC đã "chọn phe" hoặc đang bị các công ty AI tác động. Chúng tôi muốn làm rõ: động lực thúc đẩy các tín hiệu CC là bảo vệ và duy trì cộng đồng bằng cách phát triển các công cụ thiết thực cho những người nắm giữ kiến thức. Trong tương lai, chúng tôi sẽ hướng tới việc làm rõ các nguyên tắc chỉ đạo và lập trường của mình theo cách chuyển thành các quyết định về sản phẩm.

✔️Tăng cường truyền thông và giáo dục. Chúng tôi cam kết mở rộng nguồn lực về cách thức tương tác giữa giấy phép CC và tín hiệu CC, các ví dụ về cách thức hoạt động của tín hiệu trong thực tế và đào tạo sâu hơn về các vấn đề bản quyền trong bối cảnh AI. Nếu bạn chưa xem, hãy xem qua tài liệu pháp lý của chúng tôi về việc tìm hiểu giấy phép CC và đào tạo AI. Cộng đồng CC càng hiểu biết sâu sắc hơn về AI và tài sản chung (commons), chúng ta càng có thể bảo vệ tài sản chung một cách hiệu quả hơn với tư cách là một cộng đồng.

✔️Làm rõ các trường hợp sử dụng tín hiệu CC. Giai đoạn này của tín hiệu CC được thiết kế để phục vụ những người nắm giữ tập dữ liệu lớn và mở, chứ không phải người sáng tạo cá nhân. Phản hồi của bạn đã giúp chúng tôi nhận ra rằng trọng tâm này không dễ dàng phù hợp với quyết định tận dụng các giao thức kỹ thuật được sử dụng bởi bất kỳ ai có trang web. Do đó, đối tượng mục tiêu của tín hiệu CC không rõ ràng. Khi quyết định các bước tiếp theo trong quá trình phát triển sản phẩm, chúng tôi dự định tập trung vào các trường hợp sử dụng cụ thể để đưa các mục tiêu và mục đích của mình vào thực tiễn.

✔️ Tăng cường sự tham gia toàn cầu và mời các bên liên quan tham gia phát triển sản phẩm. Chúng tôi dự định tiếp tục thảo luận với nhiều đối tượng khác nhau để định hình tương lai của tín hiệu CC thông qua một quy trình lặp đi lặp lại. Phần còn lại của năm nay sẽ tập trung vào việc khám phá và thử nghiệm việc tích hợp tín hiệu CC khả thi với những người dùng thử nghiệm. Từ đó, chúng tôi hy vọng sẽ suy rộng các phát hiện khi khám phá việc áp dụng rộng rãi hơn các tín hiệu CC trong tương lai.

✔️ Duy trì tính minh bạch trong quá trình phát triển. Kho lưu trữ GitHub của chúng tôi sẽ luôn mở và được cập nhật. Chúng tôi đang tạo ra một lộ trình sẽ được chia sẻ công khai và sẽ cung cấp các bản cập nhật nhất quán (trên blog hoặc thông qua tòa thị chính ảo) về tiến trình của chúng tôi. Vòng phản hồi này vẫn chưa kết thúc; nó sẽ được tích hợp vào cách tín hiệu CC sẽ phát triển.

Nhìn về phía trước

Tương lai của tài sản chung phụ thuộc vào các công cụ phản ánh các giá trị chung về tính mở, sự công bằng và tính chủ động. Chúng tôi biết nhiều người trong số các bạn vẫn còn hoài nghi.

Tín hiệu CC chưa phải là kết thúc. Đây là một thử nghiệm trong việc xây dựng một lớp lựa chọn mới trong thời đại mà các quy tắc đang thay đổi nhanh chóng. Chúng tôi sẽ tiếp tục lắng nghe, điều chỉnh và hợp tác cho đến khi đạt được một điều gì đó thực sự phục vụ cho các tài sản chung.

Cảm ơn tất cả mọi người đã dành thời gian viết bài, đặt câu hỏi, thách thức và hỗ trợ chúng tôi. Xin hãy tiếp tục tham gia. Cùng nhau, chúng ta có thể đảm bảo rằng Creative Commons tiếp tục giữ vững vị thế của nó: vì cộng đồng, vì các tài sản chung.

In June we kicked off a public feedback period on our proposal for CC signals. CC signals is a preference signals framework designed to sustain the commons and ensure the continued sharing of knowledge in the age of AI.

The goal is to give holders of large datasets a way to set criteria for how their data may be used within AI training models. To give an example, a dataset holder may wish to require that any AI training that uses their data gives credit back to the original source (e.g. attribution), or that the resulting AI model is open. Like the CC licenses, CC signals builds on the idea of ‘some rights reserved’ and that creators and knowledge holders deserve meaningful choices in how their work is used. You can learn more on our website.

Since our kickoff event, we have been listening closely to feedback. We heard from hundreds of creators, librarians, technologists, legal experts, and open advocates. We asked for feedback and you delivered! Your voices – supportive, skeptical, frustrated, or curious – are essential in shaping how CC signals develops. We’d like to summarize what we heard and how this feedback is being incorporated and addressed.

What We Heard

Across the conversations, several themes emerged:

Concerns that CC is prioritizing AI companies over creators. A recurring concern is that CC signals seem to give legitimacy to AI training without doing enough to protect creators.

Confusion and disagreement about the CC licenses and AI training. We heard frustration that the CC licenses are not being interpreted or enforced in ways that some creators expected.

Strong calls for opt-outs. Many wondered why the draft CC signals did not include an opt-out option.

Asking politely for AI developers to give back in exchange for datasets is not enough. We heard doubts that CC signals would work in practice, given the widespread evidence of AI companies ignoring copyright, licenses, and even technical protocols like robots.txt.

Broader critique of AI’s role in society. There is a spectrum of views on AI across the CC community. Many of you stand firmly at the anti-AI end. For these voices, no technical framework, like CC signals, feels adequate without stronger laws and regulations.

We haven’t been clear on who this tool is meant to serve and the use cases it is meant to address. Naturally, the needs of an individual creator, like an artist, are quite different from those operating at an institutional or collective level. We heard loud and clear that CC signals, as currently conceived, does not meet the diverse needs of individual creators.

Requests for clarity. Many asked for more details about implementation and interoperability, including our long-term vision for CC signals as part of our broader mission.

We understand how deeply personal these issues are for many of you, especially artists and creators who feel their work is being taken without consent and are looking for ways to fight back. That frustration is real, and we take it seriously.

What We’re Doing Next

✔️Improving clarity around CC’s position. We know many of you are worried that CC has “taken sides” or is being influenced by AI companies. We want to be clear: the driving motivation of CC signals is to defend and sustain the commons by developing practical tools for knowledge holders. Going forward, we will aim to clarify our guiding principles and positions in ways that translate to product decisions.

✔️Strengthening messaging and education. We are committed to expanding resources on how the CC licenses and CC signals could interact, examples of how signals could work in practice, and deeper dives into questions of copyright within the AI landscape. If you haven’t already, take a look at our legal primer on understanding the CC licenses and AI training. The better informed the CC community is about AI and the commons at large, the more effective we can be as a community to defend the commons.

✔️Clarifying the use cases for CC signals. This phase of CC signals is designed to serve large and open dataset holders, not the individual creator. Your feedback helped us recognize that this focus was not easy to square with our decision to leverage technical protocols used by anyone with a website. As a result, the target audience for CC signals was not clear. As we decide on next steps in product development, we plan to focus on specific use cases to put our goals and objectives into practice.

✔️Deepening global engagement and inviting stakeholders into product development. We plan to continue conversations with diverse audiences to inform the future of CC signals through an iterative process. The rest of this year will be focused on exploring and testing possible integrations of CC signals with pilot adopters. From this, we hope to extrapolate findings as we explore wider adoption of CC signals in the future.

✔️ Maintaining transparency in development. Our GitHub repository will stay open and up to date. We are creating a roadmap that will be shared publicly and will provide consistent updates (either on the blog or via a virtual town hall) on our progress. This feedback loop is not over; it will be built into how CC signals will evolve.

Looking Ahead

The future of the commons depends on tools that reflect shared values of openness, fairness, and agency. We know many of you remain skeptical.

CC signals is not final. It is an experiment in building a new layer of choice in an age where the rules are rapidly shifting. We will keep listening, adjusting, and collaborating until we arrive at something that genuinely serves the commons.

Thank you to everyone who took the time to write, question, challenge, and support us. Please stay engaged. Together, we can ensure that Creative Commons continues to stand where it always has: with the community, for the commons.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Chủ Nhật, 30 tháng 11, 2025

Hội thảo ‘Cập nhật phong trào Mở tại Việt Nam từ góc nhìn nghiên cứu và thực hành’ do GO-GN ASIA PACIFIC tổ chức tại Hà Nội ngày 1/12/2025 Hà Nội



Ngày 1/12/2025, Mạng Tài nguyên Giáo dục Mở Toàn cầu, khu vực châu Á - Thái bình dương dành cho các sinh viên tốt nghiệp - GO-GN ASIA PACIFIC (Global OER Graduate Network - Asia Pacific Hub), Đại học KHXHNV – ĐHQG Hà Nội đã tổ chức hội thảo tại Hà Nội với chủ đề ‘Cập nhật phong trào Mở tại Việt Nam từ góc nhìn nghiên cứu và thực hành’.








Trong thời gian cả ngày hội thảo, các diễn giả tham dự hội thảo từ nhiều trường đại học khắp cả nước đã trình bày các tham luận về nghiên cứu và thực hành trên nhiều khía cạnh của phong trào Mở ở Việt Nam như Giáo dục Mở, Tài nguyên Giáo dục Mở, Nghiên cứu Mở, AI (Nguồn) Mở, Cấp phép Mở, Xuất bản Truy cập Mở, Sư phạm Mở, Dữ liệu Mở, Phần mềm Nguồn Mở. Hội thảo cũng đã dành nhiều thời gian thảo luận về những điểm mạnh, yếu, cơ hội và thách thức của việc triển khai các hoạt động nghiên cứu và thực hành Tài nguyên Giáo dục Mở tại các cơ sở giáo dục trong bối cảnh chính sách về Tài nguyên Giáo dục Mở đã được Chính phủ ban hành; cũng như vai trò của GO-GN ASIA PACIFIC là gì trong việc hỗ trợ các giáo viên và nhà nghiên cứu tại các cơ sở giáo dục của họ để tăng cường cho việc nghiên cứu và thực hành Mở nói chung, Tài nguyên Giáo dục Mở nói riêng. Những người tham dự cũng thảo luận về một vài ưu tiên quan trọng nhất cho cộng đồng hướng tới các bước hành động tiếp theo trong vài năm tới.

X (Tweet): https://x.com/nghiafoss/status/1995400391186645221

Xem thêm:

Blogger: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Năm, 27 tháng 11, 2025

Hội thảo ‘Xây dựng nhà trường số dựa trên nền tảng năng lực số và ứng dụng công nghệ 4.0, AI’ tại Trường Cao đẳng Điện Biên, 28/11/2025


Hiệp hội các trường Cao đẳng Nghề nghiệp Ngoài công lập Việt Nam - Văn phòng đại diện tại thành phố Hồ Chí Minh; Viện nghiên cứu, Đào tạo và Phát triển tài nguyên giáo dục mở (InOER) và Google For Education Việt Nam tổ chức Tọa đàm ‘Xây dựng nhà trường số dựa trên nền tảng năng lực số và ứng dụng công nghệ 4.0, AI’ trong ngày 28/11/2025 tại Trường Cao đẳng Công nghệ - Năng lượng Khánh Hòa.



Tải về các bài trình chiếu tại Hội thảo:

X (Tweet): https://x.com/nghiafoss/status/1994244366433472664

Xem thêm:

Blogger: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Thứ Tư, 26 tháng 11, 2025

Hướng dẫn kỹ thuật lời nhắc. Soạn thảo lời nhắc hiệu quả cho LLM


Crafting Effective Prompts for LLMs

Theo: https://www.promptingguide.ai/guides/optimizing-prompts


Video: What makes a good prompt? (Prompting Tips)

Mô hình Ngôn ngữ Lớn (LLM) cung cấp sức mạnh to lớn cho nhiều tác vụ khác nhau, nhưng hiệu quả của chúng phụ thuộc vào chất lượng của các lời nhắc. Bài viết trên blog này tóm tắt các khía cạnh quan trọng của việc thiết kế lời nhắc hiệu quả để tối đa hóa hiệu suất LLM.

Những cân nhắc chính khi thiết kế lời nhắc

Tính cụ thể và rõ ràng: Cũng giống như việc hướng dẫn con người, lời nhắc cần nêu rõ kết quả mong muốn. Sự mơ hồ có thể dẫn đến kết quả đầu ra không mong muốn hoặc không liên quan.

Đầu vào và đầu ra có cấu trúc: Việc cấu trúc đầu vào bằng các định dạng như JSON hoặc XML có thể cải thiện đáng kể khả năng hiểu và xử lý thông tin của LLM. Tương tự, việc chỉ định định dạng đầu ra mong muốn (ví dụ: danh sách, đoạn văn hoặc đoạn mã) sẽ cải thiện tính liên quan của phản hồi.

Dấu phân cách cho Cấu trúc Nâng cao: Việc sử dụng các ký tự đặc biệt làm dấu phân cách trong lời nhắc có thể làm rõ hơn cấu trúc và phân tách các thành phần khác nhau, cải thiện khả năng hiểu của mô hình.

Phân tích Nhiệm vụ cho các Hoạt động Phức tạp: Thay vì trình bày LLM với một lời nhắc duy nhất bao gồm nhiều nhiệm vụ, việc chia nhỏ các quy trình phức tạp thành các nhiệm vụ con đơn giản hơn sẽ cải thiện đáng kể tính rõ ràng và hiệu suất. Điều này cho phép mô hình tập trung vào từng nhiệm vụ con riêng lẻ, cuối cùng dẫn đến kết quả tổng thể chính xác hơn.

Các Chiến lược Lời nhắc Nâng cao

Lời nhắc vài lần (Few-Shot Prompting): Cung cấp cho LLM một vài ví dụ về các cặp đầu vào-đầu ra mong muốn sẽ hướng dẫn nó tạo ra các phản hồi chất lượng cao hơn bằng cách chứng minh mô hình dự kiến. Tìm hiểu thêm về gợi ý vài lần tại đây.

Lời nhắc theo Chuỗi tư duy (Chain-of-Thought Prompting): Khuyến khích mô hình "suy nghĩ từng bước" bằng cách gợi ý rõ ràng để chia nhỏ các nhiệm vụ phức tạp thành các bước suy luận trung gian giúp nâng cao khả năng giải quyết các vấn đề đòi hỏi suy luận logic. Tìm hiểu thêm về lời nhắc theo chuỗi tư duy tại đây.

Lời nhắc Tái hành động: ReAct (Suy luận + Hành động): Phương pháp này tập trung vào việc khơi gợi suy luận nâng cao, lập kế hoạch và thậm chí cả việc sử dụng công cụ từ LLM. Bằng cách cấu trúc các lời nhắc để khuyến khích những khả năng này, các nhà phát triển có thể mở khóa các ứng dụng tinh vi và mạnh mẽ hơn. Tìm hiểu thêm về ReAct tại đây.

Kết luận

Thiết kế lời nhắc hiệu quả là yếu tố then chốt để khai thác tối đa tiềm năng của LLM. Bằng cách tuân thủ các phương pháp hay nhất như tính cụ thể, định dạng có cấu trúc, phân tích nhiệm vụ và tận dụng các kỹ thuật tiên tiến như lời nhắc ít lần, chuỗi tư duy và ReAct, các nhà phát triển có thể cải thiện đáng kể chất lượng, độ chính xác và độ phức tạp của kết quả đầu ra được tạo ra bởi các LLM mạnh mẽ này.

Về mục lục ………. Phần trước

Large Language Models (LLMs) offer immense power for various tasks, but their effectiveness hinges on the quality of the prompts. This blog post summarize important aspects of designing effective prompts to maximize LLM performance.

Key Considerations for Prompt Design

Specificity and Clarity: Just like giving instructions to a human, prompts should clearly articulate the desired outcome. Ambiguity can lead to unexpected or irrelevant outputs.

Structured Inputs and Outputs: Structuring inputs using formats like JSON or XML can significantly enhance an LLM's ability to understand and process information. Similarly, specifying the desired output format (e.g., a list, paragraph, or code snippet) improves response relevance.

Delimiters for Enhanced Structure: Utilizing special characters as delimiters within prompts can further clarify the structure and segregate different elements, improving the model's understanding.

Task Decomposition for Complex Operations: Instead of presenting LLMs with a monolithic prompt encompassing multiple tasks, breaking down complex processes into simpler subtasks significantly improves clarity and performance. This allows the model to focus on each subtask individually, ultimately leading to a more accurate overall outcome.

Advanced Prompting Strategies

Few-Shot Prompting: Providing the LLM with a few examples of desired input-output pairs guides it towards generating higher-quality responses by demonstrating the expected pattern. Learn more about few-shot prompting here.

Chain-of-Thought Prompting: Encouraging the model to "think step-by-step" by explicitly prompting it to break down complex tasks into intermediate reasoning steps enhances its ability to solve problems that require logical deduction. Learn more about chain-of-thought prompting here.

ReAct (Reason + Act): This method focuses on eliciting advanced reasoning, planning, and even tool use from the LLM. By structuring prompts to encourage these capabilities, developers can unlock more sophisticated and powerful applications. Learn more about ReAct here.

Conclusion

Effective prompt design is crucial for harnessing the full potential of LLMs. By adhering to best practices like specificity, structured formatting, task decomposition, and leveraging advanced techniques like few-shot, chain-of-thought, and ReAct prompting, developers can significantly improve the quality, accuracy, and complexity of outputs generated by these powerful LLMs.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com