Reuser's Guide to Open Data Licensing
Thực
tế bạn có thể nắm giữ vài thông tin không nhất thiết
ngụ ý bạn có thể làm bất kỳ điều gì bạn muốn với
nó. Bạn cần có sự cho phép từ chủ sở hữu thông tin
đó để làm những gì bạn muốn làm. Một giấy
phép
nói cho bạn những gì bạn có thể làm.
Nhưng
cấp phép cho dữ liệu ngụ ý gì? Các yêu cầu nào một
giấy phép có thể đặt ra cho bạn? Các giấy phép khác
nhau nào cho các nhà
xuất bản để sử
dụng? Làm thế nào bạn có thể tìm ra giấy
phép đang được gắn
vào một
tập hợp
dữ liệu là sẵn sàng. Chỉ dẫn này trả lời cho
các câu hỏi đó.
Lưu
ý: Chỉ dẫn này tập trung vào dữ liệu được các tổ
chức có trụ sở ở Vương quốc Anh xuất bản. Luật cấp
phép là khác nhau ở các quốc gia khác nhau, vì thế vài
thông tin này có thể không áp dụng được cho bạn nếu
bạn đang sử dụng lại thông tin được xuất bản ở
đâu đó khác. Nó không đề cập tới các cân nhắc pháp
lý tiềm tàng khác, như sự tuân thủ với Luật Bảo vệ
Dữ liệu (Data Protection Act).
Cấp
phép là gì?
Khi
ai đó đặt sự quan tâm và suy nghĩ vào việc tạo ra thứ
gì đó, như viết bài trên blog hoặc chụp ảnh, họ sở
hữu tác phẩm đó. Điều này ngụ ý họ có quyền xác
định cách nó được sử dụng.
Nếu
bạn muốn sử dụng nội dung hoặc dữ liệu, bạn hoặc
phải hiểu
rõ họ không còn có các quyền đối với tác phẩm đó
(vì họ đã từ bỏ chúng), hoặc hỏi sự cho phép của
họ để sử dụng nó. Các
giấy
phép
là cách họ rõ ràng trao cho
bạn sự cho phép để sử dụng tác phẩm của họ.
Các
nhà xuất bản sở hữu cái gì?
Ở
châu Âu, có 2 dạng quyền mà các nhà
xuất bản - các tổ chức hoặc cá nhân làm cho nội
dung hoặc dữ liệu sẵn sàng - được trao cho các tác
phẩm họ đã tạo ra:
-
họ có bản quyền (copyright) đối với các tác phẩm (nội dung – content) họ tạo ra và nó là bản gốc đối với họ, như văn bản họ viết hoặc các ảnh họ chụp
-
họ có quyền cơ sở dữ liệu (database right) đối với các bộ sưu tập dữ liệu (data) họ đã có nỗ lực đáng kể để có, thẩm định hoặc trình bày
Lưu
ý: Theo chúng tôi biết quyền cơ sở dữ liệu là độc
nhất với Liên minh châu Âu. Ở một số quốc gia có lẽ
không có sự bảo vệ cho các bộ sưu tập dữ liệu.
Nếu
ai đó áp dụng phán xét gốc trong việc đặt ra một cơ
sở dữ liệu, ví dụ trong việc chọn các
hạng mục nào để đưa vào trong cơ
sở dữ liệu đó hoặc
thông tin nào về chúng để đưa vào, thì họ có bản
quyền đối với cơ
sở dữ liệu đó, vì
nó là tác phẩm sáng tạo.
Ví
dụ, nếu ai đó đã xây dựng một cơ
sở dữ liệu về 100 chiếc ô tô tốt nhất,
thì điều này có thể có liên quan:
-
việc chọn các ô tô nào được tính như là các ô tô tốt nhất
-
viết mô tả về từng ô tô
-
nghiên cứu và thu thập các số liệu về chúng
Họ
muốn có bản quyền đối với cơ
sở dữ liệu đó, vì họ chọn các ô tô nào
là “tốt nhất”. Họ muốn có bản quyền đối với
các mô tả, vì họ đã viết chúng. Và họ có lẽ muốn
có quyền cơ
sở dữ liệu cho cơ
sở dữ liệu họ
đã xây dựng, vì họ đã nỗ lực trong việc thu thập
thông tin về chúng. Quan trọng, họ không sở hữu các số
liệu về các ô tô - bạn
hoặc bất
kỳ ai khác cũng có thể xây dựng cơ
sở dữ liệu của riêng bạn gồm chính xác
các số liệu đó mà không vi phạm quyền cơ
sở dữ liệu của
họ - nhưng không ai khác có thể sử dụng lại
cơ
sở dữ liệu của
họ hoặc các mô tả của họ mà không có sự
cho phép của họ vì họ sở hữu bản quyền đối với
chúng.
Các
nhà xuất
bản có
lẽ không có quyền cơ
sở dữ liệu nếu
họ
tạo
ra các
số liệu trong một cơ
sở dữ liệu,
ngược
lại với việc thu thập chúng từ đâu đó khác, trừ phi
họ
có nỗ lực đáng kể trong việc thẩm định hoặc trình
bày cơ
sở dữ liệu đó. Ví
dụ, nếu ai đó sở hữu một nhà hàng và tạo ra một cơ
sở dữ liệu các
món ăn họ
chào và khi họ
chào chúng, họ
có lẽ không có quyền cơ
sở dữ liệu đối với
cơ
sở dữ liệu đó, dù họ
có lẽ có bản quyền vì
phán xét có tính sáng tạo có liên quan trong việc nhận
diện các món ăn nào cần phải được chào vào những
ngày đặc biệt để cung cấp thực đơn cân xứng.
Thế
còn dữ liệu từ các bên thứ 3?
Các
nhà
xuất bản có thể không sở hữu tất cả nội
dung hoặc dữ liệu bản thân họ xuất bản. Đặc biệt,
thay vì tự bản thân họ tạo nội dung hoặc thu thập dữ
liệu, vài trong số các nội dung và dữ liệu họ xuất
bản có thể:
-
hoàn toàn được họ cấp phép từ ai đó khác
-
bao gồm sự trích xuất nội dung hoặc dữ liệu họ đã cấp phép từ ai đó khác
-
được dẫn xuất từ nội dung hoặc dữ liệu họ đã cấp phép từ ai đó khác
Khi
họ xuất
bản dữ liệu, nhà
xuất bản cần nói cho bạn về nội dung hoặc dữ
liệu nào được tổ chức khác sở hữu, và theo giấy
phép nào nó đang được xuất bản lại.
Thế
còn về nhãn hiệu thì sao?
Các
nhãn hiệu thường được bảo vệ thông qua thương hiệu
(trade
mark). Thương hiệu hạn chế cách thức bạn có
thể sử dụng logo của một tổ chức hoặc tên công ty.
Họ cũng sẽ có bản
quyền về logo đó.
Các
giấy phép cho nội dung hoặc dữ liệu thường loại trừ
rõ ràng các logo và các tên công ty, nên bạn không thể,
ví dụ, tùy
biến thích nghi logo bằng việc thay đổi màu sắc
được sử dụng với nó .Bạn cũng không thể sử dụng
tên công ty hoặc logo để mượn danh cho sản phẩm của
bạn mà không có sự cho phép làm như vậy. Tuy
nhiên, các
yêu cầu ghi công
của giấy
phép có thể đòi hỏi bạn
sử dụng tên và logo công ty để chỉ định bạn đã sử
dụng lại dữ liệu được công ty đó sở hữu.
Những
gì bạn không thể làm?
Có
ít điều bạn có thể làm với nội dung hoặc dữ liệu
mà không cần giấy phép, nhưng nói chung bạn cần được
nhà xuất bản
trao giấy phép nếu bạn muốn sử dụng lại nội
dung hoặc dữ liệu của họ. Việc có sự truy cập tới
vài nội dung hoặc dữ liệu - ví dụ bằng việc tải nó
về từ website của nhà
xuất bản - không trao cho bạn quyền để sử dụng
lại nó.
Xuất
bản lại và gia tăng giá trị
Bạn
không tự nhiên có quyền xuất bản lại, một cách toàn
bộ, nội dung hoặc dữ liệu ai đó khác sở hữu, thậm
chí nếu họ trao cho bạn giấy phép để sử dụng nó cho
một mình bạn. Bạn cần kiểm tra các điều khoản của
giấy phép về nội dung hoặc dữ liệu để chắc chắn
bạn có thể xuất bản lại nó.
Điều
y hệt áp dụng nếu bạn đang gia
tăng giá trị cho nội dung hoặc dữ liệu đó, ví dụ
bằng việc tự động thêm các đường liên kết hoặc
kiểu cho nội dung, hoặc thêm các cột với thông tin bổ
sung trong một tập hợp dữ liệu. Nội
dung hoặc dữ liệu mới gồm toàn bộ nội dung hoặc dữ
liệu của ai đó khác, nên bạn không thể xuất bản nó
trừ phi bạn có được sự cho phép của họ.
Xuất
bản các trích đoạn
Bạn
có quyền xuất
bản các trích đoạn nội dung hoặc các cơ
sở dữ liệu bạn có sự truy cập tới, bất
kể giấy phép nói gì, miễn là trích đoạn đó là không
“đáng kể”. Tuy nhiên, thường khó để nói liệu trích
đoạn bạn đã làm ra có là “đáng kể” hay không.
Giấy
phép bạn được trao có thể cho phép bạn tái xuất bản
bất kỳ lượng nội dung hoặc dữ liệu nào (các giấy
phép mở làm điều này). Nếu không, bạn cần có tư vấn
pháp lý về việc liệu các trích đoạn bạn muốn xuất
bản có khả năng được coi là đáng kể hay không.
Xuất
bản nội dung hoặc dữ liệu phái sinh (dẫn xuất)
Bạn
có thể muốn tạo ra nội dung hoặc các cơ
sở dữ liệu mới bằng việc tùy
biến thích nghi, hoặc xử lý vài nội dung hoặc dữ
liệu. Để làm điều đó, trước hết bạn phải chắc
chắn bạn được trao giấy phép để sử dụng dữ liệu
đó. Sau đó bạn cần xem giấy phép nói gì về việc tạo
ra các tác phẩm phái sinh.
Ví
dụ, bạn nói đã được trao giấy phép để sử dụng
một ảnh chụp trên website của bạn. Bạn có thể tạo
phiên bản mới của ảnh chụp đó bằng việc thay đổi
nó từ có màu sang đen trắng, hoặc bằng việc thêm lời
chú cho nó.
Trong
trường hợp này, ảnh chụp đó là tác phẩm có
tính sáng tạo, và
người chụp nó sở hữu bản
quyền. Vì
ảnh chụp đó được bản
quyền bảo vệ,
bạn chỉ có thể tạo ra các ảnh mới nếu giấy phép
theo đó bạn sử dụng ảnh cho phép bạn làm thế.
Bản
quyền có thể tồn tại trong các mẩu nhỏ nội dung, như
các mệnh đề. Ví dụ, nếu bạn phân tích vài nội dung
để tạo ra cơ
sở dữ liệu mới, bạn nên chắc chắn bạn
có quyền sử dụng lại bất kỳ mẩu nội dung nào bạn
có thể giữ trong cơ
sở dữ liệu mới. Nếu nội dung đó gồm
trình bày dữ liệu từ một cơ
sở dữ liệu, bạn phải xem cả các quyền cơ
sở dữ liệu nữa: việc lấy dữ liệu từ
trang đó có thể tương đương với việc tạo ra một
trích đoạn.
Các
quyền cơ
sở dữ liệu là khá khác nhau, vì chúng thỉ
mở rộng cho việc tạo các trích đoạn hoặc sử dụng
lại (xuất bản lại) cơ
sở dữ liệu.
Ví
dụ, bạn đã phân tích dữ liệu về các đơn thuốc từng
thứ thuốc trong từng thực hành GP ở Vương
quốc Anh, cùng với dữ liệu khác về bảo hiểm
của từng thực hành, để tạo ra tập hợp dữ liệu mới
cung cấp chi tiêu trung bình mỗi bệnh nhân của từng thực
hành. Miễn là bạn đã không có các bổn phận hợp đồng
riêng rẽ nào đối với các chủ sở hữu của 2 tập hợp
dữ liệu bạn đã mang theo, bạn có thể tự do để làm
những gì bạn muốn với kết quả đó, vì có lẽ không
thể xây dựng lại các cơ
sở dữ liệu gốc ban đầu từ các dữ liệu
được tổng hợp.
Các
giấy phép nói gì?
Các
giấy phép nói cho bạn những gì bạn có thể làm
với nội dung hoặc dữ liệu bạn truy cập. Một giấy
phép sẽ nói cho bạn liệu bạn có thể:
-
xuất bản lại nội dung hoặc dữ liệu lên website của riêng bạn
-
dẫn xuất nội dung hoặc dữ liệu mới từ nó
-
kiếm tiền bằng việc bán các sản phẩm sử dụng nó
-
xuất bản lại nó trong khi vẫn lấy phí truy cập
Nhiều
giấy phép sẽ cho phép bạn truy cập nội dung hoặc dữ
liệu miễn phí, nhưng nói rằng bạn không thể tái xuất
bản nó hoặc tùy
biến thích nghi nó, hoặc sử dụng nó trong các sản
phẩm thương mại. Nếu bạn vi phạm các điều khoản của
giấy phép đó, chủ sở hữu nội dung hoặc dữ liệu đó
có thể kiện bạn ra tòa.
Các
giấy phép mở nói gì?
Giấy
phép mở là giấy phép đặt
ra rất ít hạn chế về những gì bạn có thể làm với
nội dung hoặc dữ liệu đang được cấp phép.
-
là bạn phải thừa nhận ghi công (attribution) cho nguồn nội dung hoặc dữ liệu
-
là bạn phải xuất bản bất kỳ nội dung hoặc dữ liệu phái sinh nào theo giấy phép y hệt (điều này được gọi là chia sẻ tương tự – share-alike)
Một
giấy phép mở có thể hoặc làm 1 trong 2 điều trên hoặc
cả 2. Vì thế, bạn có thể gặp nội dung hoặc dữ liệu
sẵn sàng theo 1 trong 3 mức giấy phép:
-
giấy phép phạm vi công cộng (public domain) không có các hạn chế hoàn toàn (về kỹ thuật, chúng chỉ ra rằng người sở hữu các quyền đã từ bỏ các quyền của họ đối với nội dung hoặc dữ liệu)
-
giấy phép ghi công (attribution) chỉ nó là bạn phải thừa nhận ghi công cho nhà xuất bản
-
giấy phép ghi công & chia sẻ tương tự (attribution & share-alike) nói bạn phải thừa nhận ghi công và chia sẻ bất kỳ nội dung hoặc dữ liệu phái sinh nào theo giấy phép y hệt
Bạn
đưa ra sự ghi công như thế nào?
Bạn
cần đưa ra sự ghi đông thậm chí nếu giấy
phép không đòi hỏi điều đó .Việc thừa nhận
ghi công là cách thừa nhận cả những nỗ lực nhà
xuất bản đã làm
để đưa ra cùng nội dung hoặc dữ liệu bạn đang sử
dụng lại, và sự hào phóng của họ trong việc làm
cho nó sẵn sàng để sử dụng lại.
Khi
nội dung hoặc dữ liệu được cấp phép bằng việc sử
dụng giấy phép bao gồm sự ghi công, nhà
xuất bản có thể chỉ định:
-
ngôn từ để thừa nhận ghi công
-
nơi và cách ghi công nên được trình bày
Bạn
cần tuân theo những gì nhà
xuất bản yêu cầu
bạn làm. Nếu nó không là thực hành được, ví dụ nếu
bạn đang cung cấp dịch vụ không có chỗ cho tuyên bố
ghi công họ yêu cầu, thì hãy liên hệ với họ và hỏi
làm thế nào.
Là
thực hành tốt để cung cấp tên của tổ chức đã xuất
bản dữ
liệu hoặc nội dung đó, và đường liên kết tới
trang chủ của họ. Việc chỉ định tên tập hợp dữ
liệu và cung cấp đường liên kết tới vị trí của nó
cũng giúp cho những người
sử dụng lại khác tìm thấy dữ liệu bạn đang sử
dụng lại.
Nếu
bạn đang xây dựng công cụ sử dụng lại vài nội dung
hoặc dữ liệu, bạn cần thử đưa vào sự ghi công trên
từng trang hoặc màn hình theo đó nội dung hoặc dữ liệu
đó được sử dụng. Nếu điều này không làm được
(ví dụ vì bạn đang kéo thông tin từ nhiều nguồn khác
nhau), bạn cần cung cấp đường liên kết rõ ràng tới
trang hoặc màn hình sau đó cung cấp thông tin ghi công.
Nếu
bạn đang xuất bản lại dữ liệu hoặc nội dung, những
người sử
dụng lại nó sẽ có ràng buộc bởi các yêu cầu
ghi công đó đối với dữ liệu hoặc nội dung gốc ban
đầu. Để làm dễ hơn cho họ để hiểu và hoàn thành
các yêu cầu đó, là thực hành tốt để đưa sự ghi
công đó đối với dữ liệu hoặc nội dung nguồn vào sự
ghi công bạn yêu cầu. Điều này đôi khi là phi thực tế,
ví dụ vì bạn đang tạo ra dữ liệu hoặc nội dung phái
sinh gồm dữ liệu hoặc nội dung từ số lượng lớn các
nguồn. Trong các trường hợp đó, bạn cần cung cấp danh
sách đầy đủ các nguồn và yêu cầu sự ghi công liên
kết tới danh sách đó.
Bạn
chia sẻ tương tự như thế nào?
Giấy
phép chia
sẻ tương tự yêu cầu bạn xuất
bản lại nội dung hoặc dữ liệu mới bạn tạo ra
bằng việc sử dụng nội dung hoặc dữ liệu được trao
theo giấy phép y hệt, chia sẻ tương tự. Việc tạo ra
các cách thức mới trình bày dữ liệu không được coi
như là dẫn xuất hoặc tùy
biến thích nghi, mà là kết hợp 2 tập hợp dữ
liệu để tạo ra một tập hợp mới.
Việc
xuất bản nội dung và dữ liệu bạn tạo ra từ dữ liệu
mở, như
là dữ liệu mở, là
điều tốt lành để làm thậm chí nếu giấy phép không
yêu cầu điều đó. Việc mở ra nội dung và dữ liệu
của bạn xúc tác cho những người khác sử dụng lại và
xây dựng dựa vào tác phẩm của bạn,
và có thể gia tăng giá trị cho
tác phẩm của bạn.
Có
các giấy
phép mở nào?
Nội
dung có tính sáng tạo, như văn bản, ảnh chụp, slide, và
những thứ khác, cần phải được cấp phép bằng việc
sử dụng một giấy
phép Creative
Commons. Có 3 giấy phép bạn
nên cân nhắc sử dụng cho nội dung mở:
Mức
cấp phép
|
Giấy
phép Creative Commons
|
---|---|
phạm
vi công cộng - public domain
|
|
ghi
công - attribution
|
|
ghi
công - chia sẻ tương tự - attribution & share-alike
|
Có
các phiên bản khác nhau cho từng giấy
phép đó, phiên
bản gần đây nhất là 4.0. Cũng có các biến thể khác
nhau tính tới các khác biệt về luật ở các quốc gia
khác nhau. Các đường liên kết trong bảng ở trên là cho
các phiên bản 4.0, nó áp dụng toàn cầu, nhưng bạn cũng
có thể thấy các nhà
xuất bản sử dụng các phiên bản khác. Bạn có
thể ử dụng lại nội dung theo các giấy phép đó bất
kể bạn ở nước nào.
Có
các dạng giấy phép Creative
Commons khác mà không phải là các giấy phép mở. Ví
dụ, giấy phép Creative
Commons Attribution-NonCommercial
(CC BY-NC) không cho phép sử
dụng lại thương mại nội dung, và vì thế không
phải là một giấy phép mở. Các tóm tắt người đọc
được của các giấy phép Creative
Commons nêu chính xác những gì bạn có thể làm theo
từng giấy phép.
Các
giấy
phép mở cho các cơ
sở dữ liệu
Bạn
có thể gặp tập hợp tương tự các giấy phép sẵn sàng
cho các cơ
sở dữ liệu từ Open
Data Commons. Một lần nữa có 3 mức:
Mức
cấp phép
|
Giấy
phép Chung Dữ liệu Mở
|
---|---|
phạm
vi công cộng - public domain
|
|
ghi
công - attribution
|
|
ghi
công & chia sẻ tương tự - attribution &
share-alike
|
Các
giấy phép khác
Có
các giấy phép khác xúc tác cho sử dụng lại và bạn có
thể gặp, đặc biệt xung quanh thông tin của khu vực nhà
nước:
-
Giấy phép Chính phủ Mở - Open Government Licence là giấy phép ghi công bao trùm cả bản quyền và quyền cơ sở dữ liệu và chủ yếu được sử dụng cho thông tin được chính phủ trung ương ở Vương quốc Anh làm cho sẵn sàng
-
Giấy phép Mở OS - OS Open Licence là giấy phép ghi công chính xác y hệt như Open Government Licence nhưng đảm bảo sự ghi công là theo Ordnance Survey
Giấy
phép được chỉ ra như thế nào?
Giấy
phép theo đó thông tin được xuất
bản cần phải là rõ ràng cả ở nội dung người
đọc được và như là dữ liệu máy đọc được. Nếu
bạn không thể tìm ra giấy phép cho thông tin bạn phát
hiện trên web, bạn cần liên hệ với chủ sở hữu của
trang đó để hỏi: thiếu thông tin cấp phép ngụ ý bạn
không thể giả sử quyền sử dụng lại nội dung hoặc
dữ liệu đó.
Các
mô tả và đánh dấu người đọc được mà bạn có thể
gặp được chỉ ra trên các website của Creative
Commons và Open Data Commons:
Ở
những nơi có thể, nhà
xuất bản cần phải nhúng thông tin về giấy phép
trực tiếp vào bên trong nội dung hoặc bản thân dữ
liệu. Tuy nhiên, thường thì bạn sẽ phải xem xét trang
từ đó bạn truy cập tới nội dung hoặc dữ liệu, hoặc
thông tin giấy phép cho toàn bộ website, nó thường được
liên kết tới từ chân trang đó.
Nếu
nhà xuất bản
thâm tập hợp dữ liệu của họ vào một catalog,
như data.gov.uk
hoặc Data Hub, họ có thể chỉ
ra giấy
phép theo đó tập hợp dữ liệu là sẵn sàng theo
siêu dữ liệu được catalog đó cung cấp. Bạn cần kiểm
tra rằng điều này là nhất quán với bất kỳ thông tin
cấp phép nào họ
cung cấp trên trang của riêng họ hoặc bên trong bản thân
dữ liệu đó: nếu không có, bạn cần hỏi họ để làm
rõ.
Đọc
thêm
Thừa
nhận
Rất cảm ơn
Francis Davey, Leigh
Dodds, Tony Hirst, và
các bình luận viên nặc danh đã đóng góp các bình luận
cho bản thảo này.
The
fact that you can get hold of some information does not necessarily
mean that you can do whatever you want with it. You need to have
permission from the owner of that information to do what you want to
do. A licence
tells you what you can do.
But
what does it mean to license data? What requirements can a licence
place on you? What different licences to publishers use? How can you
find out what licence a dataset is available under? This guide
answers these questions.
Note:
This guide focuses on data published by organisations based in the
UK. Licensing law is different in different countries, so some of
this information might not apply to you if you are reusing
information that is published elsewhere. It does not address other
potential legal considerations, such as compliance with the Data
Protection Act.
What Is Licensing?
When
someone puts care and thought into creating something, such as
writing a blog post or taking a photograph, they own that work. This
means they have the right to determine how it gets used.
If
you want to use the content or data, you have to either establish
that they no longer have the rights to that work (because they have
waived them), or ask their permission to use it. Licences
are how they explicitly give you permission to use their work.
What Do Publishers Own?
In
Europe, there are two kinds of rights that publishers —
organisations or individuals who make available content or data —
are given over things that they have created:
-
they get copyright over works (content) that they create and which are original to them, such as text that they write or photographs they take
-
they get a database right over collections of data that they have put a substantial effort into obtaining, verifying or presenting
Note:
As far as we know the database right is unique to the European Union.
In some countries there may be no protection for collections of data.
If
someone applies original judgement in putting together a database,
for example in choosing which items to include within the database or
which information about them to include, they have a copyright over
that database, because it is a creative work.
For
example, if someone were to build a database about the best 100 cars,
this might involve:
-
choosing which cars count as the best cars
-
writing a description about each car
-
researching and gathering facts about them
They
would have copyright over the database, because they chose which cars
were "best". They would have copyright over the
descriptions, because they wrote them. And they would probably have
the database right for the database they've built, because they put
substantial effort into gathering information about the cars.
Importantly, they don't own the facts about the cars — you or
anyone else could build your own database containing exactly those
facts without violating their database right — but no one else can
reuse their database or their descriptions without their permission
because they own the copyright over them.
Publishers
probably do not have a database right if they create
the facts in a database, as opposed to gathering them from elsewhere,
unless they put substantial effort into verifying or presenting the
database. For example, if someone owns a restaurant and creates a
database of the dishes that they offer, and when they offer them,
they probably do not have a database right over that database, though
they might have copyright because of the creative judgement involved
in working out which dishes should be offered on particular days to
provide a balanced menu.
What About Data From Third Parties?
Publishers
might not own all the content or data that they publish themselves.
In particular, rather than creating the content or gathering the data
themselves, some of the content and data they publish might be:
-
completely licensed by them from someone else
-
include an extract of content or data that they have licensed from someone else
-
be derived from the content or data that they have licensed from someone else
When
they publish the data, the publisher should tell you about which
content or data is owned by another organisation, and under which
licence it is being republished.
What About Brands?
Brands
are usually protected through a trade
mark. A trade mark restricts how you can use an organisation's
logo or company name. They will also have copyright on the logo.
Licences
for content or data usually explicitly exclude logos and company
names, so you cannot, for example, adapt a logo by changing the
colours used within it. You also cannot use the company name or logo
to lend weight to your product without permission to do so. However,
the attribution
requirements of a licence may require you to use the company name
and logo to indicate that you have reused data owned by that company.
What Can't You Do?
There
are a few things that you can do with content or data without a
licence, but in general you need to be given a licence by a publisher
if you want to reuse their content or data. Having access to some
content or data — for example by downloading it from a publisher's
website — does not give you the right to reuse it.
Republishing and Adding Value
You
do not automatically have the right to republish, in its entirety,
content or data that someone else owns, even if they have given you a
licence to use it yourself. You need to check the terms of the
licence for the content or data to make sure that you can republish
it.
The
same applies if you are adding value to the content or data, for
example by automatically adding links or styling to content, or
adding columns with extra information into a dataset. The new content
or data includes the entirety of someone else's content or data, so
you cannot publish it unless you have their permission.
Publishing Extracts
You
have the right to publish extracts of content or databases that you
have access to, regardless of what the licence says, so long as the
extract is not "substantial". However, it is often hard to
tell if the extract that you have made is "substantial".
The
licence that you have been given might let you republish any amount
of the content or data (open licences do this). Otherwise, you should
take legal advice about whether the extracts that you want to publish
are likely to count as substantial or not.
Publishing Derived Content or Data
You
might want to create new content or databases by adapting, deriving,
or otherwise processing some content or data. To do that, you first
have to ensure you have been given a licence to use the data in the
first place. You then need to look at what the licence says about
creating derived works.
For
example, say you have been given a licence to use a photograph on
your website. You could create a new version of that photograph by
changing it from colour to black & white, or by adding a speech
bubble to it.
In
this case, the photograph is a creative work, and the person who took
it owns the copyright. Because the photograph is protected by
copyright, you can only create these new images if the licence under
which you are using the photograph allows you to do so.
Copyright
can exist in small pieces of content, such as phrases. For example,
if you analyse some content to create a new database, you should make
sure that you have the right to reuse any snippets of content that
you might keep in the new database. If the content includes a
presentation of data from a database, you have to consider database
rights as well: scraping data from the page might equate to creating
an extract.
Database
rights are slightly different, because they only extend to creating
extracts or re-utilising (republishing) a database.
For
example, say you analysed the data about prescriptions of each drug
within each GP practice within the UK, along with other data about
the coverage of each practice, to create
a new dataset that provided the average spend per patient of each
practice. So long as you had no separate contractual obligations to
the owners of the two datasets you have brought together, you might
well be free to do what you liked with the result, as it would not be
possible to reconstruct the original databases from the aggregated
data.
What Do Licences Say?
Licences
tell you what you can
do with the content or data that you access. A licence will tell you
whether you can:
-
republish the content or data on your own website
-
derive new content or data from it
-
make money by selling products that use it
-
republish it while charging a fee for access
Many
licences will let you access content or data for free, but say that
you cannot republish it or adapt it, or use it within commercial
products. If you break the terms of the licence, the owner of the
content or data can take you to court.
What Do Open Licences Say?
An
open
licence
is one that places very few restrictions on what you can do with the
content or data that is being licensed.
According
to the Open Definition,
There are only two kinds of restrictions that an open licence can
place:
-
that you must give attribution to the source of the content or data
-
that you must publish any derived content or data under the same licence (this is called share-alike)
An
open licence might do neither or one or both of these. So, you might
encounter content or data available under one of three levels of
licence:
-
a public domain licence has no restrictions at all (technically, these indicate that the rights owner has waived their rights to the content or data)
-
an attribution licence just says that you must give attribution to the publisher
-
an attribution & share-alike licence says that you must give attribution and share any derived content or data under the same licence
How Do You Provide Attribution?
You
should provide attribution even if the licence does not require it.
Giving attribution is a way of recognising both the efforts that the
publisher has made to put together the content or data you are
reusing, and their generosity in making it available for reuse.
When
content or data is licensed using a licence that includes
attribution, the publisher might specify:
-
what wording the attribution should include
-
where and how the attribution should be presented
You
should follow what the publisher asks you to do. If it is not
practical, for example if you are providing a service that does not
have room for the attribution statement that they request, then get
in touch with them to ask what to do.
It
is good practice to provide the name of the organisation that
published the data or content, and a link to their home page.
Specifying the name of the dataset and providing a link to its
location also helps other reusers to find the data you are reusing.
If
you are building a tool that reuses some content or data, you should
try to include attribution on every page or screen in which the
content or data is used. If this is impractical (for example because
you are pulling together information from lots of different sources),
you should provide a clear link to a page or screen that then
provides attribution information.
If
you are republishing data or content, its reusers are still bound by
the attribution requirements of the original data or content. To make
it easier for them to understand and fulfil those requirements, it is
good practice to include the attribution for the source data or
content in the attribution that you ask for. This might sometimes be
impractical, for example because you are creating derived data or
content includes data or content from a large number of sources. In
these cases, you should provide a full list of the sources and
request an attribution which links to that list.
How Do You Share-Alike?
A
share-alike licence requires you to republish new content or data
that you create using the given content or data under the same,
share-alike licence. Creating new ways of presenting data does not
count as derivation or adaptation, but combining two sets of data to
create a new set probably does.
Publishing
the content and data that you create from open data, as open data, is
a good thing to do even if the licence does not require it. Opening
up your content and data enables others to reuse and build on your
work, and can add value to your work.
What Open Licences Are There?
There
are two sets of open licences that you may encounter.
Open Licences for Creative Content
Creative
content, such as text, photographs, slides and so on, may be licensed
using a Creative
Commons Licence. There are three of these that you might
encounter:
Level
of Licence
|
Creative
Commons Licence
|
---|---|
public
domain
|
|
attribution
|
|
attribution
& share-alike
|
There
are different versions for each of these licences, the most recent
being version 4.0. There are also different variants which take into
account differences in the law in different countries. The links in
the table above are to the version 4.0 versions, which apply
internationally, but you may find publishers using other versions.
You can reuse content under these licences no matter what country you
are in.
There
are other types of Creative Commons licences that are not open
licences. For example, the Creative Commons Attribution-NonCommercial
licence does not allow commercial reuse of content, and therefore is
not an open licence. The human-readable summaries of the Creative
Commons licences spell out exactly what you can do under each
licence.
Open Licences for Databases
You
might encounter a similar set of licences which is available for
databases from the Open Data
Commons. There are again three levels:
Level
of Licence
|
Open
Data Commons Licence
|
---|---|
public
domain
|
|
attribution
|
|
attribution
& share-alike
|
Other Licences
There
are other licences that enable reuse and which you may encounter,
particularly around public sector information:
-
Open Government Licence is an attribution licence that covers both copyright and database right and is mainly used for information made available by UK central government
-
OS Open Licence is an attribution licence that is exactly the same as the Open Government Licence but ensures that the attribution is to the Ordnance Survey
How is the Licence Indicated?
The
licence under which information is published should be clear both in
human-readable content and as machine-readable data. If you cannot
work out the licence for information that you discover on the web,
you should contact the owner of the site to ask: the lack of
licensing information means that you cannot assume the right to reuse
the content or data.
Human-readable
descriptions and marks that you may encounter are shown on the
Creative Commons and Open Data Commons websites:
Where
possible, the publisher should have embedded information about the
licence directly within the content or data itself. Often, however,
you will have to look at the page from which you access the content
or data, or the licence information for the entire website, which is
often linked to from the footer of the page.
If
a publisher adds their dataset to a catalog, such as data.gov.uk
or the Data Hub, they may indicate
the licence under which the dataset is available in the metadata
supplied by the catalog. You should check that this is consistent
with any licence information they supply on their own site or within
the data itself: if it is not, you should ask them for clarification.
Further Reading
Acknowledgements
Very
many thanks to Francis
Davey, Leigh Dodds, Tony
Hirst, and the anonymous commenters who contributed comments on
this draft.
Dịch:
Lê Trung Nghĩa
Không có nhận xét nào:
Đăng nhận xét
Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.