Điều gì tạo nên dữ liệu mở chất lượng
Đánh giá dữ liệu mở hữu dụng như thế nào không thể
được làm nhanh.
Có một số tiêu chuẩn và dấu chất lượng dựa vào
cộng đồng có thể giúp bạn đánh giá dữ liệu hữu
dụng như thế nào.
Trong bài này chúng ta khai thác những điều sau:
-
Điều gì tạo lên dữ liệu hữu dụng
-
Các tiêu chuẩn giúp gia tăng khả năng sử dụng dữ liệu như thế nào
-
Đánh dấu chất lượng
Đánh giá chất lượng của dữ liệu mở - trong 2 phút
Giảng viên David Tarrant của ODI giải thích dữ liệu chất
lượng là gì, cách nhận biết nó và các dấu chất lượng
nào những người tiêu dùng dữ liệu mở nên tìm kiếm.
Chất lượng dữ liệu
mở là gì?
Dữ liệu mở trở nên hữu dụng khi con người có thể
hiểu nó và máy có thể điều khiển nó.
Những người sử dụng dữ liệu mở cần sự cho phép
của nhà xuất bản của nó, được trao bằng một giấy
phép mở. Nhưng một mình giấy phép mở đó là không đủ
để đảm bảo tính hữu dụng của dữ liệu.
Là không có khả năng mọi người sẽ có thể tham gia với
dữ liệu để từ đó rút ra được sự thấu hiểu và
thể hiện những lợi ích trừ phi nó là hữu dụng.
Các tiêu chuẩn do cộng đồng dẫn dắt
Các tiêu chuẩn do cộng đồng dẫn dắt xác định các
yêu cầu pháp lý, thực hành, kỹ thuật và xã hội cho
tập hợp dữ liệu để trở thành hữu dụng.
Các yêu cầu pháp lý
Ngoài giấy phép mở ra, có 3 yêu cầu pháp lý cần được
cân nhắc: Bạn phải:
-
Bảo vệ thông tin nhạy cảm như dữ liệu cá nhân.
-
Giữ lại các quyền của chủ sở hữu dữ liệu.
-
Thúc đẩy sử dụng đúng dữ liệu đó.
Các yêu cầu thực hành
Là quan trọng rằng dữ liệu mở có thể được những
người sử dụng tìm thấy và tin tưởng.
Điều này ngụ ý rằng các nhà xuất bản dữ liệu mở
phải:
-
Liên kết tới dữ liệu đó từ website của họ.
-
Cập nhật dữ liệu thường xuyên nếu nó thay đổi.
-
Cam kết tiếp tục làm cho dữ liệu đó sẵn sàng.
Các yêu cầu kỹ thuật
Có 3 khuyến cáo xác định các khía cạnh kỹ thuật của
dữ liệu mở:
-
Định dạng theo đó dữ liệu được xuất bản.
-
Cấu trúc của dữ liệu đó.
-
Các kênh qua đó dữ liệu đó là sẵn sàng.
Các yêu cầu xã hội
Để sử dụng dữ liệu là bền vững, là quan trọng để
có cộng đồng những người sử dụng tham gia. Các tập
hợp dữ liệu tốt nhất có:
-
Các kênh hỗ trợ tích cực.
-
Các nhóm thảo luận và diễn đàn.
-
Các hướng dẫn cách làm được xuất bản để làm việc với các dữ liệu đó.
Các dấu chất lượng
Các dấu chất lượng cung cấp cho những người sử dụng
sự tin cậy về chất lượng và khả năng sử dụng dữ
liệu mở.
Có 2 chỉ số chính về chất lượng dữ liệu mở:
5 Sao (5 Stars)
‘5 Sao của dữ liệu mở liên kết’ (5 Stars of linked
open data) bao gồm định nghĩa pháp lý cơ bản và sự xuất
sắc về kỹ thuật của dữ liệu được xuất bản đó.
5 Sao đã được nhà phát minh ra Web, Ngài Tim Berners-Lee
phát triển, vào năm 2001. Nguyên tắc 5 sao đó tạo ra các
khuyến cáo về định dạng và cấu trúc của dữ liệu.
Các chứng chỉ Dữ liệu Mở của ODI
Các chứng chỉ Dữ liệu Mở của Viện Dữ liệu Mở là
các hướng dẫn thực hành, xã hội, pháp lý để cẩn
nhắc khi xuất bản hoặc sử dụng dữ liệu mở.
Các chứng chỉ đó hành động như là bảng câu hỏi tự
đánh giá cho các nhà xuất bản, và trong một vài trường
hợp cho những người sử dụng, để đánh giá và đo
lường tính khả dụng đầy đủ của tập hợp dữ liệu.
Bạn sẵn sàng cho dữ
liệu mở chất lượng?
Bạn có thể nhớ lại các yêu cầu thực hành, kỹ thuật,
pháp lý và xã hội cho tập hợp dữ liệu mở để trở
thành hữu dụng chứ?
Dữ liệu mở chất
lượng là gì?
Dữ liệu mở trở nên hữu dụng khi ...
-
nó được nhập khẩu vào hệ thống của chúng ta
-
con người có thể hiểu nó, máy có thể điều khiển nó và nó có giấy phép mở
-
chính phủ xuất bản nó
Đáp án đúng!
Dữ liệu mở trở nên hữu dụng khi con người có thể
hiểu nó, máy có thể điều khiển nó và nó được làm
cho sẵn sàng theo một giấy phép mở.
Bạn chắc chắn chứ?
Dữ liệu mở trở nên hữu dụng khi con người có thể
hiểu nó, máy có thể điều khiển nó và nó được làm
cho sẵn sàng theo một giấy phép mở.
Các cân nhắc pháp lý
Có 3 cân nhắc pháp lý như một phần của các tiêu
chuẩn để xuất bản dữ liệu mở, một trong số đó
là...
-
không phá vỡ luật cấp phép
-
xuất bản bất kỳ dạng dữ liệu nào
-
bảo vệ thông tin nhạy cảm như dữ liệu cá nhân
Đáp án đúng!
Ngoài một giấy phép mở ra, có 3 yêu cầu pháp lý cần
phải được xem xét. Bảo vệ thông tin nhạy cảm như dữ
liệu cá nhân, giữ lại các quyền của các chủ sở hữu
dữ liệu và thúc đẩy sử dụng đúng dữ liệu đó.
Bạn chắc chắn chứ?
Ngoài một giấy phép mở ra, có 3 yêu cầu pháp lý cần
phải được xem xét. Bảo vệ thông tin nhạy cảm như dữ
liệu cá nhân, giữ lại các quyền của các chủ sở hữu
dữ liệu và thúc đẩy sử dụng đúng dữ liệu đó.
Các cân nhắc kỹ thuật
Có 3 cân nhắc kỹ thuật như một phần của các tiêu
chuẩn để xuất bản dữ liệu mở, một trong số đó là
...
-
ở định dạng nào dữ liệu mở đó được xuất bản
-
liệu nó có thể được sử dụng trên một máy tính hay không
-
liệu nó có chiếm nhiều băng thông rộng hay không
Đáp án đúng!
Có 3 khuyến cáo xác định các khía cạnh kỹ thuật của
dữ liệu mở. Định dạng ở đó dữ liệu được xuất
bản, cấu trúc dữ liệu đó và các kênh qua đó dữ liệu
là sẵn sàng.
Bạn chắc chắn chứ?
Có 3 khuyến cáo xác định các khía cạnh kỹ thuật của
dữ liệu mở. Định dạng ở đó dữ liệu được xuất
bản, cấu trúc dữ liệu đó và các kênh qua đó dữ liệu
là sẵn sàng.
Các dấu chất lượng
Viện Dữ liệu Mở biện hộ cho sử dụng dấu chất
lượng của riêng nó được biết như...
-
Các Chứng chỉ Dữ liệu Mở
-
Dấu màu xanh lá cây lớn của ODI
-
Dấu phê chuẩn của ODI
Đáp án đúng!
Viện Dữ liệu Mở đã phát triển các Chứng chỉ Dữ
liệu Mở bao gồm các yêu cầu thực hành và xã hội cùng
với các hướng dẫn sâu về pháp lý và kỹ thuật để
cân nhắc khi xuất bản dữ liệu mở.
Bạn chắc chắn chứ?
Viện Dữ liệu Mở đã phát triển các Chứng chỉ Dữ
liệu Mở bao gồm các yêu cầu thực hành và xã hội cùng
với các hướng dẫn sâu về pháp lý và kỹ thuật để
cân nhắc khi xuất bản dữ liệu mở.
Các tiêu chuẩn + các dấu = dữ liệu mở chất lượng
Dữ liệu mở trở nên hữu dụng khi con người có thể
hiểu nó và máy có thể điều khiển nó.
Cả 2 điều đó đòi hỏi sự cho phép của nhà xuất bản,
được trao qua giấy phép mở. Tuy nhiên, một mình giấy
phép mở đó là không đủ để đảm bảo tính khả dụng
của dữ liệu. Đơn giản đặt một tệp lên website với
một giấy phép mở không tạo nên dữ liệu mở.
Là không có khả năng những người sử dụng sẽ có thể
tham gia đúng với dữ liệu không sử dụng được để
dẫn xuất những thấu hiểu và thể hiện những lợi
ích.
Trong bài tiếp sau, chúng ta so sánh các sáng kiến dữ liệu
mở và xem xét các chỉ số năng suất chính của các sáng
kiến thành công.
Về bài trước ………. Tới bài sau
Dịch: Lê Trung Nghĩa
Không có nhận xét nào:
Đăng nhận xét
Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.