Thứ Năm, 5 tháng 3, 2020

Bài 1 - Dữ liệu mở là gì?


Dữ liệu mở là gì?
Dữ liệu mở là dữ liệu mà bất kỳ ai cũng có thể truy cập, sử dụng và chia sẻ. Các chính phủ, doanh nghiệp và cá nhân có thể sử dụng dữ liệu mở để mang lại những lợi ích xã hội, kinh tế và môi trường.
Trong bài này chúng ta sẽ khai thác những điều sau:
Dữ liệu mở là gì?
Dữ liệu là gì?
Điều gì làm cho dữ liệu là mở?
Vì sao chúng ta cần dữ liệu mở?
Khám phá dữ liệu mở - trong 2 phút
TS. David Tarrant, giảng viên của ODI giải thích dữ liệu là gì, điều gì làm cho nó thành mở và vì sao chúng ta cần dữ liệu mở.
Dữ liệu mở là gì?
Dữ liệu mở là dữ liệu mà bất kỳ ai cũng có thể truy cập, sử dụng và chia sẻ.
Dữ iệu mở trở nên sử dụng được khi được làm sẵn sàng ở định dạng phổ biến, máy đọc được.
Dữ liệu mở phải được cấp phép mở. Giấy phép của nó phải cho phép mọi người sử dụng dữ liệu đó theo bất kỳ cách gì họ muốn, bao gồm biến đổi, kết hợp và chia sẻ nó với những người khác, thậm chí một cách thương mại.
Từ dữ liệu thô tới thông tin mới và tri thức
Không có dữ liệu chúng ta không thể xây dựng thông tin, và không có thông tin sẽ không có tri thức mới.

Dữ liệu



Dữ liệu là tư liệu thô từ đó thông tin và tri thức có thể được dẫn xuất.
Hãy nghĩ về dữ liệu như các địa điểm, hình ảnh, mô tả, rà soát lại, và giá thành mà tạo nên cơ sở của thông tin có thể giúp cho bạn lập kế hoạch một ngày nghỉ, ví dụ thế.

Thông tin


Dữ liệu trở thành thông tin khi nó được đưa ra cho một ngữ cảnh.
Tiếp theo từ ví dụ trước, các địa điểm, hình ảnh, mô tả và giá thành tất cả có thể giúp cung cấp thông tin có liên quan tới điểm thu hút du lịch.
Bộ sưu tập và trình bày dữ liệu giúp tạo thành thông tin.

Tri thức


Tri thức là những gì được dẫn xuất từ thông tin, và được cá nhân hóa cho các nhu cầu của bạn.
Việc xây dựng tri thức là một quy trình biến thông tin thành các lựa chọn.
Xây dựng dựa vào ví dụ ở trên, biết rằng không ai trong gia đình của bạn thích chủ đề các công viên sẽ giúp bạn quyết định những địa điểm nào nên tránh trong kỳ nghỉ, và nơi nào phù hợp hơn với gia đình của bạn.
Điều gì làm cho dữ liệu thành mở?
Dữ liệu là mở nếu bất kỳ ai cũng có thể truy cập, sử dụng và chia sẻ nó.
Có vài điều đơn giản để cân nhắc khi định nghĩa tính mở:

Các hạn chế

Để dữ liệu là mở, nó không nên có các hạn chế cản trở nó khỏi việc được sử dụng theo bất kỳ cách thức cụ thể nào
Bất kỳ ai cũng nên có tự do để sử dụng, sửa đổi, kết hợp và chia sẻ dữ liệu đó, thậm chí một cách thương mại

Chi phí

Dữ liệu mở phải là tự do không mất tiền để sử dụng, nhưng điều này không ngụ ý nó phải là tự do không mất tiền để truy cập.
Thường có chi phí để tạo lập, duy trì, và xuất bản dữ liệu sử dụng được.
Lý tưởng, bất kỳ khoản phí nào để truy cập dữ liệu mở nên không nhiều hơn so với chi phí hợp lý để tái tạo lại đơn vị dữ liệu được yêu cầu.
Chi phí tái tạo lại này có xu hướng không đáng kể đối với nhiều tập hợp dữ liệu.
Dữ liệu sống và dữ liệu lớn có thể chịu các chi phí liên tục liên quan tới cung cấp dịch vụ tin cậy.

Sử dụng lại

Một khi người sử dụng có dữ liệu, họ được tự do để sử dụng, sử dụng lại và phân phối lại nó - thậm chí một cách thương mại.
Dữ liệu mở được đo lường bằng việc nó có thể được sử dụng cho những gì chứ không phải nó được làm cho sẵn sàng bằng cách nào.
Các khía cạnh như định dạng, cấu trúc và khả năng máy đọc được, tất cả làm cho dữ liệu sử dụng được nhiều hơn, và tất cả nên được cân nhắc thận trọng.
Tuy nhiên, chúng không làm cho dữ liệu đó mở hơn.
Vì sao chúng ta cần dữ liệu mở?
Dữ liệu mở có thể giúp mang lại những lợi ích khác nhau cho các chính phủ, doanh nghiệp và xã hội dân sự.

Biến đổi chính phủ


Dữ liệu mở có thể giúp làm cho các chính phủ minh bạch hơn. Nó có thể cung cấp bằng chứng rằng tiền của nhà nước được chi tiêu tốt và các chính sách đang được triển khai tốt.
Ví dụ, theo nhà hoạt động xã hội hàng đầu về chính phủ mở David Eaves, dữ liệu mở đã cho phép các công dân ở Canada tiết kiệm cho chính phủ 3,2 tỷ USD tiền quyên góp từ thiện gian lận trong năm 2010.
Dựa vào dự báo GDP của EU28+ GDP cho năm 2020, trong khi tính tới chi tiêu trung bình của chính phủ các quốc gia tương ứng, tiết kiệm chi phí cho mỗi quốc gia có thể tính được. Tổng các khoản tiết kiệm chi phí cho EU28+ trong năm 2020 là 1,7 tỷ EUR theo ước tính.
Lexbase là dịch vụ web cung cấp thông tin công cộng từ các tòa án và các cơ quan chức năng khác của Thụy Điển. Trên website các phán xét về các vụ kiện hình sự và dân sự có liên quan tới các cá nhân và công ty có thể được tìm thấy. Cơ sở dữ liệu đó được cập nhật với các phán xét và quyết định mới mỗi ngày. Website đó được sử dụng để cung cấp cho các công dân thông tin về các lĩnh vực tội phạm và khác.
Trong một ví dụ khác, theo Follow the Money (Đi theo Tiền) ở Nigeria, quy trình y hệt được sử dụng để đảm bảo công quỹ được chi tiêu để triển khai các chính sách được hứa hẹn với người dân.

Xây dựng các cơ hội kinh doanh mới


Dữ liệu mở đang mở ra các cơ hội mới cho các doanh nghiệp để kết nối với các khách hàng.
Giao thông cho Luân Đôn (Transport for London) đã phát hành dữ liệu mở các lập trình viên đã sử dụng để xây dựng hơn 800 ứng dụng giao thông.
Thomson Reuters đang sử dụng dữ liệu mở để kết nối với các khách hàng hiện đang có để cung cấp các dịch vụ tốt hơn.
Các công ty khởi nghiệp trong chương trình Khởi nghiệp của ODI bây giờ sử dụng tổng số hơn 70 người và sinh ra doanh thu hơn 4 triệu £. Xem báo cáo thường niên của ODI

Bảo vệ trái đất của chúng ta


Web đã trở thành phần chính hạ tầng của chúng ta và dữ liệu mở sẽ được xây dựng trên hạ tầng này.
Dữ liệu mở về việc liệu có thể cung cấp hệ thống cảnh báo sớm cho các thảm họa môi trường hay không, ví dụ thế.
Dữ liệu mở cũng đang giúp những người tiêu dùng hiểu được các tác động của cá nhân họ lên môi trường, và tiến hành các bước để cải thiện nó. Xem báo cáo Các lựa chọn tốt hơn làm được tốt hơn
Bạn đã sẵn sàng cho dữ liệu mở?
Có 4 điều có ích để ghi nhớ khi nghĩ về việc mở dữ liệu của bạn. Bạn có thể ghi nhớ được chúng chứ?


Dữ liệu mở là gì?
Dữ liệu mở là...
  • thông tin chúng ta bán cho các doanh nghiệp
  • dữ liệu nhìn thấy được trên Web
  • dữ liệu bất cứ ai cũng có thể truy cập, sử dụng và chia sẻ,


Đáp án đúng!
Dữ liệu mở là dữ liệu mà bất kỳ ai cũng có thể truy cập, sử dụng và chia sẻ. Dữ liệu mở cũng phải được cấp phép để cho phép sử dụng tự do không mất tiền và sẵn sàng để sử dụng thương mại.
Bạn chắc chắn chứ?
Dữ liệu mở là dữ liệu mà bất kỳ ai cũng có thể truy cập, sử dụng và chia sẻ. Dữ liệu mở cũng phải được cấp phép để cho phép sử dụng tự do không mất tiền và sẵn sàng để sử dụng thương mại.
Dữ liệu là gì?
Dữ liệu là...
  • các con số, từ ngữ, bản đồ và ảnh chụp.
  • thông tin được đăng trên Web.
  • tư liệu thô của thông tin và tri thức.


Đáp án đúng!
Dữ liệu là mức thấp nhất của tư liệu thô từ đó thông tin và tri thức có thể được dẫn xuất.
Bạn chắc chứ?
Dữ liệu là mức thấp nhất của tư liệu thô từ đó thông tin và tri thức có thể được dẫn xuất.
Điều gì làm cho dữ liệu thành mở?
Dữ liệu mở nên là...
  • được phát hành một cách chọn lọc với một khoản phí
  • tự do không có các hạn chế để sử dụng nó
  • bị hạn chế trong sử dụng nó


Đáp án đúng!
Nếu điều gì đó hạn chế sử dụng tự do dữ liệu, như hạn chế phi thương mại, thì điều này là không đủ điều kiện để là dữ liệu mở.
Bạn có chắc về điều đó chứ?
Nếu điều gì đó hạn chế sử dụng tự do dữ liệu, như hạn chế phi thương mại, thì điều này là không đủ điều kiện để là dữ liệu mở.
Vì sao chúng ta cần dữ liệu mở?
Dữ liệu mở có sức mạnh để làm những gì?
  • Làm cho các chính phủ có trách nhiệm
  • Trao sự truy cập tới các tập hợp dữ liệu khác
  • Mở khóa giá trị xã hội, môi trường và kinh tế

Đáp án đúng!
Dữ liệu mở có thể biến đổi tương tác giữa các chính phủ, doanh nghiệp và cá nhân. Nó có sức mạnh để giúp cải thiện các dịch vụ, tăng trưởng kinh tế và bảo vệ trái đất của chúng ta.
Bạn chắc chứ?
Dữ liệu mở có thể biến đổi tương tác giữa các chính phủ, doanh nghiệp và cá nhân. Nó có sức mạnh để giúp cải thiện các dịch vụ, tăng trưởng kinh tế và bảo vệ trái đất của chúng ta.
Dữ liệu mở
Dữ liệu mở là dữ liệu mà bất kỳ ai cũng có thể truy cập, sử dụng và chia sẻ.
Dữ liệu mở là tư liệu thô cho kỷ nguyên số mà, không giống như than, gỗ hay kim cương, nó có thể được bất kỳ ai và tất cả mọi người cùng một lúc sử dụng.
Bất kỳ hạn chế nào được áp đặt lên việc sử dụng dữ liệu mở sẽ giới hạn tiềm năng của nó để tạo ra giá trị mới.
Dữ liệu mở có thể mang tới những lợi ích khác nhau cho các chính phủ, doanh nghiệp và cá nhân. Nó có sức mạnh để giúp cải thiện các dịch vụ, tăng trưởng kinh tế và bảo vệ trái đất của chúng ta.
Ở bài tiếp sau, chúng ta sẽ khai thác cách thức giá trị được mở khóa trong dữ liệu mở như thế nào.


Dịch: Lê Trung Nghĩa
letrungnghia.foss@gmail.com

Không có nhận xét nào:

Đăng nhận xét

Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.