Linked Data
for Libraries: Our New Librarians
By Teodora Petkova
March 10, 2017
Bùng nổ nội dung, biến đổi chưa từng
có nền công nghiệp xuất bản và số lượng người ngày
càng gia tăng bắt đầu yêu cầu thông tin trên Web là
những yếu tố dẫn dắt các thư viện tái tạo lại cách
thức họ phục vụ các nhu cầu thông tin của những người
sử dụng của họ. Thách thức lớn nhất các thư
viện đối mặt ngày nay là làm thế nào để làm cho sự
phong phú các hồ sơ thư viện của họ giàu có và được
quản lý tốt dễ dàng hơn để truy cập và thấy được
nhiều hơn.
Cuộc chiến với các thế lực quên
lãng và các thủ thư mới của chúng tôi
Sách
là loài dễ vỡ, nó chịu sự bào mòn của thời gian, nó
sợ các loài gặm nhấm, các yếu tố và bàn tay vụng về.
Vì thế các thủ thư bảo vệ các cuốn sách không chỉ
chống lại loài người, mà còn chống lại tự nhiên và
dành trọn cuộc đời mình cho cuộc chiến này với các
thế lực quên lãng đó.
Trong thế giới số của kết nối liên
tục, các lực lượng lãng quên chính biến thành thiếu
tính minh bạch và các kỹ thuật truy xuất thông tin nghèo
nàn. Để nói, “cuộc chiến với các thế lực quên
lãng” sẽ lấy không chỉ các thủ thư được huấn
luyện và chuyên tâm, mà còn vài thuật toán, có khả năng
để lôi về các kết quả thích hợp một cách nhanh chóng
và hiệu quả.
Trong ngữ cảnh các bộ sưu tập khổng lồ
các đối tượng số không đồng nhất, tính minh bạch và
truy xuất thông tin hiệu quả phụ thuộc vào máy (được
chống trụ bằng các công nghệ web ngữ
nghĩa) mà tiến hành nặng nhọc để tăng việc
lấy về không chỉ các cuốn sách và các tài nguyên điện
tử, mà còn cả các khái niệm và các mối quan hệ. Và
đây là những nơi mà, để bảo vệ các tài nguyên giàu
có của thư viện và làm cho chúng sẵn sàng cho những
người cần chúng, nơi mà họ cần chúng, hạt giống mới
của các thủ thư - các chương trình máy tính - sẽ phải
có khả năng tự động tìm, chọn và lọc các tài nguyên
cùng với việc phân tích các kết nối giữa chúng và tìm
kiếm các nguồn không đồng nhất.
Để điều đó xảy ra, dữ liệu thư viện
cần phải có cấu trúc, được kết nối tốt và dễ
dàng truy cập, sử dụng và sử dụng lại. Để
bảo vệ các hồ sơ thư viện khỏi các thế lực lãng
quên số, các công nghệ Dữ liệu Liên kết đã tới
giúp.
Dữ liệu Liên
kết là ngôn ngữ mà các máy có thể đọc và hiểu để
lấy các kết quả trơn tru. Và không chỉ các kết
quả ở dạng danh sách, mà bất kỳ điều gì có lẽ là
quan trọng và thích hợp với yêu cầu thông tin (tài
nguyên, khái niệm, chủ đề, ý tưởng).
Các công nghệ Dữ liệu
Liên kết là độc nhất vô nhị vì chúng cho phép các đại
lý phần mềm tìm kiếm, chia sẻ và tích hợp thông tin
xuyên khắp các nguồn đa dạng khác nhau một cách dễ
dàng và hiệu quả.
BIBFRAME: Lựa chọn Dữ liệu Liên kết cho các hồ sơ Thư viện
Nếu một hạng mục không xuất hiện trong hồ sơ của chúng tôi, thì nó không tồn tại.
Trích dẫn của các thủ thư ở Reel
Vào những năm 1960, để tạo ra các hồ
sơ có thể được các máy tính đọc được và chia sẻ
được giữa các thủ thư, một tập hợp các định dạng
số để mô tả các hạng mục trong catalog thư viện đã
được tạo ra. Nó từng được gọi là các Hồ sơ
Catalog Máy Đọc được - MARC (Machine Readable Cataloging
Records). Ngày nay đây là định dạng thường được coi
là việc khóa trói tri thức số của các thư viện vào
các đường ống khép kín và cản trở sự dễ dàng chia
sẻ và kết nối các tài nguyên - nói cách khác, để làm
cho chúng không nhìn thấy được.
Trong các môi trường
được kết nối mạng của chúng ta, sự tồn tại bắt
đầu với khả năng nhìn thấy được. Về khía cạnh dữ
liệu, khả năng nhìn thấy được trực tiếp có liên
quan tới tính kết nối lẫn nhau. Khi không có kết nối
tới Web và bị kẹt trong các ống khép kín dữ liệu, các
hồ sơ của thư viện khó để tìm và tích hợp. Điều
đó dường như là “chúng không tồn tại”. Để mở
khóa cho các hồ sơ thư viện khỏi định dạng đã lỗi
thời của chúng (MARC) và giúp các thư viện kết nối
những người
sử dụng của họ với nội dung họ cần theo một
cách thức có sự tham gia, BIBFRAME đã được tạo ra.
Về tổng thể, BIBFRAME là sự thay thế
cho MARC của Dữ liệu Liên kết, đặt ra “nền tảng cho
tương lai của mô tả thư mục, cả trên web, và trong thế
giới được kết nối mạng rộng lớn hơn” (Trích
dẫn Thư viện Quốc hội). Đó là những gì có thể
xúc tác cho tính kết nối lẫn nhau các dữ liệu thư viện
và rốt cuộc cho các kinh nghiệm tri thức giàu có.
Để viết sâu về các cột mốc trên con
đường từ MARC tới Dữ liệu Liên kết, hãy kiểm tra
Godby, C. J. và Smith-Yoshimura, K. (2017), Từ
các Hồ sơ tới mọi Điều: Quản lý Biến đổi từ Siêu
dữ liệu Thư viện Vốn có sang Dữ liệu Liên kết.
Khả năng nhìn thấy được với những lợi ích
Việc liên kết các dữ
liệu thư viện cùng nhau là những gì có thể giúp các
thư viện quản lý nội dung của họ theo một cách thức
có hiệu quả về chi phí và làm cho nó nhìn thấy được
đối với các độc giả của họ. Sử dụng các công
nghệ Dữ liệu Liên kết, các thư viện có thể trình bày
những gì họ có để chào theo cách thức có sự tham gia,
làm giàu và, trên hết tất cả, dễ tìm.
Cả trên Web và xuyên khắp các mạng nội
bộ đa dạng khác nhau, khả năng nhìn thấy được không
chỉ là vấn đề của khả năng tìm thấy, mà còn là câu
hỏi về tính kết nối lẫn nhau. Đối với các thư viện
sẽ là thích hợp và để đáp ứng được các thách thức
của môi trường số, các tài nguyên của họ không chỉ
nổi lên bề mặt khi được yêu cầu, mà còn là sẵn
sàng trong các kịch bản khác nhau: như là nội dung được
khuyến cáo, như là thông tin bổ sung, như là nội dung
được cá nhân hóa.
Hơn thế nữa, Dữ liệu
Liên kết xúc tác cho các trải nghiệm tốt hơn, quản lý
các hồ sơ thư viện đúng cho tương lai, bảo tồn và
phục vụ khi nằm trong tâm của các công nghệ như:
-
tìm kiếm thông minh (không chỉ trên web, mà bên trong các bộ sưu tập nội bộ);
-
khuyến cáo nội dung thông minh;
-
các tài nguyên được kết nối;
-
trung tâm của các chủ đề;
-
tích hợp nội dung.
Đã chín muồi trong công
nghệ đáng tin cậy và hiệu quả, Dữ liệu Liên kết có
thể phục vụ cho việc xây dựng các công cụ giúp cho
các thư viện đáp ứng được toàn bộ tập hợp các
thách thức mới, như:
-
Các mức truy cập;
-
Tìm kiếm thông minh;
-
Cá nhân hóa;
-
Lọc;
-
Gốc gác lai lịch (độ tin cậy);
-
Khả năng cầu may (tình cờ phát hiện những bất ngờ và may mắn).
Và tất cả điều này
với sức mạnh của liên kết. Điều rất đơn giản.
Từ việc tạo ra catalog cho tới việc tạo ra kết nối catalog
Trong làn sóng cách mạng số, các thư viện đã bắt đầu nghĩ lại các catalog của họ và định hình lại họ theo những con đường đã được các máy tìm kiếm phổ biến và các nhà bán lẻ trên trực tuyến thiết lập.
Trên web ngày càng gia tăng về dữ liệu
và các mối quan hệ (xem Cooking
Up the Semantic Web), các công nghệ ngữ
nghĩa là chìa khóa mang các khán thính phòng
trờ về các thư viện và làm cho các kho lưu trữ và các
bộ sưu tập của thư viện nhìn thấy được và truy cập
được. Đối với kỷ nguyên thông tin
ngày nay, các thư viện không chỉ lưu giữ và tổ chức
nội dung, mà còn cung cấp các kinh nghiệm phát hiện tri
thức. Họ phải đi suốt con đường
“từ việc làm catalog tới việc liên kết các catalog”
(from cataloguing to catalinking) [sử dụng cụm từ, được
mượn từ một bài trình chiếu đầy đủ thông tin về
Dữ
liệu Liên kết cho các Thư viện của Richard Wallis,
slide số 19]
Triển khai các công nghệ web ngữ
nghĩa có thể xúc tác cho các độc giả để
tìm kiếm các khái niệm, các tài liệu, con người, các
mối quan hệ. Nó đi qua việc kết nối các dữ liệu của
họ bên trong và xuyên qua các tài nguyên, các kho và các
cơ
sở dữ liệu khác mà các thư viện có thể
không chỉ lưu giữ và tổ chức thông tin theo một cách
thức có hiệu quả, mà còn đưa ra những kinh nghiệm phát
hiện tri thức giàu có.
Quan trọng nhất, khi
cung cấp khung chia sẻ các dữ liệu được làm giàu về
ngữ nghĩa, các công nghệ Dữ liệu Liên kết có thể
giúp các thư viện vẫn giữ nguyên là các trung tâm tri
thức mà họ từng luôn là như vậy bằng việc cho phép
họ vẫn giữ là thích hợp và làm cho các tài nguyên thư
viện dễ dàng truy cập được, rốt cuộc nhìn thấy được
nhiều hơn.
Hãy duy trì hội thoại về các cuốn sách,
các độc giả và siêu dữ liệu!
Hãy
gặp chúng tôi ở Hội chợ Sách Luân Đôn để thảo
luận về những lợi ích của Công nghệ Ngữ nghĩa hoặc
tới nghe
Borislav Popov nói về Ontotext và Sameer Shariff của
Impelsys, những người sẽ chia sẻ vài trường hợp điển
hình tuyệt vời trình bày về tầm quan trọng của làm
giàu siêu dữ liệu vì lợi ích của việc làm cho nội
dung thông minh hơn và dễ dàng tìm thấy được hơn.
Content
explosion, an ever transforming publishing industry and an increasing
number of people starting their information quest on the Web are the
factors that drive libraries to reinvent the way they serve the
information needs of their users. The biggest challenge libraries
face today is how to make the wealth of their well-managed and rich
library records easier to access and more visible.
The War With the Forces of Oblivion and Our New Librarians
A book is a fragile creature, it suffers the wear of time, it fears rodents, the elements and clumsy hands. So the librarian protects the books not only against mankind but also against nature and devotes his life to this war with the forces of oblivion.
In the digital
world of constant connectivity, the main forces of oblivion translate
into lack of visibility and poor information retrieval techniques.
That said, the “war with the forces of oblivion” will take not
only trained and devoted librarians but also some algorithms, capable
of fetching relevant results quickly and efficiently.
In the context
of huge collections of heterogenous digital objects, visibility and
efficient information retrieval depend on machines (braced with
semantic web technologies) that do the heavy-lifting of seamlessly
fetching not only electronic books and resources but also concepts
and relationships. And this is where, to protect library’s rich
resources and to make them available to the people who need them,
where they need them, a new breed of librarians – computer programs
– will have to be able to automatically find, select and filter
resources together with analyzing the connections between them and
searching across heterogeneous sources, etc.
For that to
happen, library data need to be structured, well-connected and easy
to access, use and reuse. To save library records from the digital
forces of oblivion, Linked Data technologies come into play.
Linked Data is
the language machines can read and understand in order to seamlessly
fetch results. And not only results in the form of a list, but
anything that might be important and relevant to the information
quest (resources, concepts, topics, ideas).
Linked Data
technologies are unique for they allow software agents to find, share
and integrate information across diverse resources easily and
effectively.
BIBRAME: The Linked Data Alternative for Library Records
If an item does not appear in our records, it does not exist.
Cit. Reel Librarians
In the 1960s, to
create records that could be read by computers and shared among
libraries, a set of digital formats to describe items in a library
catalog have been created. It was called MARC: Machine Readable
Cataloging Records. Today this is the format usually blamed for
locking libraries’ digital knowledge into silos and impeding the
ease of sharing and connecting resources – in a word, for making
them invisible.
In our networked
environments, existing begins with visibility. In terms of data,
visibility is directly related to interconnectedness. With no
connection to the Web and stuck in a data silo, libraries’ records
are hard to find and integrate. It is as if “they don’t exist”.
To unlock library records from their obsolete format (MARC) and help
libraries connect their users to the content they need in an engaging
way, BIBFRAME was created.
In broad
strokes, BIBFRAME is a Linked Data replacement for MARC, laying “a
foundation for the future of bibliographic description, both on the
web, and in the broader networked world”.(Cit.
Library of Congress). It is what can enable library data
interconectedness and ultimately rich knowledge experiences.
For an in-depth
write-up about the milestones on the path from MARC to Linked Data,
check Godby, C. J. and Smith-Yoshimura, K. (2017), From
Records to Things: Managing the Transition from Legacy Library
Metadata to Linked Data.
Visibility with Benefits
Linking library
data together is what can help libraries manage their content in a
cost-effective way and make it visible to their audiences. Using
Linked Data technologies, libraries can present what they have to
offer in an engaging, enriching and above all easy-to-find way.
Both on the Web
and across diverse internal networks, visibility is not only a matter
of findability but also a question of interconnectedness. For
libraries to be relevant and to meet the challenges of the digital
environment, their resources are not only to surface when queried but
to also be available in various scenarios: as recommended content, as
additional information, as personalized content.
Among all other
things, Linked Data enables better experiences, future-proof library
records management, preservation and serving by being in the heart of
technologies such as:
-
intelligent search (not only on the web but within internal collections);
-
smart content recommendation;
-
connected resources;
-
topic hubs;
-
content integration.
Having matured
into a reliable and efficient technology, Linked Data can serve for
building tools that help libraries meet a whole set of novel
challenges such as:
-
Levels of access;
-
Intelligent search;
-
Personalization;
-
Filtering;
-
Provenance (credibility);
-
Serendipity.
And all this
with the power of a link. As simple as that.
From Cataloguing to Catalinking
In the wake of the digital revolution, libraries have started rethinking their catalogues and reshaping them along the lines that have been set by popular search engines and online retailers.
In a web
increasingly about data and relationships (see Cooking
Up the Semantic Web), semantic technologies are key to bringing
audiences back to libraries and making library archives and
collections visible and accessible. For in today’s information age,
libraries are not only to store and organize content but to also
provide knowledge discovery experiences. They do have to walk all the
way “from cataloguing to catalinking” [to use the
expression, borrowed from an informative presentation on Linked
Data for Libraries by Richard Wallis, slide 19]
The deployment
of semantic web technologies can enable readers to search for
concepts, documents, people, relationships. It is through
linking their data within and across other resources, repositories
and databases that libraries can not only store and organize
information in an efficient way but to also provide rich knowledge
discovery experiences.
Most
importantly, providing a framework for sharing semantically enriched
data, Linked Data technologies can help libraries remain the
knowledge hubs they have always meant to be by allowing them to
remain relevant and make library resources easily accessible,
ultimately more visible.
Let’s keep the
conversation about books, readers and metadata going!
Meet
us at the London Book Fair to discuss the benefits of Semantic
Technology or come listen
to Borislav Popov of Ontotext and Sameer Shariff of Impelsys who
will share some great use cases demonstrating the importance of
metadata enrichment for the sake of making content smarter and easily
discoverable.
Dịch:
Lê Trung Nghĩa
Không có nhận xét nào:
Đăng nhận xét
Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.