Half
of the world’s languages are dying. Should we save them?
What
are the implications of a language falling out of use every two
weeks?
Mỗi
2 tuần 1 ngôn ngữ không còn được sử dụng nữa nói
lên điều gì?
13 Jul 2017, by
Subhashish
Panigrahi
Bài được đưa
lên Internet ngày: 13/07/2017
Hiện có khoảng
7.000
ngôn ngữ đang được sử dụng hôm nay, với 1 ngôn
ngữ đang chết mỗi 2 tuần. UNESCO nói rằng một
nửa các ngôn ngữ trên thế giới có thể biến mất
trong thời gian 1 thế kỷ. Và, ở đất nước Ấn Độ
của tôi, 220
ngôn ngữ đã chết trong vòng 50 năm qua và 197
ngôn ngữ đang gặp nguy hiểm.
Khoa học Mở -
Open
science đang thúc đẩy nghiên cứu khoa học bằng việc
xúc tác cho các cá nhân và các tổ chức cộng tác và
trao đổi tri thức để cải thiện công việc của nhau.
Một lĩnh vực có thể sử dụng dạng trợ giúp này là
các bản ngữ khắp thế giới.
Ưu thế ngôn
ngữ
Như một đứa
trẻ, tôi đã lớn lên trong một thành phố nhỏ ở bang
Odisha của Ấn Độ, nơi ít nhất 30% dân số nói tiếng
Santali,
một ngôn ngữ mà đa số mọi người, phần 70% còn lại
(bao gồm cả gia đình tôi), đã không bao giờ có ý định
học. Đa số dân nói tiếng Odia.
Chúng tôi đã không phải học Santali vì Odia từng được
nói trong trường học và trên thương trường chuyên
nghiệp hơn.
Ưu thế ngôn ngữ
xảy ra, và không phải điều này là không OK, vấn đề
là chúng ta cần chắc chắn chúng ta cũng đang bảo tồn
các ngôn ngữ cổ sao cho chúng ta không đánh mất các câu
chuyện và các mẩu văn hóa là di sản trong ngôn ngữ đó.
Chúng ta có thể làm thế nào đây? Đối với ngôn ngữ
Santali, chúng ta đã chưa được chuẩn bị nên đã cần
phải mất gần 15 năm để tuân thủ phông
chữ Unicode lần đầu tiên (tiêu chuẩn mã hóa vạn
năng và toàn cầu) để được Google phát hành cho nó. Sau
đó, tôi đã dẫn dắt dự
án để xây dựng phông được cấp Giấy phép Phông
Mở - OFL (Open Font License)
cho Santali. (Được thợ in Pooja Saxena của Ấn Độ thiết
kế, và các công cụ nhập đã được Jnanaranjan Sahoo and
Nasim Ali phát triển).
Các ngôn ngữ chết
vì nhiều lý do. Một số lý do là:
-
Trong xã hội đa văn hóa và đa ngôn ngữ, các ngôn ngữ chính thống và/hoặc đa số có ưu thế đang được chính phủ cấp tiền. Chúng được sử dụng để giáo dục trong các trường học và cho nghiên cứu khoa học, ví dụ thế.
-
Thiếu các công cụ số để giúp các xã hội và các nền văn hóa tiếp tục và chia sẻ các bản ngữ, ngôn ngữ thiểu số của họ. Khi việc kể chuyện được thực hiện ngày càng nhiều hơn trên trực tuyến, thì nhu cầu về các công cụ số và các tiêu chuẩn khác trở nên quan trọng hơn.
Cách của nguồn
mở có thể cứu các ngôn ngữ đó như thế nào:
-
Chúng ta cần bản đồ các ngôn ngữ khắp thế giới với các thách thức có liên quan tới việc bảo tồn từng ngôn ngữ.
-
Chúng ta cần các công cụ và các công nghệ cộng tác để làm việc chặt chẽ với các cộng đồng các ngôn ngữ đang gặp nguy hiểm.
-
Chúng ta cần tài nguyên giáo dục mở với các sách chỉ dẫn và các tư liệu khác để huấn luyện mọi người cách làm tài liệu về ngôn ngữ.
-
Chúng ta cần tài liệu nội dung đa phương tiện mở về hiện tại (như, các tin tức về các sự cố và những sự việc khác về kinh tế - xã hội) và quá khứ (văn học dân gian và hiện tượng văn hóa) với chú giải để mở rộng phạm vi các ngôn ngữ.
-
Chúng ta cần các công cụ số để xây dựng các ứng dụng về ngôn ngữ (như Máy học và các công cụ Xử lý Ngôn ngữ Tự nhiên như văn bản - sang - tiếng nói mà có thể được sử dụng để khuếch đại nội dung đa phương tiện và giúp xây dựng các công cụ có khả năng truy cập số như bộ đọc màn hình).
Có công việc đang
được làm, và nhiều công việc hơn phải làm. Việc khai
trương các sáng kiến bảo tồn ngôn ngữ đang diễn ra
hiện nay để bảo tồn các bản ngữ ở các dạng số.
Vài sáng kiến đáng chú ý như:
-
Viện Ngôn ngữ Sống cho các Ngôn ngữ gặp nguy hiểm (Living Tongues Institute for Endangered Languages)
-
Cộng đồng các Kho lưu trữ Ngôn ngữ Mở - OLAC (Open Language Archives Community)
-
TVMalintzi, truyền hình dựa vào YouTube cho Nahuatl
-
Nghiên cứu và làm báo về chủ đề, như Tương lai các ngôn ngữ gặp nguy hiểm của châu Mỹ (The future of America's endangered languages) của Matt Hansen
-
Dự án Toàn cầu về Tính mở (Global Oneness Project)
-
Wikitongues giúp các cộng đồng làm tài liệu cho các câu chuyện kể trên video bằng các bản ngữ
-
Openwords, một ứng dụng nguồn mở học ngôn ngữ
-
Dự án về Tính đa dạng Ngôn ngữ Số - DLDP (Digital Language Diversity Project), xây dựng các OER để bảo tồn ngôn ngữ
-
Kho tàng Chuyện kể về Ngôn ngữ và nhóm các dự án bảo tồn ngôn ngữ khác của nhà ngôn ngữ học Dr. Steven Bird
-
StoryCorps để ghi lại các câu chuyện kể
Xét thấy tỷ lệ
tuyệt diệt ngôn ngữ là quá cao, có nhu cầu can thiệp
liên tục. Cá nhân tôi đã bắt đầu
dự án gọi là OpenSpeaks
để xây dựng các OER và giúp các nhà hoạt động - công
dân tạo ra tài liệu ngôn ngữ đa phương tiện. Tôi
hy vọng tuyển chọn được nội dung cho khán thính phòng
rộng lớn hơn và sử dụng nội dung đó để xây dựng
các công cụ về khả năng truy cập số và khác mà sẽ
giúp cho những người nói tiếng bản địa truy cập tri
thức và đóng góp cho cái chung.
Về tác giả
Subhashish Panigrahi
- Subhashish Panigrahi (@subhapa)
là Người xúc tác Cộng đồng châu Á ở đội Tham gia
của Mozilla, và đang chuyển từ vai trò của anh như là
Nhân viên Chương trình của chương trình của Trung
tâm Truy cập Tri thức Internet
và Xã hội, trước
đó với Chương trình của Ấn Độ của Tổ chức
Wikimedia, anh là nhà
giáo dục ở Ấn
Độ,
There
are currently around 7,000
languages being used today, with one language dying every two
weeks. UNESCO says that half
of the world's languages may vanish in a century's time. And, in my
home country of India, 220
languages have died in the last 50 years and 197
languages are endangered.
Open
science is advancing scientific research by enabling individuals
and organizations to collaborate and exchange knowledge that improves
each other’s work. One area that could use this kind of help is
native languages around the world.
Language
dominance
As
a kid, I grew up in the small town in the Indian state of Odisha
where at least 30% of the population spoke Santali,
a language that the majority of the people, the remaining 70%
(including my family), never attempted to learn. The majority of the
population spoke Odia.
We didn't have to learn Santali because Odia was spoken in school and
in the greater professional marketplace.
Language
dominance happens, and it's not that this isn't okay, it's that we
need to make sure we are preserving the old languages as well so that
we don't lose the stories and bits of culture that are inherent in
that language. How can we do that? For the Santali language, we were
not prepared so it took almost 15 years for the first
Unicode-compliant (a global and universal encoding standard) font
to be released for it by Google. Then, I led a project
to build the second Unicode-compliant and Open
Font License (OFL)-licensed font for Santali. (Designed by Indian
typographer Pooja Saxena, and the input tools were developed by
Jnanaranjan Sahoo and Nasim Ali.)
Languages
die out for multiple reasons. Some are:
-
In a multicultural and multilingual society, official and/or major languages have the advantage of being funded by the government. They are used to educate in schools and for scientific research, for instance.
-
Minority languages are typically spoken by the indigenous natives or by those living in poverty.
-
There is a lack of digital tools to help societies and cultures continue and share their native, minority languages. As storytelling is done more and more online, the need for digital tools and other standards becomes more important.
How
the open source way can save these languages:
-
We need a map of languages around the world with the associated challenges of preserving each language.
-
We need collaboration tools and technologies for working closely with endangered language communities.
-
We need Open Educational Resources for manuals and other materials to train people how to do language documentation.
-
We need documentation of open multimedia content about the present (e.g. news coverage of current incidents and other socio-economic happenings) and the past (folk literature and cultural phenomenon) with annotation to widen the scope of the languages.
-
We need digital tools to build linguistic applications (e.g. Machine Learning and Natural Language Processing tools like text-to-speech that can be used to amplify the multimedia content and help build digital accessibility tools like screenreader).
There
is work being done, and more to do. Groundbreaking language
preservation initiatives are happening now to preserve native
languages in digital forms. Some of the notable ones are:
-
TVMalintzi, a YouTube-based television for Nahuatl
-
Research and journalism on the subject, like The future of America's endangered languages by Matt Hansen
-
Wikitongues that helps communities document video-narratives in native languages
-
Openwords, an open source language learning app
-
Digital Language Diversity Project (DLDP), for building OERs for language preservation
-
Treasure Language Storytelling and a group of other language preservation projects by linguist Dr. Steven Bird
-
StoryCorps for recording storytelling
Considering
the rate of language extinction is so high, there is a need for
constant intervention. I have personally started a project called
OpenSpeaks to
build OERs and help citizen archivists create multimedia language
documentation. I hope to curate content for a broader audience and
use that content to build digital accessibility and other tools that
will help native language speakers access knowledge and contribute to
the commons.
About
the author
Subhashish
Panigrahi - Subhashish Panigrahi (@subhapa)
is the Asia Community Catalyzer at Mozilla's Participation team, and
is transitioning from his role as Programme Officer of the Centre
for Internet and Society's Access
To Knowledge program
Earlier with Wikimedia Foundation's India Program, he is an India
based educator,
Dịch: Lê Trung
Nghĩa