Thứ Hai, 31 tháng 7, 2017

Một nửa số ngôn ngữ trên thế giới đang chết. Liệu chúng ta có nên cứu chúng?


Half of the world’s languages are dying. Should we save them?
What are the implications of a language falling out of use every two weeks?
Mỗi 2 tuần 1 ngôn ngữ không còn được sử dụng nữa nói lên điều gì?
13 Jul 2017, by Subhashish Panigrahi
Bài được đưa lên Internet ngày: 13/07/2017


Hiện có khoảng 7.000 ngôn ngữ đang được sử dụng hôm nay, với 1 ngôn ngữ đang chế mỗi 2 tuần. UNESCO nói rằng một nửa các ngôn ngữ trên thế giới có thể biến mất trong thời gian 1 thế kỷ. Và, ở đất nước Ấn Độ của tôi, 220 ngôn ngữ đã chết trong vòng 50 năm qua197 ngôn ngữ đang gặp nguy hiểm.
Khoa học Mở - Open science đang thúc đẩy nghiên cứu khoa học bằng việc xúc tác cho các cá nhân và các tổ chức cộng tác và trao đổi tri thức để cải thiện công việc của nhau. Một lĩnh vực có thể sử dụng dạng trợ giúp này là các bản ngữ khắp thế giới.
Ưu thế ngôn ngữ
Như một đứa trẻ, tôi đã lớn lên trong một thành phố nhỏ ở bang Odisha của Ấn Độ, nơi ít nhất 30% dân số nói tiếng Santali, một ngôn ngữ mà đa số mọi người, phần 70% còn lại (bao gồm cả gia đình tôi), đã không bao giờ có ý định học. Đa số dân nói tiếng Odia. Chúng tôi đã không phải học Santali vì Odia từng được nói trong trường học và trên thương trường chuyên nghiệp hơn.
Ưu thế ngôn ngữ xảy ra, và không phải điều này là không OK, vấn đề là chúng ta cần chắc chắn chúng ta cũng đang bảo tồn các ngôn ngữ cổ sao cho chúng ta không đánh mất các câu chuyện và các mẩu văn hóa là di sản trong ngôn ngữ đó. Chúng ta có thể làm thế nào đây? Đối với ngôn ngữ Santali, chúng ta đã chưa được chuẩn bị nên đã cần phải mất gần 15 năm để tuân thủ phông chữ Unicode lần đầu tiên (tiêu chuẩn mã hóa vạn năng và toàn cầu) để được Google phát hành cho nó. Sau đó, tôi đã dẫn dắt dự án để xây dựng phông được cấp Giấy phép Phông Mở - OFL (Open Font License) cho Santali. (Được thợ in Pooja Saxena của Ấn Độ thiết kế, và các công cụ nhập đã được Jnanaranjan Sahoo and Nasim Ali phát triển).
Các ngôn ngữ chết vì nhiều lý do. Một số lý do là:
  • Trong xã hội đa văn hóa và đa ngôn ngữ, các ngôn ngữ chính thống và/hoặc đa số có ưu thế đang được chính phủ cấp tiền. Chúng được sử dụng để giáo dục trong các trường học và cho nghiên cứu khoa học, ví dụ thế.
  • Các ngôn ngữ thiểu số thường được dân bản xứ hoặc những người sống trong bần hàn nói.
  • Thiếu các công cụ số để giúp các xã hội và các nền văn hóa tiếp tục và chia sẻ các bản ngữ, ngôn ngữ thiểu số của họ. Khi việc kể chuyện được thực hiện ngày càng nhiều hơn trên trực tuyến, thì nhu cầu về các công cụ số và các tiêu chuẩn khác trở nên quan trọng hơn.
Cách của nguồn mở có thể cứu các ngôn ngữ đó như thế nào:
  • Chúng ta cần bản đồ các ngôn ngữ khắp thế giới với các thách thức có liên quan tới việc bảo tồn từng ngôn ngữ.
  • Chúng ta cần các công cụ và các công nghệ cộng tác để làm việc chặt chẽ với các cộng đồng các ngôn ngữ đang gặp nguy hiểm.
  • Chúng ta cần tài nguyên giáo dục mở với các sách chỉ dẫn và các tư liệu khác để huấn luyện mọi người cách làm tài liệu về ngôn ngữ.
  • Chúng ta cần tài liệu nội dung đa phương tiện mở về hiện tại (như, các tin tức về các sự cố và những sự việc khác về kinh tế - xã hội) và quá khứ (văn học dân gian và hiện tượng văn hóa) với chú giải để mở rộng phạm vi các ngôn ngữ.
  • Chúng ta cần các công cụ số để xây dựng các ứng dụng về ngôn ngữ (như Máy học và các công cụ Xử lý Ngôn ngữ Tự nhiên như văn bản - sang - tiếng nói mà có thể được sử dụng để khuếch đại nội dung đa phương tiện và giúp xây dựng các công cụ có khả năng truy cập số như bộ đọc màn hình).
Có công việc đang được làm, và nhiều công việc hơn phải làm. Việc khai trương các sáng kiến bảo tồn ngôn ngữ đang diễn ra hiện nay để bảo tồn các bản ngữ ở các dạng số. Vài sáng kiến đáng chú ý như:
Xét thấy tỷ lệ tuyệt diệt ngôn ngữ là quá cao, có nhu cầu can thiệp liên tục. Cá nhân tôi đã bắt đầu dự án gọi là OpenSpeaks để xây dựng các OER và giúp các nhà hoạt động - công dân tạo ra tài liệu ngôn ngữ đa phương tiện. Tôi hy vọng tuyển chọn được nội dung cho khán thính phòng rộng lớn hơn và sử dụng nội dung đó để xây dựng các công cụ về khả năng truy cập số và khác mà sẽ giúp cho những người nói tiếng bản địa truy cập tri thức và đóng góp cho cái chung.
Về tác giả
Subhashish Panigrahi - Subhashish Panigrahi (@subhapa) là Người xúc tác Cộng đồng châu Á ở đội Tham gia của Mozilla, và đang chuyển từ vai trò của anh như là Nhân viên Chương trình của chương trình của Trung tâm Truy cập Tri thức Internet và Xã hội, trước đó với Chương trình của Ấn Độ của Tổ chức Wikimedia, anh là nhà giáo dục ở Ấn Độ,
There are currently around 7,000 languages being used today, with one language dying every two weeks. UNESCO says that half of the world's languages may vanish in a century's time. And, in my home country of India, 220 languages have died in the last 50 years and 197 languages are endangered.
Open science is advancing scientific research by enabling individuals and organizations to collaborate and exchange knowledge that improves each other’s work. One area that could use this kind of help is native languages around the world.
Language dominance
As a kid, I grew up in the small town in the Indian state of Odisha where at least 30% of the population spoke Santali, a language that the majority of the people, the remaining 70% (including my family), never attempted to learn. The majority of the population spoke Odia. We didn't have to learn Santali because Odia was spoken in school and in the greater professional marketplace.
Language dominance happens, and it's not that this isn't okay, it's that we need to make sure we are preserving the old languages as well so that we don't lose the stories and bits of culture that are inherent in that language. How can we do that? For the Santali language, we were not prepared so it took almost 15 years for the first Unicode-compliant (a global and universal encoding standard) font to be released for it by Google. Then, I led a project to build the second Unicode-compliant and Open Font License (OFL)-licensed font for Santali. (Designed by Indian typographer Pooja Saxena, and the input tools were developed by Jnanaranjan Sahoo and Nasim Ali.)
Languages die out for multiple reasons. Some are:
  • In a multicultural and multilingual society, official and/or major languages have the advantage of being funded by the government. They are used to educate in schools and for scientific research, for instance.
  • Minority languages are typically spoken by the indigenous natives or by those living in poverty.
  • There is a lack of digital tools to help societies and cultures continue and share their native, minority languages. As storytelling is done more and more online, the need for digital tools and other standards becomes more important.
How the open source way can save these languages:
  • We need a map of languages around the world with the associated challenges of preserving each language.
  • We need collaboration tools and technologies for working closely with endangered language communities.
  • We need Open Educational Resources for manuals and other materials to train people how to do language documentation.
  • We need documentation of open multimedia content about the present (e.g. news coverage of current incidents and other socio-economic happenings) and the past (folk literature and cultural phenomenon) with annotation to widen the scope of the languages.
  • We need digital tools to build linguistic applications (e.g. Machine Learning and Natural Language Processing tools like text-to-speech that can be used to amplify the multimedia content and help build digital accessibility tools like screenreader).
There is work being done, and more to do. Groundbreaking language preservation initiatives are happening now to preserve native languages in digital forms. Some of the notable ones are:
Considering the rate of language extinction is so high, there is a need for constant intervention. I have personally started a project called OpenSpeaks to build OERs and help citizen archivists create multimedia language documentation. I hope to curate content for a broader audience and use that content to build digital accessibility and other tools that will help native language speakers access knowledge and contribute to the commons.
About the author
Subhashish Panigrahi - Subhashish Panigrahi (@subhapa) is the Asia Community Catalyzer at Mozilla's Participation team, and is transitioning from his role as Programme Officer of the Centre for Internet and Society's Access To Knowledge program Earlier with Wikimedia Foundation's India Program, he is an India based educator,
Dịch: Lê Trung Nghĩa

Không có nhận xét nào:

Đăng nhận xét

Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.