Là bản dịch sang tiếng Việt tài liệu tóm tắt của Ben Snaith - Nghiên cứu viên cao cấp, Viện Dữ liệu Mở, xuất bản ngày 21/12/2023.
“Giới thiệu
“Không có dữ liệu, không có AI” đã trở thành câu thần chú đối với Viện Dữ liệu Mở - ODI (Open Data Institute), được nêu bật trong quá trình chuẩn bị cho sự kiện Hội nghị thượng đỉnh ODI vào tháng 11 năm 2023. Tuy nhiên, đây là khái niệm được lưu thông từ lâu trong lãnh địa trí tuệ nhân tạo - AI (Artificial Intelligence). Đối với chúng tôi, nó tham chiếu tới cơ sở hạ tầng dữ liệu của AI - bao gồm các tập dữ liệu, các công cụ, tiêu chuẩn, thực hành, và cộng đồng. Đây là lời kêu gọi nhìn vào dữ liệu và nền tảng xã hội - kỹ thuật khác của AI để hiểu tốt hơn thiết kế, kết quả và ý nghĩa của chúng.
Tài liệu tóm tắt này được thiết kế để mở ra cụm từ này và câu trả lời cho câu hỏi có liên quan về làm thế nào và vì sao nhóm nghiên cứu của ODI sẽ nghiên cứu AI lấy dữ liệu làm trung tâm (Data-centric AI) trong một chương trình công việc mới.
Nếu chúng ta nhìn vào vòng đời AI - ngay cả trong sơ đồ trừu tượng dưới đây - nhiều phần tập trung vào dữ liệu! Dữ liệu là nền tảng cho các mô hình AI. Dữ liệu cung cấp thông tin mà một mô hình máy học được đào tạo và học từ đó. Dữ liệu được thu thập, xử lý, giám tuyển, tổng hợp và sau đó được sử dụng trong mô hình. Dữ liệu được sử dụng để kiểm thử và kiểm chuẩn sự thành công của mô hình. Và dữ liệu được nhập vào để sử dụng sau khi mô hình đi vào hoạt động.
Việc xây dựng một hệ thống AI thường liên quan đến việc xác định nguồn cho lượng lớn dữ liệu và việc tạo lập các tập dữ liệu cho đào tạo, kiểm thử, thẩm định, và triển khai. Quá trình này là lặp đi lặp lại theo đó nó có thể đòi hỏi vài vòng đào tạo, kiểm thử và đánh giá cho tới khi kết quả mong muốn đạt được và dữ liệu đóng vai trò quan trọng trong từng bước.
Hình 1. Vòng đời trí tuệ nhân tạo: Từ khái niệm hóa tới sản xuất – ScienceDirect”
Tự do tải về bản dịch sang tiếng Việt của tài liệu có 11 trang tại địa chỉ: https://www.dropbox.com/scl/fi/4un643ygfuksd28fm2v1c/20231221_-_Data-centric_AI_Short_Paper_-_What_do_we_mean_by_without_data_there_3AEHdDW_Vi-08082024.pdf?rlkey=bgkh73tdcn26d3cak5sw8pcbl&st=4v3edaqe&dl=0
Xem thêm:
Blogger: Lê Trung Nghĩa
letrungnghia.foss@gmail.com
Không có nhận xét nào:
Đăng nhận xét
Lưu ý: Chỉ thành viên của blog này mới được đăng nhận xét.