AI làm 'Google dịch', giúp giải mã ngôn ngữ động vật
Khoa học - công nghệ - Ngày đăng : 16:02, 04/09/2022
Thông thường, trí tuệ nhân tạo (AI) học hỏi thông qua hoạt động huấn luyện với dữ liệu cung cấp bởi nhiều nguồn như internet hay sách điện tử. Với mô hình ngôn ngữ của con người thì cách thức huấn luyện thường là đưa ra một câu nhiều chỗ trống yêu cầu điền từ. Hiện nay, có vài cách sáng tạo hơn, chẳng hạn như ghép lời nói khớp với hoạt động của não.
Thế nhưng, phân tích ngôn ngữ động vật lại hoàn toàn khác. Giới khoa học máy tính phải hướng dẫn chương trình phần mềm tìm dữ liệu gì, tổ chức dữ liệu như thế nào? Quy trình này không chỉ dựa vào tích lũy lượng lớn dữ liệu âm thanh mà còn đòi hỏi ghép dữ liệu với hành vi xã hội trực quan của động vật.
Ví dụ, một nhóm nghiên cứu dơi ăn quả Ai Cập ghi lại hình ảnh bầy dơi để cung cấp ngữ cảnh cho dữ liệu âm thanh mà họ thu được. Một nhóm khác nghiên cứu cá voi dự tính dùng video, âm thanh, thẻ theo dõi ghi lại chuyển động để giải mã cú pháp, ngữ nghĩa và cuối cùng là ý nghĩa đằng sau những gì cá voi đang giao tiếp. Vài nhóm thì đề nghị phát lại dữ liệu âm thanh cho động vật nghe và xem chúng phản ứng ra sao!
Tạo ra “Google dịch” cho động vật là dự án đầy tham vọng được thực hiện trong nửa thập kỷ qua. Máy học đến nay đã có thể xác định sự hiện diện của động vật, thậm chí nhận diện chính xác động vật bằng tiếng gọi. Mặc dù vậy, chương trình phần mềm vẫn chưa thể hiểu hết sắc thái phức tạp của ngôn ngữ động vật.
Nhiều người chỉ ra, mô hình ngôn ngữ AI còn thiếu sót trong hiểu quan hệ giữa từ ngữ với đối tượng mà từ ngữ đề cập đến. Giới khoa học cũng chưa hiểu hết về thế giới động vật. AI hiện dựa vào việc lập bản đồ mối quan hệ giữa từ ngữ và ngữ cảnh, các mô hình có sai sót riêng.
Một yếu tố khác là giao tiếp động vật có thể không hoạt động giống giao tiếp của con người, nhân hóa chúng có thể làm sai lệch kết quả.
Có đề xuất sử dụng thuật toán máy học tự giám sát để phân tích dữ liệu âm thanh, máy tính cho nhà khoa học biết mô thức ngôn ngữ thể hiện trong dữ liệu phân tích.