Không ít người từng gặp hoàn cảnh loa thông minh hay trợ lý trí tuệ nhân tạo (AI) nghe nhầm hoặc hiểu sai. Hoàn cảnh này thường xuyên xảy ra với người có giọng nói không chuẩn.
Công ty Voiceitt của Israel đặt mục tiêu đem lại thay đổi. Bằng cách sử dụng các mô hình giọng nói cá nhân hóa, hệ thống nhận dạng hỗ trợ AI do họ phát triển giúp người khiếm khuyết về giọng nói do bị bại não, hội chứng Down hay đột quỵ giao tiếp hiệu quả hơn với cả con người lẫn thiết bị kỹ thuật số.
Phó chủ tịch Sara Smolley cho biết bà sáng lập Voiceitt xuất phát từ lý do cá nhân. “Bà tôi bị chẩn đoán mắc Parkinson khởi phát sớm. Lúc tôi chào đời bà đã mất hầu hết khả năng vận động và khả năng nói cũng bị ảnh hưởng”, Sara nói.
Hệ thống của công ty ra mắt năm 2021, hoạt động như ứng dụng phiên dịch đơn giản chuyển giọng nói không chuẩn thành âm thanh. AI được đào tạo bằng cách người dùng tự ghi âm lại khoảng 200 cụm từ đơn giản. Ý tưởng ban đầu là tạo điều kiện thuận lợi cho hoạt động giao tiếp trực tuyến, nhưng hiện tại Voiceitt điều chỉnh ứng dụng để phục vụ cả người làm việc từ xa, tích hợp vào WebEx, ChatGPT, Google Chrome giúp chuyển đổi giọng nói không chuẩn thành phụ đề hiển thị trên màn hình. Công ty cũng đang hợp tác với Zoom và Microsoft Teams.
Cá nhân, tổ chức có thể sử dụng hệ thống bằng cách mua giấy phép theo phút hoặc theo người dùng, dao động khoảng 20 - 50 USD. Có cả gói dịch vụ dài hạn cho công sở, cơ sở y tế, cơ sở giáo dục. Bà Smolley cho biết: “Mọi người dùng ứng dụng không phải chỉ để họp trực tuyến mà còn để viết tài liệu, thư điện tử, đăng bài trên LinkedIn cũng như truy cập trình duyệt web bằng giọng nói. Khả năng này mở ra thế giới số cho những người trước đây không được cân nhắc ở một số công việc nhất định, hoặc không thể giao tiếp với đồng nghiệp hay khách hàng”.
Trong số người dùng có nhà sản xuất nội dung Colin Hughes từng làm việc cho đài BBC. Sống chung với chứng loạn dưỡng cơ, hệ thống giúp ông soạn thư điện tử và đọc bài viết dài.
“Tôi thấy ứng dụng đạt độ chính xác ấn tượng với giọng nói không bình thường của tôi. Quá trình đào tạo và thiết lập rất đơn giản. Nhiều người khiếm khuyết về giọng nói, khuyết tật tay cần nhiều hơn một ứng dụng biến giọng nói thành văn bản”, ông chia sẻ. Hughes ủng hộ phát triển tính năng điều khiển con trỏ bằng giọng nói, dùng giọng nói soạn thảo nội dung dài.
Công nghệ nhận dạng giọng nói đạt nhiều tiến bộ đáng kể trong vài năm gần đây. Dự án Trợ năng giọng nói do Viện Khoa học - Công nghệ Beckman (Đại học Illinois) đang thu thập dữ liệu giọng phục vụ công tác viết thuật toán hỗ người có giọng nói không chuẩn. Đầu năm nay hãng Apple tung ra tính năng “Listen for Atypical Speech” tích hợp AI nhận dạng nhiều mẫu giọng nói khác nhau.
Bà Smolley khẳng định Voiceitt tuân thủ quy định của Liên minh châu Âu (EU) về bảo vệ quyền riêng tư, dữ liệu mà công ty lưu trữ đều được ẩn danh và xóa nhận dạng. Nữ phó chủ tịch cho biết: “Chúng tôi muốn mọi người không chỉ độc lập hơn trong cuộc sống và công việc, mà còn có thể tận hưởng công nghệ và vui chơi”.