Không phải ai cũng thích tương tác với AI bằng giọng nói
Tương tác với AI bằng giọng nói sắp trở thành tương lai không phải ai cũng mong đợi.
2 sự kiện Google I/O cùng WWDC gần đây giới thiệu nhiều tính năng liên quan đến tương tác với AI bằng cách trò chuyện thông qua thiết bị thông minh (điện thoại, kính hoặc tai nghe).
Apple trình bày tất cả những phương thức mới mà con người có thể tương tác với trợ lý ảo Siri nâng cấp. Gemini giờ đây sở hữu năng lực phân tích mẫu lời nói rời rạc như “ừm”, “à” để hiểu được người dùng thực sự muốn gì.
Việc thúc đẩy tương tác bằng giọng nói nghe có vẻ là tiến bộ, nhưng bước đi này dựa trên giả định mọi người đều thoải mái bày tỏ suy nghĩ của bản thân thành tiếng. Cây bút công nghệ trang CNET Jeff Carlson nhấn mạnh thực tế không phải vậy.

Không thể không thừa nhận khả năng tương tác với các mô hình ngôn ngữ lớn (LLM) theo cách đàm thoại là một trong số tiến bộ đáng chú ý ở lĩnh vực trí tuệ nhân tạo thời gian qua. Con người đã chuyển từ đưa ra mệnh lệnh trực tiếp sang phản hồi lại những câu trả lời dài dòng từ AI, LLM giống như đang quá cố gắng trở thành người bạn thân thiết của con người.
Thật dễ dàng xem Gemini hay Siri như thực thể riêng biệt và tương tác với chúng như khi trò chuyện cùng bạn bè khi đang đi bộ, trao đổi ý tưởng qua lại.
Tuy nhiên điểm khác biệt nằm ở chỗ lúc trò chuyện cùng AI, ta đang đứng giữa nơi công cộng và tự nói chuyện với chính mình.
Sẽ có người lập luận rằng điều này giờ đây không còn là vấn đề gì lớn lao nữa. Cảnh người người đeo tai nghe trả lời cuộc gọi hiện vô cùng phổ biến, xã hội bình thường hóa ngôn ngữ cơ thể và hành động nói chuyện điện thoại chẳng cần đưa điện thoại lên tai.
Nhưng không phải ai cũng giỏi diễn đạt bằng lời. Từng thử qua phần mềm soạn thảo văn bản bằng giọng nói, ông Carlson cảm giác nhập liệu bằng ngón tay vẫn tự nhiên hơn. Nói và viết là 2 kỹ năng riêng biệt, ngay cả khi chúng cùng sử dụng 1 ngôn ngữ.
Dùng giọng nói tương tác rất tuyệt vời cho thuyết trình. Ở nhiều trường hợp khác như lái xe với tay phải để trên vô lăng, không dễ dàng nhìn vào màn hình thì giọng nói quả thực rất hữu ích.
Nơi công cộng lại hoàn toàn khác. Việc ai đó bật loa ngoài, lớn tiếng nói đủ mọi chuyện mà chẳng hề quan tâm người xung quanh đã đủ tồi tệ rồi. Liệu ta có thể chấp nhận người khác lớn tiếng tương tác với AI hay không?
Không những vậy AI còn làm mất cơ hội giao tiếp thực sự. Nếu thấy ai đó mặc trang phục đẹp hay dùng thứ gì đó tuyệt vời, ta có thể lịch sự hỏi họ mua ở đâu. Còn giờ đây chỉ cần chụp ảnh rồi hỏi AI mua ở đâu – con người không còn kết nối với nhau nữa, ai cũng như kẻ rình mò chụp ảnh.
Công nghệ phát triển dường như đưa con người hướng tới một thế giới bị bao quanh bởi những cuộc trò chuyện chồng chéo mà không ai thực sự nói chuyện với nhau. Việc nói chuyện liên tục với điện thoại, đồng hồ, kính cùng hàng loạt thiết bị AI khác tạo ra quá nhiều tiếng ồn.