Dịch vụ chuyển đổi văn bản thành giọng nói thông qua trí tuệ nhân tạo (AI) của một công ty Nhật Bản đã được sử dụng cho người bị mất giọng sau khi mổ ung thư.
Trước khi cuộc mổ ung thư diễn ra, dịch vụ tái tạo giọng nói CoeFont sử dụng AI để học biết cao độ và trọng âm tiếng nói, cùng tốc độ nói của người dùng.
Tiếp đó, CoeFont tạo một giọng nói tổng hợp, đọc các văn bản do người dùng nhập vào điện thoại thông minh, và giọng đọc nghe giống như giọng nói gốc của người dùng.
Dịch vụ miễn phí này dược cung cấp bởi công ty CoeFont với chủ tịch là Shogo Hayakawa, một sinh viên năm 3 của Đại học Tokyo và là thành viên Viện Công nghệ Tokyo
Anh cho biết, lúc đầu công ty không tính việc phát triển dịch vụ chuyển văn bản thành giọng nói có AI hỗ trợ vào mục đích hỗ trợ y tế.
Hayakawa đã nhận thiết kế dịch vụ này cho người quay video muốn tải nội dung lên các trang web như YouTube, sử dụng AI để đọc các câu sau khi học biết giọng của người giới thiệu video và các nghệ sĩ.
Sau đó, Hayakawa nhận ra dịch vụ này có khả năng phục vụ cho mục đích y tế, từ lúc bà Michiko Sakai được chẩn đoán bị ung thư khí quản hồi tháng 4.2021.
Ca ung thư đã lan đến dây thần kinh thanh quản, điều có nghĩa bà Sakai không thể nói sau khi giải phẫu.
Vị nữ luật sư 67 tuổi cùng người chồng Masahiko, 68 tuổi, đã tìm ra CoeFont và họ đã đã tìm đến công ty này, từ trước khi Coefont chính thức tạo dịch vụ chuyển văn bản thành giọng nói cho người quay video hồi tháng 7.2021.
Trước khi thực hiện cuộc phẫu thuật, bà Sakai đã đọc 700 câu trong 8 ngày, để AI có thể tái tạo giọng nói của bà. Sau cuộc giải phẫu, bà “nói” bằng cách gõ một câu lên điện thoại thông minh, và giọng nói gốc của bà vang lên từ một loa đặt gần đó. Câu nói nghe trôi chảy, không thể tin được đó là giọng nói được tổng hợp.
Bà Sakai kể: “Sau cuộc giải phẫu, người đầu tiên mà tôi nói chuyện là một y tá ở bệnh viện. Cô ấy bất ngờ khi nghe giọng tôi vẫn như trước, điều tôi rất hài lòng”.
Dịch vụ chuyển văn bản thành giọng nói CoeFont đang gây sự chú ý ở Nhật, với hơn 100 đợt đăng ký tìm hiểu trước khi sử dụng.
Theo một tổ chức tại Tokyo, chuyên đại diện cho người bị mất giọng nói thì Nhật có từ 20.000 đến 30.000 người bị mất giọng do ung thư.
Dù còn các cách nói bằng cách sử dụng dây thần kinh thực quản (thay vì dây thần kinh thanh quản) hoặc bằng một loại máy đặc biệt, nhưng các biện pháp này cần phải tập luyện, và các kết quả thay đổi tùy người.
Masanori Matsuyama, người lập tổ chức trên cho biết, ông hài lòng với dịch vụ chuyển văn bản thành giọng nói CoeFont: “Dù nó đòi hỏi người dùng phải gõ chữ nhưng bất kỳ ai cũng có thể sử dụng dịch vụ này và nói chuyện bằng chính giọng nói của họ”.
Matsuyama hy vọng AI sẽ còn đạt nhiều tiến bộ hơn, tái tạo được bằng cách đọc những chuyển động ở miệng của một người.