Do nhiều người đọc chú thích hơn là nghe nội dung video, phụ đề trở thành một ngành kinh doanh lớn. Giờ đây, trí tuệ nhân tạo (AI) đang đe dọa thay thế công việc của người viết phụ đề.
Điều này được phản ánh trong lĩnh vực viết chú thích và phụ đề toàn cầu. Theo công cụ theo dõi dữ liệu Valuates Reports, lĩnh vực này có giá trị dưới 300 triệu USD vào năm 2021 và dự kiến sẽ đạt khoảng 500 triệu USD trong năm 2028. Với nhu cầu cao như vậy, không chỉ có số lượng tác giả và công ty viết phụ đề ngày càng tăng mà còn có yếu tố mới tham gia vào lĩnh vực này là AI.
Là công ty khởi nghiệp có trụ sở ở thành phố Gurugram (Ấn Độ), Dubverse.ai sử dụng generative AI để giúp người dùng lồng tiếng và phụ đề cho video của họ sang hơn 90 ngôn ngữ, gồm cả Ấn Độ.
Dù Dubverse.ai ra đời để phục vụ khách hàng edtech (công nghệ giáo dục) trong thời kỳ đại dịch COVID-19, nhưng ngày nay khách hàng của họ bao gồm cả những người sáng tạo nội dung cá nhân, nhà truyền thông và nền tảng phát trực tuyến.
Generative AI là một loại trí tuệ nhân tạo được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn.
Anuja Dhawan, người đồng sáng lập Dubverse.ai, cho biết lợi thế chính là chi phí. “Dù lồng tiếng là một ngành lâu đời nhưng chỉ giới hạn với những khách hàng lớn như các nhà làm phim. Chi phí lồng tiếng lên tới 2.000 Rs mỗi phút (24 USD/phút). Tuy nhiên với AI, chúng tôi có thể giảm chi phí một cách đáng kể xuống mức thấp nhất là 50 Rs mỗi phút (0,6 USD/phút)”, ông nói.
Anuja Dhawan thông báo có 500.000 người dùng đã đăng ký trên nền tảng Dubverse.ai và nói thêm rằng gần 30% trong số họ đến từ bên ngoài Ấn Độ. Dubverse.ai cũng đang trong quá trình giới thiệu sản phẩm của mình cho các nhà sản xuất như Sony.
Để cắt giảm chi phí, các nhà sản xuất và nền tảng phát trực tuyến cũng đang chuyển sang sử dụng AI. Ví dụ Eros Now đã hợp tác với Google Cloud để sử dụng công nghệ AI nhằm phát trực tuyến toàn bộ loạt phim và phim gốc có phụ đề tự động.
Rohit Shivdasani, người sáng lập của Atom Ant Studios, nhà cung cấp dịch vụ hậu kỳ chuyển sang làm phụ đề trong thời đại dịch COVID-19, cho biết sự tăng đột ngột về nhu cầu phụ đề làm cho việc sử dụng AI là điều không thể tránh khỏi.
"Nhu cầu này không chỉ đến từ nội dung mới, mà còn từ hàng trăm chương trình và bộ phim được mua lại bởi các nền tảng phát sóng và thêm vào thư viện của họ. Để phát sóng trực tiếp, phụ đề cần được tạo ra bằng nhiều ngôn ngữ trong cùng một ngày. Con người không thể làm được điều đó", Rohit Shivdasani nói.
Một công ty khởi nghiệp khác trong lĩnh vực phụ đề là Banva, có trụ sở tại thành phố Mumbai, Ấn Độ. Cái tên Banva xuất phát từ ngôn ngữ Marathi, có nghĩa là sáng tạo. Banva không chỉ cung cấp dịch vụ tạo phụ đề dựa trên AI mà còn cả công cụ cho phép người dùng chỉnh sửa phụ đề được tạo một cách nhanh chóng.
Rahul Pawar, người sáng lập Banva, cho biết khoảng 2.000 người đã đăng ký sử dụng dịch vụ của họ. “Dù việc viết phụ đề dựa trên AI cho lĩnh vực giải trí thường gặp khó khăn do sự đa dạng của ngôn ngữ địa phương, khách hàng đang nhận ra rằng một phần mềm như thế này có thể giúp rút ngắn thời gian xử lý rất nhiều và giảm gần 80% khối lượng công việc thủ công”, Rahul Pawar nói.
Giá của Banva hiện nay là 500 Rs để tạo phụ đề cho video dài 1 giờ và hệ thống dựa trên tín dụng cho nhu cầu thời lượng dài hơn (người dùng sẽ phải mua một số lượng tín dụng để sử dụng dịch vụ cho các video dài hơn).
Dubverse.ai có số tiền đăng ký hàng tháng khởi điểm từ 3.000 Rs (0,036 USD). Trong khi mức giá trung bình được tính bởi người viết phụ đề thủ công dao động từ 80 - 100 Rs mỗi phút.
Tuy lĩnh vực viết phụ đề dựa trên AI có triển vọng, vẫn tồn tại nhiều thách thức lớn trong việc hiểu, dịch và viết phụ đề cho kho ngôn ngữ đa dạng ở Ấn Độ. Những khó khăn bao gồm sự thể hiện giới tính của các đối tượng, điều này không có trong tiếng Anh, cũng như các giọng điệu và ngữ cảnh văn hóa khác nhau.
Rahul Pawar cho biết nền tảng Banva đang cố gắng giải quyết những rào cản này. “Rất nhiều nội dung ở Ấn Độ đa ngôn ngữ. Các nhân vật khác nhau đang nói bằng tiếng Hindi, tiếng Anh, tiếng Marathi… Để giải quyết vấn đề đó, chúng tôi đang đào tạo các mô hình của mình để xử lý lời nói đa ngôn ngữ tốt hơn”, ông lý giải.
Tuy nhiên, Rahul Pawar thừa nhận rằng mức độ chính xác sẽ khác nhau với các cặp ngôn ngữ khác nhau. Ví dụ trong khi phụ đề tiếng Anh được tạo cho nội dung tiếng Hindi có độ chính xác gần 90% thì độ chính xác lại thấp hơn với các ngôn ngữ khác. Với phụ đề từ ngôn ngữ vùng này sang ngôn ngữ vùng khác, con đường dẫn đến thành công sẽ dài hơn.
Câu hỏi đang gây rắc rối cho ngành công nghiệp phụ đề và lồng tiếng cũng chính là câu hỏi trọng tâm trong cuộc đình công của nhiều nhà biên kịch ở Hollywood: Liệu AI có thay thế con người trong ngành này không?
Những người viết phụ đề kỳ cựu như Vivek Ranjit tự tin rằng công việc này là một nghệ thuật và không thể thay thế bằng công nghệ.
“Chúng ta không thể dự đoán công nghệ AI sẽ phát triển đến mức nào, nhưng tôi tin rằng chúng ta sẽ luôn cần bàn tay của con người, đặc biệt là ở một quốc gia như Ấn Độ, nơi chúng ta có rất nhiều nền văn hóa khác nhau. Mọi thứ liên tục thay đổi từ trạng thái này sang trạng thái khác và chúng ta có những bài hát với cách diễn đạt không thể dịch theo nghĩa đen”, Vivek Ranjit, người đã viết phụ đề cho hơn 220 bộ phim, cho biết.
Mặt khác, các công ty hoạt động trong lĩnh vực AI cho rằng công nghệ không được thiết kế để tạo ra sự cạnh tranh giữa các nhà viết phụ đề và máy tính, cũng như không nhất thiết phải đạt độ chính xác 100%. Rahul Pawar nói: "Chúng tôi không cố gắng tước bỏ công việc của người viết phụ đề. Chúng tôi chỉ đang cố gắng làm cho công việc của họ dễ dàng hơn mà thôi".