Nvidia đang bị ba tác giả kiện vì sử dụng sách có bản quyền của họ mà không được phép để đào tạo nền tảng trí tuệ nhân tạo (AI) NeMo.
Thế giới số

Sau OpenAI và Microsoft, đến Nvidia bị kiện vì dùng tác phẩm có bản quyền để phát triển AI

Sơn Vân 11/03/2024 10:03

Nvidia đang bị ba tác giả kiện vì sử dụng sách có bản quyền của họ mà không được phép để đào tạo nền tảng trí tuệ nhân tạo (AI) NeMo.

NeMo là bộ công cụ toàn diện, chạy trên nền tảng đám mây, cho phép xây dựng, tùy chỉnh và triển khai các mô hình AI tạo sinh ở bất kỳ đâu. NeMo gồm các bộ khung để đào tạo và và suy luận, bộ công cụ bảo vệ cùng những công cụ quản lý dữ liệu và mô hình được đào tạo sẵn. Nhờ đó, các doanh nghiệp có thể dễ dàng, tiết kiệm chi phí và nhanh chóng áp dụng AI tạo sinh.

AI tạo sinh là một loại AI có mục tiêu chính là tạo ra thông tin mới, thường thông qua quá trình học máy và học sâu. Loại AI này không chỉ giải quyết các nhiệm vụ cụ thể, mà còn có khả năng tạo ra dữ liệu, văn bản, hình ảnh, âm thanh, video và nhiều loại thông tin khác.

Brian Keene, Abdi Nazemian và Stewart O'Nan cho biết các tác phẩm của họ là một phần trong bộ dữ liệu gồm khoảng 196.640 cuốn sách được sử dụng để đào tạo NeMo mô phỏng ngôn ngữ viết thông thường, trước khi bị gỡ xuống vào tháng 10.2023 "do vi phạm bản quyền đã được báo cáo".

Trong đơn kiện tập thể được đệ trình tại tòa án liên bang San Francisco (Mỹ), Brian Keene, Abdi Nazemian và Stewart O'Nan cho biết việc gỡ xuống tác phẩm của ba tác giả này phản ánh Nvidia "thừa nhận" đã đào tạo NeMo trên tập dữ liệu và do đó vi phạm bản quyền của họ.

Ba tác giả đang yêu cầu Nvidia bồi thường thiệt hại cho những người ở Mỹ có các tác phẩm được bảo vệ bản quyền đã giúp đào tạo các mô hình ngôn ngữ lớn của NeMo trong ba năm qua. Trong số các tác phẩm được đề cập ở vụ kiện có tiểu thuyết Ghost Walk năm 2008 của Brian Keene, tiểu thuyết Like a Love Story năm 2019 của Abdi Nazemian và truyện ngắn Last Night at the Lobster năm 2007 của Stewart O'Nan.

Nvidia từ chối bình luận về vụ kiện này. Luật sư của ba tác giả không trả lời ngay lập tức khi được hãng tin Reuters đề nghị bình luận thêm.

Nvidia là công ty lớn mới nhất bị rơi vào các vụ kiện ngày càng tăng của các nhà văn cũng như tờ New York Times liên quan đến AI tạo sinh. Nvidia quảng cáo NeMo là một cách nhanh chóng và tiết kiệm chi phí để áp dụng AI tạo sinh.

Hai công ty nổi tiếng khác từng bị kiện về AI tạo sinh là OpenAI ("cha đẻ" ChatGPT và Sora) và Microsoft (nhà đầu tư lớn nhất vào OpenAI).

Nhu cầu cực lớn về chip AI giúp Nvidia trở thành công ty được các nhà đầu tư yêu thích. Giá cổ phiếu Nvidia đã tăng gần 600% kể từ cuối năm 2022, giúp hãng chip lớn nhất thế giới có trụ sở tại thành phố Santa Clara (bang California, Mỹ) đạt vốn hóa thị trường gần 2.200 tỉ USD.

nvidia-bi-kien-vi-dung-tac-pham-co-ban-quyen-de-phat-trien-ai.jpg
Nvidia đang bị ba tác giả kiện vì sử dụng sách có bản quyền của họ mà không được phép để đào tạo NeMo - Ảnh: Internet

Cuối năm 2023, New York Times, một trong những tờ báo uy tín nhất nước Mỹ, đã gửi đơn kiện OpenAI và Microsoft, cáo buộc hai công ty gây ra hàng tỉ USD thiệt hại cho họ.

New York Times cáo buộc OpenAI và Microsoft đã tự ý thu thập hàng ngàn bài viết do báo này xuất bản để đào tạo các sản phẩm AI.

Đơn kiện của New York Times nêu: "Bằng những công cụ chatbot AI của mình, hai công ty trên đã tìm cách lợi dụng sự đầu tư khổng lồ của New York Times vào sản phẩm báo chí. Qua đó, họ hướng đến việc tạo nên các sản phẩm AI thay thế cho New York Times dù chưa được cho phép hay trả phí".

Trong nhiều tháng qua, vấn đề bản quyền đã trở thành đề tài tranh cãi kịch liệt trong lĩnh vực AI tạo sinh.

Để hoàn thiện sản phẩm AI của mình, các công ty phải cung cấp dữ liệu đầu vào cho mô hình ngôn ngữ lớn và cho phép nó tìm hiểu, điều chỉnh để cải thiện hiệu suất. Quá trình này gọi là đào tạo AI.

Dữ liệu đầu vào thường là thông tin được đăng tải trên các báo, sản phẩm âm nhạc, hội họa... Hầu hết các bên phát triển AI tạo sinh đều thu thập dữ liệu này từ internet mà không xin phép tác giả.

Ngày càng nhiều đơn vị xuất bản, nhạc sĩ, họa sĩ ở Mỹ đang tìm đến các luật sư để yêu cầu các công ty AI phải trả tiền cho việc làm đó.

Hồ sơ tòa án của New York Times khẳng định: "Nếu những tờ báo và tổ chức thông tấn khác không thể sản xuất và bảo vệ sản phẩm báo chí độc lập của mình, sẽ có sự thiếu hụt thông tin mà không máy tính hay AI nào có thể lấp đầy. Càng ít sản phẩm báo chí được viết ra, cái giá xã hội phải trả sẽ càng lớn".

Nguyện vọng của New York Times là OpenAI và Microsoft phải bồi thường, đồng thời ngừng việc dùng nội dung của báo này để đào tạo AI, cũng như hủy những dữ liệu tin bài trên New York Times mà họ từng thu thập.

Dù không yêu cầu cụ thể số tiền bồi thường, New York Times khẳng định hành vi vi phạm của OpenAI và Microsoft có thể dẫn đến "hàng tỉ USD tiền bồi thường theo luật định và thiệt hại thực tế khác".

Khi nhận thông tin về vụ kiện trên, đại diện OpenAI bày tỏ "ngạc nhiên và thất vọng". Công ty này khẳng định vụ kiện vẫn được khởi động dù hai bên đã và đang trao đổi về các vấn đề bản quyền trên. Quá trình đàm phán được OpenAI mô tả là "đang tiến về phía trước với tính xây dựng cao".

Người phát ngôn OpenAI tuyên bố: "Chúng tôi hy vọng sẽ tìm được cách để cả hai có thể hợp tác cùng có lợi, giống những gì công ty đang làm với các đơn vị xuất bản khác".

Trước đó không lâu, nhóm gồm 11 tác giả sách phi hư cấu đã tham gia vụ kiện tại tòa án liên bang ở quận Manhattan (thành phố New York, Mỹ) cáo buộc OpenAI và Microsoft lạm dụng những cuốn sách mà họ viết để đào tạo các mô hình ngôn ngữ lớn đằng sau chatbot ChatGPT và phần mềm AI khác.

Các nhà văn, bao gồm cả người đoạt giải Pulitzer như Taylor Branch, Stacy Schiff và Kai Bird (những người đồng tác giả cuốn tiểu sử về J. Robert Oppenheimer có tên American Prometheus, đã được chuyển thể thành bộ phim Oppenheimer nổi tiếng trong năm nay), nói trước tòa hôm 20.12.2023 rằng hai công ty đã vi phạm bản quyền bằng cách sử dụng tác phẩm của họ để đào tạo các mô hình ngôn ngữ lớn GPT của OpenAI.

Pulitzer là một giải thưởng danh giá được trao hàng năm cho các thành tựu xuất sắc trong lĩnh vực báo chí, văn học và âm nhạc. Pulitzer được thành lập theo di chúc của nhà báo Joseph Pulitzer, đã trở thành một trong những giải thưởng nổi tiếng và được coi là một phần quan trọng của văn hóa văn học và báo chí ở Mỹ. Các tác phẩm được trao giải Pulitzer thường được đánh giá cao về nghệ thuật và ảnh hưởng sâu rộng đến xã hội.

Luật sư Rohit Nath của các nhà văn cho biết: “Các bị cáo đang kiếm được hàng tỉ USD từ việc sử dụng trái phép sách phi hư cấu và tác giả của những cuốn sách này xứng đáng được bồi thường cũng như đối xử công bằng vì hành vi đó”.

Julian Sancton, nhà văn và biên tập viên của trang Hollywood Reporter, lần đầu tiên đệ đơn kiện tập thể vào tháng 11.2023. Sự việc này là một trong số vụ được các nhóm chủ sở hữu bản quyền gồm các tác giả John Grisham, George R.R. Martin và Jonathan Franzen đưa ra chống lại OpenAI và các hãng công nghệ khác về cáo buộc lạm dụng tác phẩm của họ trong đào tạo AI.

Hai công ty đã phủ nhận các cáo buộc. Microsoft đã đầu tư hàng tỉ USD cho OpenAI và tích hợp công nghệ của công ty AI này vào các sản phẩm của mình.

Hồ sơ kiện nêu rằng OpenAI đã "quét" tác phẩm của các tác giả cùng với một lượng lớn tài liệu có bản quyền khác từ internet mà không có sự cho phép, để đào tạo GPT cách phản ứng với truy vấn văn bản từ con người.

Theo hồ sơ kiện, Microsoft đã "tham gia sâu" vào việc đào tạo và phát triển các mô hình ngô ngữ lớn nên cũng phải chịu trách nhiệm về hành vi vi phạm bản quyền.

Nhóm tác giả đã yêu cầu tòa án đưa ra một số tiền bồi thường thiệt hại chưa xác định và ra lệnh cho hai công ty ngừng vi phạm bản quyền của họ.

Bài liên quan
H100 – chip đứng sau sự tăng vốn hóa thị trường thần tốc của Nvidia
Các thành phần máy tính thường không được kỳ vọng sẽ biến đổi toàn bộ doanh nghiệp và ngành công nghiệp, nhưng một bộ xử lý đồ họa (GPU) của Nvidia ra mắt vào năm 2023 đã làm được điều đó.

(0) Bình luận
Nổi bật Một thế giới
Cần Thơ giải ngân hơn 10.468 tỉ đồng vốn đầu tư công năm 2024 như thế nào?
Năm 2024, TP.Cần Thơ được giao kế hoạch vốn đầu tư công hơn 10.468 tỉ đồng, đến nay đã giao chi tiết 8.804 tỉ đồng.
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Sau OpenAI và Microsoft, đến Nvidia bị kiện vì dùng tác phẩm có bản quyền để phát triển AI