Sau khi kiện Stability AI, Getty Images ra mắt trình tạo ảnh AI dựa trên thư viện khổng lồ

Nhịp đập khoa học - Ngày đăng : 14:00, 26/09/2023

Getty Images Holdings phát hành công cụ trí tuệ nhân tạo (AI) sẽ tạo ra hình ảnh từ thư viện nội dung khổng lồ của công ty nhiếp ảnh khổng lồ này.

Đây là một nỗ lực nhằm tạo ra nội dung AI không có vấn đề về bản quyền và quyền sở hữu vốn đã gây ra những tranh cãi cho công nghệ này đến nay.

Nắm giữ bản quyền với hàng triệu bức ảnh, Getty Images Holdings trước đó đã kiện Stability AI, công ty nổi tiếng với công cụ tạo hình ảnh Stable Diffusion, vì sử dụng hình ảnh mà không được phép.

Phát triển với Nvidia - nhà sản xuất chip có giá trị nhất thế giới, sản phẩm mới của Getty Images Holdings sẽ được đào tạo bằng dữ liệu của chính công ty này và sẽ cố gắng vượt qua các vấn đề pháp lý gai góc, một phần bằng cách giới hạn những hình ảnh nào sẽ là nguồn cung cho trình tạo ảnh.

Craig Peters, Giám đốc điều hành Getty Images Holdings, cho biết công cụ mới sẽ khai thác ngân hàng hình ảnh sáng tạo của công ty chứ không phải bộ sưu tập ảnh tin tức, một phần trong nỗ lực ngăn chặn việc tạo ra deepfake.

Deepfake là cụm từ được kết hợp giữa deep learning (học sâu) và fake (giả). Đây là phương thức dùng AI tinh vi tạo ra các sản phẩm công nghệ giả dưới dạng âm thanh, hình ảnh hoặc video.

getty-images-ra-mat-trinh-tao-anh-ai.jpg
Một ví dụ về trình tạo hình ảnh AI của Getty Images 

Craig Peters nói trình tạo hình ảnh mới sẽ không cho phép người dùng sử dụng nội dung đã đăng ký nhãn hiệu mà họ không sở hữu, vì vậy không có cách nào để tạo ra thứ gì đó giống hình ảnh Đức Giáo hoàng Phanxicô mặc áo khoác phồng Balenciaga.

Để phục vụ các doanh nghiệp muốn tạo quảng cáo và nội dung khác, Getty Images Holdings sẽ cho phép khách hàng thêm dữ liệu hoặc thương hiệu độc quyền của riêng họ. Nội dung được tạo thông qua sản phẩm (tạo hình ảnh dựa trên lời nhắc bằng văn bản) sẽ không được thêm vào thư viện của Getty Images Holdings.

Các hình ảnh do AI tạo ra sẽ nhận được giấy phép thông thường của Getty Images Holdings để sử dụng nội dung cũng như đảm bảo chống lại các vụ kiện. Công ty cũng cho biết có kế hoạch bồi thường cho các nghệ sĩ và cộng tác viên có tác phẩm được sử dụng để đào tạo mô hình AI.

Sự phổ biến ngày càng tăng của AI chuyển văn bản thành hình ảnh, chẳng hạn Dall-E của OpenAI, Stable Diffusion và Midjourney, đã đặt ra câu hỏi về việc liệu những công cụ đó có được hưởng lợi từ công việc của nghệ sĩ, nhiếp ảnh gia và nhà thiết kế mà không được họ cho phép hoặc trả thù lao cho họ hay không. Ngoài vụ kiện của Getty Images Holdings chống lại Stability AI, nhiều nghệ sĩ khác nhau đã kiện các dịch vụ, gồm cả Stable Diffusion và Midjourney.

Craig Peters cho biết Getty Images Holdings sẽ tiếp tục đầu tư vào hành động pháp lý chống lại Stability AI ở Mỹ và Anh.

Theo Craig Peters, sự không chắc chắn xung quanh công nghệ đồng nghĩa các công ty muốn sử dụng phần mềm AI để tạo ra hình ảnh mới cho các mục đích như chiến dịch quảng cáo hoặc bài đăng trên mạng xã hội đang lo ngại rằng họ có thể đối diện với nguy cơ pháp lý và vi phạm bản quyền. Ông cũng lưu ý rằng khách hàng của Getty Images Holdings đã nhiều lần nêu ra vấn đề này.

Có những rủi ro thực sự ở đây. Khách hàng muốn sử dụng generative AI nhưng nhưng không muốn rơi vào tình huống nguy cơ như vậy. Chúng tôi thậm chí còn không biết liệu mình có sở hữu thứ này hay không”, Craig Peters nói.

Generative AI là một loại trí tuệ nhân tạo được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn.

Đầu tháng này, Microsoft cho biết sẽ bảo vệ người mua các sản phẩm AI của mình khỏi các vụ kiện vi phạm bản quyền và trả các khoản tiền phạt hoặc giải quyết vấn đề liên quan.

Craig Peters nói dịch vụ mới của Getty Images Holdings cho thấy các công ty AI tuyên bố “không thể phát triển công nghệ khi vẫn tôn trọng quyền sở hữu trí tuệ” là không trung thực.

Ông nói: “Về cơ bản, điều này đe dọa những người tung các mô hình generative AI này ra thị trường nếu không đền bù”.

Hồi tháng 1, Getty Images khởi kiện Stability AI vì cáo buộc thu thập trái phép hàng triệu ảnh có bản quyền của mình với mục đích huấn luyện khả năng xử lý ảnh của AI.

Giống như nhiều công cụ tự động tạo hình ảnh nhờ AI, Stable Diffusion dựa vào kinh nghiệm có được trong quá trình phân tích và xem hàng triệu hình ảnh để tạo ảnh với độ chi tiết cao và chân thực.

Những công cụ mỹ thuật sử dụng AI như Stable Diffusion luôn cần lượng dữ liệu khổng lồ đầu vào và tất cả dữ liệu ấy đều do con người tạo ra. Lúc này, các nhà phát triển AI sẽ quét mạng internet để thu thập dữ liệu, mà không xin phép tác giả của những nội dung số.

Các nhà phát triển AI tranh luận rằng việc thu thập dữ liệu trực tuyến được bảo vệ bởi luật sử dụng công bằng của Mỹ, nhưng nhiều đơn vị nắm bản quyền nội dung số không nghĩ vậy vì coi đó là hành vi vi phạm bản quyền. Các chuyên gia luật cũng không có góc nhìn chung về vấn đề này, dẫn tới việc phải nhờ tới thẩm phán tại toà án phân xử.

OpenAI không công bố nguồn dữ liệu mà hãng thu thập để huấn luyện AI. Còn Stability AI nói rằng quy trình huấn luyện Stable Diffusion dựa vào nguồn dữ liệu mở. Đã có bên độc lập phân tích những nguồn dữ liệu này và đi đến kết luận Stability AI thu thập rất nhiều hình ảnh từ Getty Images cùng những nguồn ảnh khác trên internet.

Bằng chứng là Stable Diffusion luôn có xu hướng tạo ra watermark (logo) giống hệt cả về chi tiết lẫn vị trí trên những ảnh của Getty Images, cho mọi người dùng miễn phí, muốn xoá watermark thì phải trả tiền.

Sơn Vân