Trí tuệ nhân tạo định giá di sản nghệ thuật tinh vi đến cỡ nào?
Chúng ta hơn trí tuệ nhân tạo (AI) ở việc cảm thụ nghệ thuật nhưng việc phân biệt thật - giả có thể AI làm tốt hơn con người.
Đối với những đôi mắt không chuyên, ranh giới khác biệt giữa ba phiên bản hiện vật của bức tranh "The Lute Player" (Người chơi đàn Lute) dường như là con số không tròn trĩnh. Cả ba tác phẩm đều chia sẻ một bố cục gần như đồng nhất: phác họa một nhân vật trẻ tuổi với đôi mắt nai trong sáng, khoác trên mình bộ áo choàng trắng muốt, tay ôm hờ cây đàn và khẽ ngoảnh mặt đi, tránh ánh nhìn trực diện của người thưởng lãm. Mỗi bức họa đều ánh lên kỹ thuật xử lý ánh sáng và bóng tối (chiaroscuro) bậc thầy - chữ ký thị giác độc quyền của danh họa người Ý Caravaggio.
Tuy nhiên, trong giới sử gia nghệ thuật, từ lâu đã tồn tại một sự đồng thuận bất thành văn: Chỉ có hai phiên bản đang được lưu giữ tại Bảo tàng Hermitage (Nga) và Bộ sưu tập Wildenstein (Pháp) là tuyệt tác nguyên bản do chính tay vị nghệ sĩ thời kỳ Baroque phóng cọ. Phiên bản còn lại, hiện đang thuộc sở hữu của Badminton House (Anh), chỉ đơn thuần là một bản sao chép tinh xảo.

Thế nhưng, trí tuệ nhân tạo (AI) lại vừa đưa ra một phán quyết lật ngược hoàn toàn thế cờ. Vào tháng 9 vừa qua, Art Recognition, một công ty công nghệ AI có trụ sở tại Thụy Sĩ, đã tung ra một tuyên bố gây rúng động: Có đến 86% khả năng bức tranh tại Badminton House thực chất là hàng thật. Không dừng lại ở đó, mô hình AI của họ (vốn được huấn luyện nghiêm ngặt để nhận diện các dấu ấn phong cách cốt lõi của Caravaggio như hình khối, bảng màu và cấu trúc bố cục) còn giáng thêm một đòn đau khi khẳng định rằng phiên bản tại Wildenstein rất có thể chỉ là một bản sao, dù tỷ lệ chắc chắn thống kê thấp hơn đôi chút. Phân tích của hệ thống máy học đã chỉ ra một "sự sai lệch đáng kể" giữa các "đặc điểm thị giác" của bức tranh Wildenstein so với phần còn lại trong di sản nghệ thuật của Caravaggio.
Những phán quyết rúng động giới hàn lâm
Sự vụ "The Lute Player" không phải là lần đầu tiên Art Recognition đưa ra những tuyên bố mang tính thách thức giới tinh hoa nghệ thuật kể từ khi công ty ra mắt vào bảy năm trước. Quay ngược lại năm 2021, giới học thuật từng dậy sóng khi công ty này tính toán rằng có đến 91% khả năng bức tranh "Samson and Delilah" đang được trưng bày trang trọng tại Bảo tàng Quốc gia London hoàn toàn không phải do danh họa Baroque Peter Paul Rubens sáng tác, trái ngược hoàn toàn với sự gán ghép lâu nay. Ở một diễn biến khác, một bức chân dung tự họa bị tranh cãi suốt nhiều thập kỷ của Vincent van Gogh tại Bảo tàng Quốc gia ở Oslo (Na Uy) lại được AI "minh oan" với tỷ lệ 97% là hàng thật.
Một số phân tích khác của công ty lại đưa ra những kết quả phức tạp và đa chiều hơn: Ví dụ, bức "The Polish Rider" (Kỵ sĩ Ba Lan) của Rembrandt được hệ thống kết luận là một tác phẩm "chắp vá", phần lớn do người khác vẽ, nhưng vẫn tồn tại những khu vực lưu giữ dấu vết nét cọ thực sự của vị danh họa Hà Lan, với độ tin cậy dao động từ 69% đến 83%.
Tất nhiên, những phán quyết của Art Recognition không phải lúc nào cũng đi ngược lại với các nghiên cứu học thuật đã được thiết lập vững chắc. Việc xác thực bức tranh của Van Gogh, chẳng hạn, sau đó đã được củng cố bởi các phương pháp nghiên cứu truyền thống, bao gồm phân tích kỹ thuật vật liệu và nghiên cứu chuyên sâu các bức thư tay của nghệ sĩ. (Các chuyên gia bảo tàng cuối cùng đã đi đến kết luận rằng màu sắc ảm đạm và xỉn màu bất thường của bức chân dung đơn giản chỉ là tấm gương phản chiếu trạng thái tinh thần u uất và bất ổn của Van Gogh tại thời điểm đó). Mặc dù vậy, một bộ phận lớn các chuyên gia nghệ thuật gạo cội vẫn duy trì thái độ hoài nghi sâu sắc đối với khả năng của AI trong việc thay thế, hay thậm chí chỉ là bổ trợ, cho các bộ công cụ giám định truyền thống vốn đã tồn tại hàng thế kỷ.
Angelamaria Aceto, một nhà nghiên cứu cấp cao tại Bảo tàng Nghệ thuật & Khảo cổ học Ashmolean thuộc Đại học Oxford, thẳng thắn bày tỏ sự e ngại: "Tôi nghĩ điều này thực sự có vấn đề. Bản thân tôi là người rất cởi mở với công nghệ mới; tôi sử dụng chúng mọi lúc để nhìn thấu những gì mắt thường không thể thấy – để đi sâu xuống dưới bề mặt của những lớp sơn. Tôi hoàn toàn tin tưởng rằng AI là một cỗ máy tuyệt vời trong việc phân tích và cung cấp dữ liệu. Thế nhưng, nghệ thuật thẩm định không chỉ là những con số vô hồn; nó đòi hỏi khả năng đặt sự vật vào đúng bối cảnh lịch sử và tư duy phản biện sâu sắc”.
Bà Aceto nhấn mạnh thêm: "Tôi có thể tìm đến một nhà khoa học bảo tồn để nhờ họ phân tích cấu trúc hóa học của một loại bột màu; tôi có thể yêu cầu một nhiếp ảnh gia cung cấp hình ảnh chụp bằng tia hồng ngoại. Nhưng việc tin rằng AI có thể thay thế được một đôi mắt được đào tạo bài bản và tư duy phản biện của con người? Đối với tôi, đó là một ranh giới không thể bước qua”.
Giải mã cỗ máy phân tích nghệ thuật
Bằng cách kết hợp học máy, mạng nơ-ron sâu (deep neural networks) và các thuật toán thị giác máy tính (computer vision), phương pháp tiếp cận của Art Recognition về mặt lý thuyết có thể được tinh chỉnh để áp dụng cho bất kỳ họa sĩ nào, miễn là họ sở hữu một kho tàng tác phẩm đủ lớn để làm dữ liệu đầu vào. Tính đến thời điểm hiện tại, công ty Thụy Sĩ này đã xây dựng thành công các mô hình AI chuyên biệt cho hơn 200 nghệ sĩ khác nhau.
Quy trình huấn luyện cho mỗi mô hình đòi hỏi cỗ máy phải "tiêu hóa" hai tập dữ liệu hình ảnh (datasets) đối lập nhau: Một tập dữ liệu "dương tính", chứa hình ảnh độ phân giải cao của những bức tranh đã được xác thực không thể tranh cãi (hoặc được giới học thuật công nhận rộng rãi) là của nghệ sĩ đó; và một tập dữ liệu "âm tính" bao gồm những tác phẩm có phong cách tương tự, nhưng được xác định là không chính thống.
Nhóm dữ liệu thứ hai này đóng vai trò như những "cái bẫy" rèn luyện khả năng phân biệt, bao gồm các bức tranh giả mạo đã bị lật tẩy, các bản sao chép do học trò hoặc người hâm mộ vẽ – chẳng hạn như nhóm họa sĩ theo đuổi phong cách Caravaggio vào thế kỷ 17 được gọi là "Caravaggisti" – và thậm chí cả những hình ảnh do chính AI tạo ra bắt chước phong cách của nghệ sĩ gốc.
Carina Popovici, đồng sáng lập kiêm Giám đốc điều hành của Art Recognition, chia sẻ trong một cuộc gọi từ Thụy Sĩ: "Việc duy trì một mức độ tương đồng cực kỳ cao giữa hai tập dữ liệu là yếu tố mang tính sống còn. Chúng tôi thực sự muốn AI phải học được cách phân biệt rạch ròi giữa bản gốc của Caravaggio và một kẻ bắt chước phong cách Caravaggio; hay sự khác biệt mong manh giữa một bức tranh thật của Rubens và một bức tranh gần như y hệt do chính người học việc trong xưởng của ông tạo ra”.
Để ngăn chặn sự thiên kiến (bias) của thuật toán, cả hai tập dữ liệu huấn luyện đều phải đảm bảo sự cân bằng tương đối về chủ đề và thể loại, chẳng hạn như tỷ lệ giữa chân dung, phong cảnh, tĩnh vật hay các khung cảnh tôn giáo. Các nhà phát triển thậm chí còn tạo ra các phiên bản tăng cường (augmented versions) cho mỗi hình ảnh, mô phỏng các điều kiện ánh sáng khác nhau, đồng thời lật hoặc xoay các bức ảnh độ phân giải cao để ép mô hình AI phải làm quen với nhiều cấu hình không gian đa dạng.
Các bức ảnh cũng được chia nhỏ thành những ô vuông nhỏ bé, buộc AI phải xem xét các đặc điểm của tác phẩm nghệ thuật dưới những góc nhìn vi mô hoàn toàn mới. Việc cô lập và quan sát một phần nhỏ bé, tĩnh lặng của bức tranh có thể giúp máy móc học được kết cấu của những nét cọ thanh mảnh nhất, trong khi một cái nhìn tổng thể được thu nhỏ lại sẽ dạy cho nó tư duy về bố cục hình khối hay sự phân bổ màu sắc.
Tuy nhiên, CEO Popovici cũng thẳng thắn thừa nhận một thực tế mang tính đặc thù của công nghệ hộp đen (black-box): không phải lúc nào người ta cũng hiểu rõ bằng cách nào các mô hình này lại có thể đi đến những kết luận cuối cùng.
"Chúng tôi có thể suy đoán về các tham số, nhưng thành thật mà nói, chúng tôi không thực sự, thực sự biết chắc chắn 100%”, bà nói, đồng thời bổ sung rằng sẽ luôn tồn tại "một số kiểu mẫu (patterns) vi tế mà trí tuệ nhân tạo có thể nhìn thấy rõ ràng hơn nhiều so với đôi mắt của con người”.