Hai sinh viên Đại học Harvard (Mỹ), trong đó có một người gốc Việt, khiến thế giới kinh ngạc khi trình diễn công nghệ nhận dạng khuôn mặt bằng kính thông minh Meta Ray-Ban. Giờ đây, bộ đôi này hé lộ những ý tưởng lớn về trí tuệ nhân tạo (AI) trong ngành xây dựng.
Nhịp đập khoa học

Sinh viên Harvard gốc Việt hé lộ các ý tưởng lớn khác ngoài AI nhận dạng khuôn mặt cho kính Meta Ray-Ban

Sơn Vân 20:06 13/10/2024

Hai sinh viên Đại học Harvard (Mỹ), trong đó có một người gốc Việt, khiến thế giới kinh ngạc khi trình diễn công nghệ nhận dạng khuôn mặt bằng kính thông minh Meta Ray-Ban. Giờ đây, bộ đôi này hé lộ những ý tưởng lớn về trí tuệ nhân tạo (AI) trong ngành xây dựng.

AnhPhu Nguyen (gốc Việt, sinh năm 2003 tại thành phố Bảo Lộc, tỉnh Lâm Đồng) và Caine Ardayfio (Mỹ) đã trở thành tâm điểm chú ý trong tháng 10 này nhờ dự án I-Xray của họ.

ngoai-ai-quet-khuon-mat-cho-kinh-meta-ray-ban-sinh-vien-harvard-goc-viet-he-lo-cac-y-tuong-lon-khac3.jpg
AnhPhu Nguyen (trái) và Caine Ardayfio - Ảnh: Getty Images

Cả hai đã đăng bản demo cho thấy phần mềm của họ có thể quét video được quay bằng kính Meta Ray-Ban và ngay lập tức nhận dạng người trong đó bằng cách tìm kiếm thông tin cá nhân trên internet. Cụ thể hơn, sau khi được trang bị phần mềm này, kính Meta Ray-Ban có thể sử dụng camera để quét khuôn mặt của người lạ và lấy tên họ, thậm chí là thông tin như địa chỉ nhà, số điện thoại và các thành viên gia đình nếu người này từng chia sẻ chúng lên internet.

Trong video được đăng trên mạng xã hội X, Caine Ardayfio đeo kính Meta Ray-Ban và tiến gần đến một phụ nữ xa lạ. Kính lúc này tự động quét khuôn mặt, lấy tên và thông tin về mối quan hệ bạn bè của cô, rồi Ardayfio giả vờ rằng biết cô từ trước. Trong video thứ hai, AnhPhu Nguyen gặp một người đàn ông ngẫu nhiên, giả vờ đã đọc một tác phẩm văn học của anh ta dựa trên những thông tin mà kính Meta Ray-Ban cung cấp.

Meta Ray-Ban hiện không có màn hình, song có thể phát trực tiếp các nội dung quay từ camera lên Instagram. AI sẽ theo dõi luồng phát và xác định thời điểm khuôn mặt xuất hiện, sau đó tiến hành tìm kiếm trên internet để tìm thêm ảnh của người đó.

Từ lúc này, AI sẽ tổng hợp các nội dung trực tuyến đã viết, cơ sở dữ liệu đăng ký và thông tin công khai khác. Mọi thứ diễn ra trong khoảng vài phút, được phản hồi trên màn hình smartphone. Trong thử nghiệm của AnhPhu Nguyen và Caine Ardayfio, hàng chục sinh viên Đại học Harvard đã bị xác định danh tính mà không biết AI quét khuôn mặt để tìm thông tin về họ.

Thế nhưng, AnhPhu Nguyen và Caine Ardayfio nói với trang Insider rằng đó không phải là tiện ích công nghệ cao đầu tiên mà họ tạo ra. Cả hai đã thành lập câu lạc bộ AR (thực tế tăng cường)/VR (thực tế ảo) tại Đại học Harvard và nhanh chóng bắt tay vào làm các dự án thực tế trong năm thứ hai. Bây giờ họ đã là sinh viên năm ba.

"Chúng tôi đã sống trong tòa nhà khoa học và kỹ thuật suốt cả một mùa hè và chỉ xây dựng các dự án ngẫu nhiên. Đầu tiên là súng phun lửa, nhưng sau đó chúng tôi đã chế tạo một ván trượt điện mà bạn có thể điều khiển bằng ngón tay. Chúng tôi chế tạo một xúc tu, giống như xúc tu robot, dài khoảng 4 feet (1,21m) và có thể di chuyển trong không khí", Caine Ardayfio kể.

ngoai-ai-quet-khuon-mat-cho-kinh-meta-ray-ban-sinh-vien-harvard-goc-viet-he-lo-cac-y-tuong-lon-khac.jpg
AnhPhu Nguyen với ván trượt điện hỗ trợ AI - Ảnh: Instagram

Thông qua câu lạc bộ AR/VR, họ tiếp cận được kính Meta Ray-Bans. Cả hai còn tích hợp AI vào kính AR có thể kiểm tra tính xác thực của tuyên bố từ người dùng trong cuộc tranh luận theo thời gian thực.

AnhPhu Nguyen cho biết anh "luôn ưu tiên các dự án hơn một chút so với GPA của mình vì không thực sự muốn vào học cao học ngay lập tức".

GPA (Grade Point Average) là điểm trung bình học tập, thường được sử dụng trong các hệ thống giáo dục để đánh giá kết quả học tập của học sinh, sinh viên. GPA được tính bằng cách lấy tổng số điểm đạt được của các môn học chia cho tổng số môn học đã tham gia.

Theo trang Insider, AnhPhu Nguyen và Caine Ardayfio có những ý tưởng lớn cho các sản phẩm AI trong lĩnh vực sản xuất, xây dựng và công nghệ công nghiệp.

Những tiến bộ với các mô hình ngôn ngữ lớn như GPT của OpenAI và Claude của Anthropic trong năm qua đã cho phép các cải tiến nhanh hơn "theo cách mà trước đây bạn chưa từng làm được", Caine Ardayfio nói.

Ví dụ, nếu robot xây dựng tự động đang cố gắng đào cái hố nhưng bị một người đứng cản đường, trước đây nó sẽ cần kỹ sư để lập trình chính xác mọi chuyển động để tránh người đó, theo Caine Ardayfio. Trong khi đó, robot xây dựng với khả năng suy luận từ mô hình ngôn ngữ lớn có thể tự nghĩ: "Tôi sẽ đợi người này vài giây cho đến khi họ di chuyển, và nếu họ không di chuyển thì tôi sẽ làm điều này".

"Bạn có thể kỳ vọng rằng bất cứ hành động nào nó làm sẽ rất hợp lý. Điều đó thực sự rất đáng kinh ngạc và về cơ bản là một khả năng chỉ tồn tại trong 6 tháng qua", Caine Ardayfio nhấn mạnh.

AnhPhu Nguyen chia sẻ về AI nhận dạng khuôn mặt cho kính Meta Ray-Ban

Chuyển đến Mỹ từ năm 6 tuổi, AnhPhu Nguyen đang học ngành Công nghệ Tăng cường Năng lực con người (Human Augmentation) tại Đại học Harvard.

Về AI nhận dạng khuôn mặt cho kính Meta Ray-Ban, AnhPhu Nguyen nói: "Gần như không thể phân biệt được Meta Ray-Ban với kính thông thường. Đây là yếu tố lý tưởng để ghi hình người đối diện mà không bị nghi ngờ. Tuy nhiên, phần quan trọng nhất của dự án chủ yếu là phần mềm, vì chúng tôi thậm chí có thể chỉ cần sử dụng camera smartphone. Ngày nay, camera smartphone có thể zoom tới 50x hoặc hơn".

Theo AnhPhu Nguyen, anh và Caine Ardayfio xây dựng phần mềm trong khoảng 4 ngày. Trong thời gian còn lại, cả hai thu thập phản hồi và viết báo cáo về cách xóa thông tin cá nhân sau khi thu thập.

"Chúng tôi sử dụng PimEyes - công cụ tìm kiếm nhận dạng khuôn mặt hiệu quả nhất hiện nay; một mô hình ngôn ngữ lớn khác làm nhiệm vụ tra cứu thông tin chi tiết về người khác trên web; phần mềm còn lại là FastPeopleSearch cung cấp thêm thông tin. Toàn bộ quá trình thiết lập tự động, nhờ vào AI", AnhPhu Nguyen cho hay.

AnhPhu Nguyen nói cả hai tham gia vào mọi công đoạn của công việc nhằm hiểu rõ họ đang làm gì. Ban đầu, phần mềm chạy chậm, khoảng 1,5 phút cho mỗi kết quả nên khá mất thời gian. Cả hai thực hiện hàng loạt tinh chỉnh nhằm giúp hệ thống đưa ra phản hồi tốt và chính xác. Hiện tại, tốc độ phản hồi chỉ còn dưới 20 giây.

Sau khi một số trang công nghệ đưa tin về dự án I-Xray, nhiều cuộc tranh cãi trên mạng đã diễn ra. Một số người cho rằng công nghệ này có thể được dùng trong an ninh hoặc thương mại. Tuy nhiên, không ít người lo ngại nó có thể bị lạm dụng cho mục đích xấu hay gây ảnh hưởng đến quyền riêng tư.

Theo AnhPhu Nguyen, dự án I-Xray nhằm mục đích nâng cao nhận thức về những gì có thể làm được với công nghệ tiêu dùng ngày nay chỉ bằng các công cụ có sẵn và công khai, gồm phần mềm tìm kiếm khuôn mặt, mô hình ngôn ngữ lớn và cơ sở dữ liệu công cộng. Cả hai sinh viên Đại học Harvard cho biết không có kế hoạch phát hành bất kỳ loại sản phẩm hoặc mã nguồn nào về dự án.

Dù vậy, AnhPhu Nguyen đang ấp ủ ý tưởng công nghệ mang đến lợi ích cho con người. "Tôi đang làm rất nhiều thứ từ hệ thống theo dõi thói quen đến thiết bị đeo, cũng như xem xét các công nghệ công nghiệp và sớm biến nó thành ý tưởng khởi nghiệp", anh thổ lộ.

Tại hội nghị Connect cuối tháng 9, Meta Platforms đã giới thiệu phiên bản mới nhất của kính thông minh Ray-Ban. Không giống kính thực tế hỗn hợp Apple Vision Pro, đây không phải là kỳ tích kỹ thuật và không cố gắng trở thành một thiết bị AR thực sự. Thế nhưng, kính thông minh Ray-Ban thu hút được người tiêu dùng nhờ sự kết hợp giữa thiết kế bóng bẩy, các tính năng hữu ích và tiếp thị hiệu quả.

Ban đầu không được quan tâm nhiều nhưng kính thông minh Meta Ray-Ban đã gây sự chú ý vào năm ngoái sau khi được Meta Platforms bổ sung trợ lý AI. Công ty mẹ Facebook đã công bố những cải tiến về AI cho kính Meta Ray-Ban trong năm nay, chẳng hạn giúp người dùng có thể quét mã QR và phát nhạc từ Spotify để phản hồi gợi ý bằng giọng nói.

Cuối năm nay, Meta Platforms có kế hoạch bổ sung khả năng tạo video và dịch ngôn ngữ theo thời gian thực giữa tiếng Anh và tiếng Pháp, tiếng Ý hoặc tiếng Tây Ban Nha cho kính Meta Ray-Ban.

Tại hội nghị Connect, Mark Zuckerberg (Giám đốc điều hành Meta Platforms) đã trò chuyện trực tiếp với võ sĩ MMA Brandon Moreno (Mexico) để trình diễn công cụ ngôn ngữ, trong đó chiếc kính có thể dịch từ tiếng Anh sang tiếng Tây Ban Nha và ngược lại.

Điểm nhấn tại hội nghị Connect là việc Meta Platforms trình diễn nguyên mẫu kính AR mang tên Orion. Thiết bị này vẫn chưa sẵn sàng cho người tiêu dùng, nhưng vẫn có thể là thứ gần nhất mà chúng ta từng thấy về cặp kính AR thực tế. Orion cung cấp trường nhìn với phạm vi ấn tượng là 70 độ (không chênh lệch nhiều so với Vision Pro) và dựa vào hình thức điều khiển bằng mắt lẫn tay thanh lịch. Ý tưởng cuối cùng là thay thế smartphone bằng thứ gì đó mà bạn có thể thoải mái đeo trên mặt cả ngày.

"Đây là thế giới vật lý với các hình ảnh ba chiều (3D) được phủ lên trên đó. Hiện tại, tôi nghĩ cách đúng đắn để nhìn nhận Orion là như một cỗ máy thời gian. Những chiếc kính này tồn tại, chúng thật tuyệt vời và là cái nhìn thoáng qua về tương lai mà tôi nghĩ sẽ rất thú vị", Mark Zuckerberg nói sau khi rút Orion ra khỏi hộp kim loại.

Kính Orion làm bằng hợp kim ma giê và được cung cấp sức mạnh bởi silicon tùy chỉnh do Meta Platforms thiết kế. Người dùng sẽ có thể tương tác với kính Orion thông qua theo dõi bằng tay, giọng nói và giao diện thần kinh dựa trên cổ tay. Mark Zuckerberg cho biết Meta Platforms có kế hoạch làm cho kính Orion nhỏ hơn, đẹp hơn và chi phí thấp hơn trước khi phát hành cho người tiêu dùng sau này.

Tỷ phú 40 tuổi người Mỹ định vị công nghệ AR như một kiệt tác khi chuyển hướng công ty truyền thông xã hội lớn nhất thế giới sang xây dựng các hệ thống metaverse nhập vai vào năm 2021. Tuy nhiên, việc cung cấp sản phẩm đã bị cản trở bởi chi phí phát triển cao và các rào cản công nghệ.

Paolo Pescatore, nhà phân tích tại hãng PP Foresight, nói không có nghi ngờ gì về tham vọng của Meta Platforms trong việc tạo ra các sản phẩm VR và AR trở nên phổ biến với giá cả phải chăng nhất có thể. Thế nhưng, ông nói thêm rằng người dùng "vẫn e ngại với AI" và cần được thuyết phục.

Meta Platforms đặt mục tiêu giao chiếc kính AR thương mại đầu tiên đến tay người tiêu dùng vào năm 2027, thời điểm mà những đột phá về mặt kỹ thuật sẽ giúp giảm chi phí sản xuất.

Mark Zuckerberg không trình diễn trực tiếp khả năng của kính Orion trong hội nghị Connect, thay vào đó ông phát một video cho thấy nhiều người phản ứng như thế nào với thiết bị này khi họ dùng thử. Video cho thấy vài hình ảnh thoáng qua về tin nhắn văn bản, hình ảnh được hiển thị qua kính và Jensen Huang (Giám đốc điều hành Nvidia) là cái tên nổi bật trong số những người thử nghiệm.

Bài liên quan
Đằng sau việc CEO Nvidia ca ngợi kính thực tế tăng cường Orion của Meta
Jensen Huang, Giám đốc điều hành Nvidia, là một trong số nhiều tên tuổi lớn đã thử nghiệm nguyên mẫu kính thực tế tăng cường Orion của Meta Platforms trong video được trình chiếu tại hội nghị Connect hôm 25.9.

(0) Bình luận
Nổi bật Một thế giới
Bài viết của Tổng Bí thư, Chủ tịch nước Tô Lâm về chống lãng phí
2 giờ trước Sự kiện
Thông tấn xã Việt Nam (TTXVN) trân trọng giới thiệu nội dung bài viết: “Chống lãng phí” của Tổng Bí thư Ban Chấp hành Trung ương Đảng Cộng sản Việt Nam, Chủ tịch nước Cộng hòa xã hội chủ nghĩa Việt Nam Tô Lâm:
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Sinh viên Harvard gốc Việt hé lộ các ý tưởng lớn khác ngoài AI nhận dạng khuôn mặt cho kính Meta Ray-Ban