Sam Altman, Giám đốc điều hành OpenAI, không ngại khuấy động cuộc đua trí tuệ nhân tạo (AI) và bài đăng mới nhất của ông trên mạng xã hội X nhắm vào Google.
OpenAI và Google đã tổ chức sự kiện lớn nhất của họ trong năm 2024 cho đến nay, cách nhau một ngày, với AI là chủ đề chính.
Rạng sáng 14.5 giờ Việt Nam, OpenAI giới thiệu mô hình AI đa phương thức mới nhất GPT-4o, có khả năng trò chuyện bằng giọng nói theo thời gian thực, tương tác với văn bản và hình ảnh. Một ngày sau, Google công bố nhiều bản cập nhật cho các mô hình AI của mình, gồm cả tác nhân AI mới mang tên Project Astra và cải tiến công cụ tìm kiếm.
Thay vì nhắm vào các sản phẩm AI của Google, Sam Altman lại chê bai đối thủ về tính thẩm mỹ. Doanh nhân 39 tuổi người Mỹ đã đăng trên X (trước đây là Twitter) hình ảnh so sánh sự kiện của OpenAI và Google I/O.
"Tôi cố gắng không nghĩ quá nhiều về đối thủ cạnh tranh, nhưng không thể ngừng suy nghĩ về sự khác biệt về thẩm mỹ giữa OpenAI và Google", Sam Altman viết.
Bên trái, các nhà nghiên cứu của OpenAI ngồi trên ghế sofa trong ánh đèn mờ, trình diễn GPT-4o mới trong văn phòng mang phong cách hồi giữa thế kỷ 20, tạo nên không khí ấm cúng và thân mật. Bên phải, sân khấu ngoài trời rộng lớn của Google gần giống như một phim trường. Hình ảnh cho thấy một đám đông nhỏ trước sân khấu I/O được chiếu sáng rực rỡ với cửa sổ và đám mây giả cùng màu sắc cầu vồng nổi tiếng của Google trên bức tường phía sau.
Ý của Sam Altman rất rõ ràng: Sự kiện của OpenAI trông tinh tế, đơn giản và gần gũi hơn, trong khi Google I/O lại có quy mô lớn hơn, hoành tráng hơn, giống buổi trình diễn lớn.
Cấu trúc và phong cách tổng thể của cả hai sự kiện cũng khác nhau. Google I/O 2024 kéo dài gần 2 giờ, có sự tham gia của nhạc sĩ Marc Rebillet nổi tiếng trên TikTok và YouTube để hâm nóng đám đông với sự trợ giúp của AI.
Sự kiện OpenAI giới thiệu GPT-4o diễn ra dưới 30 phút và được tổ chức tại văn phòng của họ.
Google I/O có sự góp mặt của hơn nửa tá diễn giả, gồm cả Giám đốc điều hành Alphabt - Sundar Pichai, người khai mạc sự kiện và phát biểu khi bế mạc. Trong khi đó, OpenAI chỉ có vài diễn giả và Sam Altman không bao giờ xuất hiện ở buổi livestream.
Ít nhất một nhân viên Google đã nhanh chóng chế giễu Giám đốc điều hành OpenAI. Chưa đầy hai giờ sau bài đăng của Sam Altman trên X, Zachary Nado (có hồ sơ ghi nhận là kỹ sư nghiên cứu tại Google Brain) đã đáp trả. Zachary Nado viết rằng, với một giám đốc điều hành tuyên bố mình không nghĩ nhiều về đối thủ cạnh tranh, thì "thật thú vị là tất cả lần ra mắt sản phẩm của ông đều được lên lịch gần thời gian sự kiện của chúng tôi". Quả đúng là như vậy.
Tuy nhiên, điều đáng chú ý là Google đã cố gắng gây chú ý 30 phút trước khi OpenAI bắt đầu sự kiện giới thiệu GPT-4o rạng sáng 14.5 bằng cách đăng video quảng cáo nhanh về tác nhân AI có khả năng nhận dạng hình ảnh ấn tượng.
Dù Zachary Nado nói rằng anh chỉ đang "đùa giỡn" và rất tôn trọng các nhà nghiên cứu của OpenAI, phản ứng này làm nổi bật sự cạnh tranh giữa hai công ty khi đang chạy đua để tạo ra các sản phẩm AI hàng đầu.
OpenAI chưa công bố công cụ tìm kiếm dựa trên AI tại sự kiện mới đây, nhưng theo báo cáo, "cha đẻ ChatGPT" đang trong quá trình tạo ra sản phẩm tìm kiếm web của riêng mình.
Trong khi đó, Google đang cải thiện dòng mô hình AI Gemini, dù đi sau GPT của OpenAI nhưng đã nhanh chóng giành được thị phần.
Tại sự kiện dành cho I/O 2024, Google đã trình diễn cách họ đang xây dựng AI trên toàn bộ các hoạt động kinh doanh của mình, gồm cả việc nâng cấp Gemini và cải thiện công cụ tìm kiếm nổi tiếng nhằm cạnh tranh với các đối thủ.
Với người dùng Google Search ở Mỹ duyệt web bằng tiếng Anh, công ty cho biết sẽ sớm sử dụng AI để giúp tổ chức kết quả tìm kiếm cho các truy vấn về ăn uống, công thức nấu ăn và sau đó là phim ảnh, sách cùng các nội dung khác.
Cũng với tìm kiếm trên Google, công ty đang triển khai tính năng AI Overviews cho tất cả người dùng ở Mỹ trong tuần này, sau một thời gian dài thử nghiệm công khai kể từ sự kiện I/O năm ngoái. Tính năng này sử dụng AI tạo sinh để tổng hợp thông tin và trả lời các truy vấn phức tạp hơn mà không có câu trả lời đơn giản nào trên web.
Nhà phân tích Jacob Bourne của hãng eMarketer cho biết: "Phản ứng ra mắt AI Overviews trong tuần này sẽ là một chỉ báo về khả năng thích ứng của Google Search để đáp ứng các yêu cầu trong kỷ nguyên AI tạo sinh. Để duy trì lợi thế cạnh tranh và đáp ứng yêu cầu từ các nhà đầu tư, Google sẽ cần tập trung vào việc chuyển đổi các đổi mới AI của mình thành các sản phẩm và dịch vụ có lợi nhuận ở quy mô lớn".
Quảng cáo sẽ vẫn nằm trong các vị trí trên một trang web nhất định của Google, công ty cho biết và AI Overviews sẽ triển khai cho hơn 1 tỉ người vào cuối năm 2024. Doanh thu của Alphabet đạt 307,4 tỉ USD trong năm 2023, phần lớn trong số đó đến từ quảng cáo trên Google Search và các sản phẩm khác.
Trong tương lai, hàng tỉ người dùng Google sẽ thấy một bản tóm tắt do AI tạo ra ở trên cùng kết quả tìm kiếm của họ. Đó mới chỉ là khởi đầu của cách AI đang thay đổi tìm kiếm.
"Việc đưa AI vào Search giúp giảm bớt sự khó khăn của việc tìm kiếm", theo Liz Reid, người mới đảm nhận vị trí trưởng bộ phận Tìm kiếm của Google. Đại diện Google cho rằng điều này giúp người dùng tập trung vào những phần họ thực sự muốn hoặc khám phá thêm.
Ngoài ra, Google còn trình diễn một thử nghiệm cho phép người dùng đặt câu hỏi về các video mà họ tải lên Search, giống như cách có thể làm với hình ảnh hiện nay. Google đã trình diễn cách thức này có thể giúp chẩn đoán hỏng hóc của máy hát đĩa bị hỏng.
Gmail sắp được cải tiến đáng kể là một trong những điểm nhấn tại sự kiện I/O.
Dịch vụ email của Google được yêu thích trên toàn cầu và không thể thiếu với nhiều người. Con số hơn 1,8 tỉ người dùng Gmail đã nói lên điều đó. Các bản cập nhật sắp tới và sự tích hợp mượt mà của mô hình AI Google Gemini có thể đưa Gmail lên một tầm cao mới, với khả năng tóm tắt nội dung chuỗi email dài, đề xuất trả lời email thông minh theo ngữ cảnh, tìm kiếm và đọc email, file đính kèm để đưa ra câu trả lời cho điều người dùng muốn tìm.
Những sản phẩm AI mới khác được Google giới thiệu tại sự kiện I/O 2024:
- Mô hình Gemini Flash chạy nhanh hơn và rẻ hơn.
- Nguyên mẫu mang tên Project Astra, có thể trò chuyện với người dùng về bất cứ thứ gì được chụp bằng camera smartphone của họ theo thời gian thực. Trong một video được trình chiếu ở sự kiện I/O, một người dùng triển khai Project Astra để xác định cái loa và định vị chiếc kính để nơi khác trong phòng. Google cũng tiết lộ cách họ có thể kết hợp Project Astra với Gemini Live, trợ lý giọng nói và văn bản có âm thanh tự nhiên hơn so với Google Google Assistant trước đây. Demis Hassabis, Giám đốc điều hành Google DeepMind, cho biết về công việc đằng sau Project Astra: "Chúng tôi muốn xây dựng một tác nhân AI đa năng thực sự hữu ích trong cuộc sống hàng ngày".
- Veo, mô hình AI hỗ trợ chuyển văn bản thành video độ phân giải 1080p kéo dài hơn 1 phút, để cạnh tranh với Sora của OpenAI, nhưng tạm thời chỉ dành cho những nhà sáng tạo được phê duyệt sử dụng dưới dạng bản xem trước, trong đó có nhà làm phim Donald Glover. Donald Glover đã giành được nhiều giải thưởng danh giá cho công việc của mình, gồm 12 giải Grammy, 2 giải Quả cầu vàng và 2 giải Primetime Emmy. Trước đó, OpenAI đã quảng bá Sora, mô hình AI hỗ trợ chuyển văn bản thành video chân thực dài 1 phút, với các nhà quản lý Hollywood và khiến ngành công nghiệp sáng tạo lo lắng.
- Bộ xử lý Tensor thế hệ thứ sáu (TPU) cung cấp cho Google và khách hàng dùng Google Cloud sự lựa chọn thay thế bộ xử lý đồ họa (GPU) mạnh mẽ của Nvidia, hãng chip có giá trị nhất thế giới. Chip mới này sẽ có sẵn cho khách hàng đám mây của Google vào cuối năm 2024.