Những điều cần biết về Google Gemini, mô hình AI có thể đánh bại GPT-4

Google chuẩn bị ra mắt Gemini, câu trả lời cho mô hình ngôn ngữ lớn đình đám GPT-4 của OpenAI.

Gemini là mô hình trí tuệ nhân tạo (AI) đa phương thức thế hệ tiếp theo, đang được nghiên cứu bởi đội ngũ thuộc bộ phận DeepMind và Google Brain của Google.

Đầu năm 2023, Google đã tiến hành hợp nhất DeepMind và Google Brain dưới sự chỉ đạo của Giám đốc điều hành Sundar Pichai, nhằm đẩy nhanh quá trình phát triển các mô hình ngôn ngữ lớn như Gemini để bắt kịp GPT-4 của OpenAI do Microsoft hậu thuẫn.

Cốt lõi của Gemini là thuật toán đào tạo tăng cường (reinforment learning), cho phép AI học cách tiếp cận một vấn đề theo cách logic và có hệ thống. Ước tính để tạo ra một AI như Gemini, chi phí có thể lên tới hàng trăm triệu USD.

Gemini đang được quảng bá như một tiến bộ đáng kể trong xử lý ngôn ngữ tự nhiên. Google dự kiến sẽ phát hành mô hình AI này vào cuối năm nay.

Việc phát hành Gemini sắp tới được thế giới công nghệ theo dõi chặt chẽ, với nhiều suy đoán rằng mô hình này có khả năng đánh bại đối thủ GPT-4.

Một phân tích đưa ra tuyên bố sớm về ưu thế AI của Gemini so với GPT-4 đã gây ra cuộc tranh luận trực tuyến gay gắt, thậm chí lôi kéo Giám đốc điều hành OpenAI - Sam Altman vào cuộc.

Thông tin chi tiết Gemini vẫn còn ít và bên dưới là những gì cần biết về sản phẩm mới của Google.

Gemini là đa phương thức

Gemini của Google là một mô hình AI đa phương thức, nghĩa là có thể xử lý nhiều loại dữ liệu. Mô hình này dự kiến sẽ có thể xử lý hình ảnh và văn bản, cho phép thực hiện các tính năng như phân tích bằng văn bản biểu đồ trực quan, trang The Information đưa tin.

Google cũng đang nâng cao khả năng tạo mã của Gemini để cạnh tranh với GitHub Copilot của GitHub và OpenAI (được Microsoft hậu thuẫn).

AI được xây dựng có mục đích là câu trả lời cho trải nghiệm khách hàng tốt hơn.

Trong một bài đăng trên blog, Google cho biết sau khi quá trình thử nghiệm và tinh chỉnh hoàn tất, Gemini sẽ có sẵn với nhiều kích cỡ và khả năng khác nhau.

nhung-dieu-can-biet-ve-google-gemini-mo-hinh-ai-co-the-danh-bai-gpt-4.jpeg — Hai nhà phân tích của hãng SemiAnalysis nhận định Gemini mạnh gấp 5 lần GPT-4 - Ảnh: Internet

Lấy cảm hứng từ AlphaGo

Gemini lấy cảm hứng từ AlphaGo, được DeepMind phát triển và trở thành chương trình máy tính đầu tiên đánh bại một người chơi cờ vây chuyên nghiệp là con người. Lịch sử AI đã được lập vào năm 2016 khi AlphaGo đánh bại Lee Sedol, một trong những kỳ thủ cờ vây vĩ đại nhất thế giới, trong trận đấu của chính ông ta.

Demis Hassabis, ông chủ của DeepMind, nói với trang Wired vào tháng 6 rằng các kỹ thuật được sử dụng trong AlphaGo sẽ được kết hợp với công nghệ hỗ trợ ChatGPT.

Ông nói: “Ở cấp độ cao, bạn có thể coi Gemini như sự kết hợp một số điểm mạnh của hệ thống AlphaGo với khả năng ngôn ngữ tuyệt vời của các mô hình lớn”.

Phiên bản đầu tiên

Google sắp ra mắt Gemini khi gã khổng lồ công nghệ đã giao phiên bản đầu tiên của Gemini cho một nhóm nhỏ các công ty, theo trang The Information.

Một người đã thử nghiệm công nghệ này nói rằng Gemini có thể có lợi thế hơn GPT-4 vì tận dụng dữ liệu của Google từ các sản phẩm tiêu dùng cũng như thông tin được thu thập từ internet. Báo cáo cho biết Gemini có thể hiểu chính xác hơn ý định của người dùng.

Người này cũng cho biết Gemini dường như tạo ra ít câu trả lời sai hơn, một vấn đề phổ biến trong AI được gọi là ảo giác. Các chatbot AI đã được biết là đưa ra thông tin không chính xác y như thật. Trở lại vào tháng 2, video quảng cáo Bard của Google cho thấy chatbot AI này đưa ra câu trả lời không chính xác.

Các nhà nghiên cứu đằng sau công ty SemiAnalysis cũng dự đoán rằng Gemini có thể sẽ hoạt động tốt hơn GPT-4 do Google có khả năng tiếp cận các chip hàng đầu.

Hai chuyên gia Dylan Patel và Daniel Nishball thuộc SemiAnalysis cho rằng “Gemini có thể nuốt trọn cả thế giới, đánh bại GPT-4 bằng sức mạnh gấp 5 lần vì đòi hỏi ít GPU (bộ xử lý đồ họa) hơn”.

Dylan Patel và Daniel Nishball phân chia "GPU giàu" để chỉ những hệ thống AI tiêu tốn nhiều bộ xử lý đồ họa và "GPU nghèo" nhằm ám chỉ các hệ thống cần ít GPU song vẫn có sức mạnh vượt trội.

GPT-4 được coi là đại diện cho mô hình cần nhiều GPU, trong khi Gemini ở bên còn lại. Dẫn hàng loạt số liệu, họ kết luận rằng Gemini vượt trội GPT-4 về thước đo hiệu suất liên quan đến tính toán máy tính (FLOPS).

“Ai có thể cứu chúng ta khỏi việc trở thành nô lệ cho GPU Nvidia không? Câu trả lời có thể là Gemini”, một ý kiến nêu.

Tháng trước, Google cũng đã giới thiệu AI tích hợp vào công cụ tìm kiếm dành cho người dùng tại Ấn Độ và Nhật Bản. Công cụ này sẽ hiển thị kết quả cá nhân hóa bằng văn bản hoặc hình ảnh theo câu lệnh. Google cũng đã cung cấp các công cụ hỗ trợ AI của Office cho khách hàng doanh nghiệp với mức giá hàng tháng là 30 USD cho mỗi người dùng.

Bằng cách phát triển Gemini, Google hy vọng sẽ tạo ra một phần mềm AI đàm thoại có thể hiểu và phản hồi người dùng một cách tự nhiên, chính xác và sáng tạo.

Google đang cố gắng dập tắt bất kỳ quan điểm cho rằng hãng tụt hậu về mặt công nghệ. Vào tháng 5, Sundar Pichai đã tiết lộ hơn 10 sản phẩm hỗ trợ AI tại I/O - một sự kiện thường niên của Google dành cho các nhà phát triển phần mềm.

Việc xây dựng công nghệ AI đáng tin cậy đòi hỏi nguồn lực khổng lồ mà chỉ có những tập đoàn công nghệ có quy mô như Microsoft và Google mới đáp ứng được. Tinglong Dai, giáo sư chuyên nghiên cứu về tương tác giữa con người và AI tại Đại học Johns Hopkins (Mỹ), nói có hai lý do cho điều này.

Thứ nhất, cần hàng chục ngàn máy tính trong cơ sở hạ tầng đám mây để huấn luyện và vận hành hệ thống AI.

Thứ hai, generative AI đòi hỏi nguồn nhân lực khổng lồ liên tục thử nghiệm và điều chỉnh mô hình ngôn ngữ, làm sao để chúng không cung cấp những câu trả lời quá vô nghĩa hoặc mang hàm ý xúc phạm. Generative AI là một loại trí tuệ nhân tạo được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn. .

“Câu hỏi lớn nhất là liệu Google có tiếp tục dẫn đầu mảng tìm kiếm hay không khi biến AI trở thành trọng tâm phát triển mới. Lần đầu tiên sau 15 năm, Google phải đối mặt với một thách thức thực sự. Đây cũng là lần đầu tiên họ chậm một bước so với nhịp phát triển chung của thị trường”, Matt Naeger, Giám đốc chiến lược và tiếp thị tại hãng Merkle, nhận định.

Tuy vậy, với vị thế hiện tại, khả năng Google bị đánh bại được cho là tương đối nhỏ. Hơn nữa, nếu thành công với Gemini, Google sẽ càng có thêm nhiều sức mạnh cạnh tranh trong cuộc đua AI.