Hotline quảng cáo: 096 2445664 Hotline nội dung: 0934.999945

Nhịp đập khoa học

Google ra mắt 3 phiên bản mô hình Gemini, vũ khí AI hạng nặng để đấu với OpenAI

Sơn Vân•06/12/2023 23:13

Sau nhiều tháng kích thích sự tò mò, Google bắt đầu tung ra mô hình trí tuệ nhân tạo tạo sinh (generative AI) của mình mang tên Gemini.

Sẽ được ra mắt theo từng giai đoạn, Gemini là cơ hội để Google ngăn chặn quan điểm cho rằng hãng đang tụt hậu so với đối thủ OpenAI.

Dù người dùng sẽ có quyền truy cập vào Gemini trong tháng 12, phiên bản cao cấp nhất của mô hình AI này sẽ không xuất hiện cho đến đầu năm 2024.

Gemini có ba phiên bản được phát hành theo từng giai đoạn, gồm Ultra, Pro và Nano. Phiên bản Nano được thiết kế để chạy cục bộ trên các thiết bị, chẳng hạn smartphone.

Google sẽ cấp cho người dùng quyền truy cập vào phiên bản Gemini Pro hôm 6.12 thông qua chatbot Bard và cho khách hàng dùng Cloud trong những ngày tới. Song, Google cho biết Gemini Ultra (phiên bản lớn nhất và tiên tiến nhất về mặt kỹ thuật trong ba mô hình AI) vẫn đang trong quá trình thử nghiệm nội bộ và sẽ không triển khai cho đến đầu năm 2024.

google-ra-mat-3-mo-hinh-gemini-vu-khi-hang-nang-de-dau-voi-openai.jpg — Gemini có ba phiên bản được phát hành theo từng giai đoạn, gồm Ultra, Pro và Nano - Ảnh: Google

Google thông báo có kế hoạch đưa Gemini vào các sản phẩm phổ biến nhất của mình theo thời gian. Công ty cũng ra mắt Gemini Ultra cho Bard phiên bản mới có tên Bard Advanced vào năm tới.

Sissie Hsiao, Phó chủ tịch Google kiêm quản lý Bard and Assistant, không tiết lộ liệu có tốn phí để sử dụng Bard Advanced hay không nhưng không phủ nhận khả năng đó.

Hiện Google phải chịu áp lực rất lớn để chứng minh họ vẫn là công ty dẫn đầu ngành AI với Gemini, được đào tạo để trở nên đa phương thức, nghĩa là có thể xử lý các loại phương tiện khác nhau như văn bản, hình ảnh, video và âm thanh. Google tự hào rằng Gemini cũng là mô hình AI "linh hoạt nhất" của họ, có khả năng chạy trên nhiều nguồn từ trung tâm dữ liệu đến smartphone.

Trong cuộc thảo luận bàn tròn với các phóng viên tuần này, các lãnh đạo Google nói Gemini Ultra là mô hình AI đầu tiên vượt trội hơn các chuyên gia về MMLU (hiểu biết ngôn ngữ đa nhiệm quy mô lớn), một phép đo kiểm tra các môn như Toán, Lịch sử, Luật và Đạo đức. Gemini Ultra đạt 90,0% số điểm, vượt qua con số 86,4% của GPT-4 của OpenAI

Tất cả điều đó nghe có vẻ tuyệt vời, nhưng hiện chưa thể kiểm tra toàn bộ khả năng của Gemini.

Google tuyên bố Gemini Pro hoạt động tốt hơn GPT-3.5 (mô hình ngôn ngữ lớn làm nền tảng cho phiên bản ChatGPT miễn phí) và người dùng sẽ có thể thử nghiệm bản tinh chỉnh cho Bard bắt đầu từ ngày 6.12 (ban đầu chỉ bằng ngôn ngữ tiếng Anh).

Google đã bác bỏ những đề xuất rằng đã nỗ lực để đuổi kịp đối thủ, nhưng bên trong công ty, mọi thứ trông rất khác khi họ đua nhau tung ra Gemini và tích hợp AI vào tất cả sản phẩm chính của mình.

Hồi tháng 4, Sundar Pichai - Giám đốc điều hành Google đã sáp nhập đơn vị DeepMind được đánh giá cao của Alphabet với nhóm AI nội bộ là Google Brain, để đẩy nhanh quá trình phát triển Gemini. Nhân viên cũng được thông báo rằng Google sẽ giảm số lượng nghiên cứu được xuất bản để hạn chế các đối thủ thương mại hóa ý tưởng của họ, trang Insider đưa tin.

Google tin rằng Gemini có lợi thế hơn trong cuộc cạnh tranh ở "lý luận phức tạp", cách mô hình xử lý thông tin phức tạp trên các loại phương tiện khác nhau.

Trong một bản demo được trình chiếu cho báo chí, các nhà nghiên cứu DeepMind đã sử dụng Gemini để tìm kiếm hàng trăm nghìn tài liệu nghiên cứu nhằm trích xuất các loại dữ liệu cụ thể. Google cho biết Gemini có thể phân biệt giữa những bài viết có liên quan đến nghiên cứu và không liên quan. Thú vị hơn, họ cho Gemini xem một biểu đồ với dữ liệu cũ và yêu cầu nó tạo ra một phiên bản cập nhật với dữ liệu mới được vẽ.

Dù Gemini có thể xử lý các loại phương tiện khác nhau, Eli Collins, Phó chủ tịch sản phẩm của DeepMind, cho biết các mô hình Gemini ban đầu sẽ không thể tạo hình ảnh và video, nhưng gợi ý rằng điều này sẽ xuất hiện trong các mô hình AI khác trong tương lai.

Eli Collins nói thêm rằng Google đã nhận thấy một số khả năng "mới lạ" ở Gemini có thể mang lại lợi thế cho nó so với các mô hình AI đối thủ, nhưng sẽ không nói rõ những khả năng đó có thể là gì.

Cách đây ít ngày, Sissie Hsiao từng nói về Gemini: “Tôi đã thấy một số điều rất tuyệt vời. Ví dụ, tôi đang cố nướng một chiếc bánh và nói ‘hãy vẽ cho tôi 3 bức tranh về cách trang trí bánh ba tầng’. Gemini sẽ tạo ra những hình ảnh đó thực sự. Đây là những bức tranh hoàn toàn mới lạ, không phải từ internet. Nó có thể giao tiếp bằng hình ảnh với con người ngay bây giờ, không chỉ là văn bản".

Gemini đã được đào tạo và được hỗ trợ bởi các bộ xử lý Tensor (TPU). Google sử dụng buổi giới thiệu Gemini để công bố Cloud TPU v5p mới và siêu máy tính AI mới sẽ được sử dụng để cải thiện hoạt động đào tạo và phân phối AI. Điều thú vị là Amin Vahdat, Phó chủ tịch của Google Cloud AI, cho biết Gemini sẽ chạy trên cả GPU và TPU trong tương lai, nhưng không nói rõ hơn điều đó.

Google thông báo sẽ cung cấp Gemini Pro cho khách hàng doanh nghiệp thông qua chương trình Vertex AI và dành cho các nhà phát triển trong AI Studio vào ngày 13.12.

Với các sản phẩm tiêu dùng ngoài Bard, Google có kế hoạch bổ sung Gemini vào SGE, phiên bản tìm kiếm tạo sinh được hỗ trợ bởi AI, cũng như Chrome, Duet AI và các sản phẩm khác trong những tháng tới.

Gemini lấy cảm hứng từ AlphaGo, được DeepMind phát triển và trở thành chương trình máy tính đầu tiên đánh bại một người chơi cờ vây chuyên nghiệp là con người. Lịch sử AI được lập vào năm 2016 khi AlphaGo đánh bại Lee Sedol, một trong những kỳ thủ cờ vây vĩ đại nhất thế giới, trong trận đấu của chính ông ta.

Demis Hassabis, Giám đốc điều hành DeepMind, nói với trang Wired rằng các kỹ thuật được sử dụng trong AlphaGo sẽ kết hợp với công nghệ hỗ trợ ChatGPT. Ông lý giải: “Ở cấp độ cao, bạn có thể coi Gemini như sự kết hợp một số điểm mạnh của hệ thống AlphaGo với khả năng ngôn ngữ tuyệt vời của các mô hình lớn”.

Bài liên quan

Sự hỗn loạn ở OpenAI có lợi cho Google và các hãng muốn giành vị trí dẫn đầu về AI

Kể từ khi ChatGPT ra mắt vào tháng 11.2022, ít ai nghi ngờ về vị thế dẫn đầu của OpenAI trong lĩnh vực trí tuệ nhân tạo (AI). Việc bất ngờ sa thải Giám đốc điều hành Sam Altman và sự ra đi của Chủ tịch Greg Brockman đã thay đổi tất cả.

Đọc tiếp

Nhân viên rời Apple thường gia nhập Google

Google DeepMind dùng AI dự đoán cấu trúc hơn 2 triệu vật liệu mới

Elon Musk đầu tư vào Google DeepMind vì lo ngại AI có thể phá hủy việc thuộc địa hóa sao Hỏa

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Sắp xếp, tổ chức lại bộ máy và công tác cán bộ tại Liên hiệp Các hội KH-KT Việt Nam

12 giờ trước Khoa học - công nghệ

Các quyết định về việc sắp xếp tổ chức bộ máy và công tác cán bộ đã được công bố tại hội nghị diễn ra ngày 3.3 tại trụ sở Liên hiệp Các hội khoa học và kỹ thuật Việt Nam (gọi tắt là Liên hiệp Hội Việt Nam - LHHVN).

Bộ máy Ban Tuyên giáo - Dân vận Thành ủy TP.HCM gồm 7 phòng

Ngày 3.3, Ban Tuyên giáo - Dân vận Thành ủy TP.HCM tổ chức trao quyết định sắp xếp tổ chức...
Hơn 10 chuyên gia ở các đại học hàng đầu Trung Quốc hiến kế phát triển AI sau khi nghiên cứu DeepSeek

Quỹ Khoa học Tự nhiên Quốc gia Trung Quốc (NSFC) cho biết sự phát triển trí tuệ nhân tạo (AI)...
Hà Nội phải thành trung tâm đổi mới sáng tạo hàng đầu cả nước và khu vực

Hà Nội, thủ đô của đất nước, luôn giữ vai trò tiên phong trong công cuộc đổi mới, cũng là nơi...

Đừng bỏ lỡ

Sở Xây dựng TP.HCM sau khi hợp nhất có 188 người nộp đơn xin nghỉ hưu

7 giờ trước Sự kiện

Chiều 3.3, Sở Xây dựng TP.HCM tổ chức lễ công bố thành lập sở và thông tin các quyết định bổ nhiệm Ban giám đốc.
Sở Tài nguyên - Môi trường TP.HCM giảm 334 nhân sự sau hợp nhất

8 giờ trước Sự kiện

Chiều 3.3, Sở Tài nguyên - Môi trường TP.HCM công bố danh sách ban giám đốc và đội ngũ lãnh đạo phòng, ban mới sau khi hợp nhất với Sở Nông nghiệp - Phát triển nông thôn.
Nvidia và Broadcom tìm giải pháp thay thế TSMC: Cơ hội nào cho Intel?

8 giờ trước Khoa học - công nghệ

Ngành công nghiệp bán dẫn đang chứng kiến một diễn biến đáng chú ý khi Nvidia và Broadcom - hai ông lớn trong lĩnh vực thiết kế chip - bắt đầu thử nghiệm quy trình sản xuất tiên tiến 18A của Intel.
Buổi biểu diễn nghệ thuật mang tên 'Rau răm' của bộ đôi nghệ sĩ Pháp có gì đặc biệt?

8 giờ trước Văn hóa

Trong khuôn khổ chương trình Nghệ sĩ lưu trú Villa Saigon 2025, Viện Pháp tại Việt Nam giới thiệu buổi biểu diễn nghệ thuật mang tên “Rau răm” vào ngày 6.3 tại phòng triển lãm 31 Thái Văn Lung, quận 1, TP.HCM.
Châu Âu nỗ lực níu kéo Mỹ không từ bỏ Ukraine bất chấp căng thẳng Trump - Zelensky

9 giờ trước Quốc tế

Dù công khai ủng hộ Tổng thống Volodymyr Zelensky sau căng thẳng với Tổng thống Donald Trump, các lãnh đạo châu Âu vẫn phải duy trì hợp tác với Mỹ để đảm bảo an ninh cho Ukraine và khu vực.

Mới nhất

Hơn 10 chuyên gia ở các đại học hàng đầu Trung Quốc hiến kế phát triển AI sau khi nghiên cứu DeepSeek

7 giờ trước Nhịp đập khoa học

Quỹ Khoa học Tự nhiên Quốc gia Trung Quốc (NSFC) cho biết sự phát triển trí tuệ nhân tạo (AI) không nên chỉ là "cuộc cạnh tranh về sức mạnh tính toán". Đây là kết luận được đưa ra sau khi tập hợp các chuyên gia để thảo luận về tác động từ các mô hình AI của DeepSeek.
Bộ máy Ban Tuyên giáo - Dân vận Thành ủy TP.HCM gồm 7 phòng

8 giờ trước Sự kiện

Ngày 3.3, Ban Tuyên giáo - Dân vận Thành ủy TP.HCM tổ chức trao quyết định sắp xếp tổ chức bộ máy và công tác cán bộ.
‘Thịt giả’ có tốt hơn thịt thật?

10 giờ trước Khoa học - công nghệ

Ngày nay không thiếu các món “thịt” như gà viên, xúc xích làm từ đậu nành hoặc đậu Hà Lan. Công ty làm ra chúng luôn quảng cáo sản phẩm của mình rất tốt và giới chuyên gia dinh dưỡng cũng nói rằng “thịt giả” có lợi ích.
Những sản phẩm công nghệ độc lạ ở MWC 2025

11 giờ trước Thế giới số

MWC 2025 diễn ra từ ngày 3.3 đến 6.3.
Xác minh clip nam thanh niên đánh tới tấp người đàn ông sau va chạm giao thông

11 giờ trước Sự kiện

Ngày 3.3, Công an phường Hố Nai (TP.Biên Hoà, tỉnh Đồng Nai) cho biết đơn vị đang xác minh clip ghi lại vụ ẩu đả sau va chạm giao thông xảy ra trên đường Nguyễn Ái Quốc (đoạn qua địa bàn phường).