Hotline quảng cáo: 076 4575985 Hotline nội dung: 0934.999945

Nhịp đập khoa học

Kỹ sư nghiên cứu AI: ‘Gemini nhanh hơn GPT-4 rất nhiều’

Sơn Vân • 22:38 07/12/2023

Kỹ sư nghiên cứu trí tuệ nhân tạo (AI) tại hãng MosaicML nhận xét: "Gemini quá tốt. Tốt hơn và nhanh hơn GPT-4 rất nhiều".

OpenAI, công ty khởi nghiệp tương đối nhỏ và mới nổi, đã thách thức Google khi phát hành ChatGPT vào tháng 11.2022.

Hôm 6.12, Sundar Pichai (Giám đốc điều hành Google) và Demis Hassabis (Giám đốc điều hành google DeepMind) đã giới thiệu với thế giới về mô hình generative AI mới mang tên Gemini. Google mô tả đây là "mô hình AI thông minh và tổng quát nhất của mình cho đến nay".

Có ba phiên bản khác nhau gồm Ultra, Pro và Nano, Gemini là hệ thống AI đa phương thức, nghĩa là không chỉ xử lý văn bản mà còn cả mã, âm thanh, hình ảnh và video để phản hồi truy vấn từ người dùng. Gemini cũng tích hợp trực tiếp vào các thiết bị di động, là lần đầu tiên cho một mô hình AI và điểm thú vị cho những người tạo ứng dụng.

Ra mắt Gemini là khoảnh khắc quan trọng với Google đến nỗi người đồng sáng lập Sergey Brin đã tham gia "gần như mỗi ngày" trong quá trình phát triển mô hình AI này.

Các phản hồi ban đầu cho thấy Gemini đang có hiệu suất tốt so với GPT-4, mô hình ngôn ngữ lớn của OpenAI làm nền tảng cho ChatGPT.

Google cho biết Gemini Ultra (phiên bản Gemini mạnh mẽ nhất sẽ ra mắt vào năm tới) "vượt qua kết quả hiện tại của 30 trong số 32 thước đo học thuật phổ biến" để đánh giá các mô hình ngôn ngữ lớn.

Trong một thước đo, Gemini Ultra có tỷ lệ thành công là 74,4% trong tạo mã Python, so với 67% của GPT-4. Với một thước đo khác, Gemini Ultra có điểm đọc hiểu là 82,4 so với 80,9 của GPT-4.

Ấn tượng đầu tiên về Gemini dường như tích cực với những người dùng đang trải nghiệm mô hình AI này thông qua Bard.

Mihir Patel, kỹ sư nghiên cứu tại hãng MosaicML, đã đăng ảnh chụp màn hình lên X để so sánh phản hồi từ Gemini và GPT-4 với câu hỏi "Mamba trong học sâu là gì?"

Theo ảnh chụp màn hình, phản hồi của Gemini chi tiết hơn và cũng được liên kết với các tài liệu nghiên cứu bên ngoài. ChatGPT gần giống một bài viết thông minh trên Wikipedia.

Mihir Patel nhận xét: "Gemini quá tốt. Tốt hơn và nhanh hơn GPT-4 rất nhiều".

“
Mamba là một kiến trúc học sâu (deep learning) tương đối mới được phát triển bởi hãng Anakin AI.
Học sâu là một lĩnh vực trong AI tập trung vào việc xây dựng và huấn luyện các mô hình học máy sâu, còn được gọi là mạng nơ-ron sâu. Mục tiêu của học sâu là tự động học các đặc trưng và biểu diễn cấp cao từ dữ liệu, giúp máy tính tự động thực hiện các nhiệm vụ phức tạp mà trước đây đòi hỏi sự can thiệp của con người.
Mô hình học sâu thường được xây dựng bằng cách sử dụng nhiều lớp của các nơ-ron. Nơ-ron là các đơn vị tính toán cơ bản mô phỏng theo cách hoạt động của não người. Những mô hình này có khả năng học các biểu diễn phức tạp của dữ liệu thông qua quá trình huấn luyện trên tập dữ liệu lớn.
Học sâu đã đạt được sự chú ý lớn nhờ vào khả năng giải quyết hiệu quả nhiều vấn đề khác nhau, bao gồm nhận dạng hình ảnh, ngôn ngữ tự nhiên, dịch ngôn ngữ và nhiều ứng dụng khác trong thực tế. Các mô hình nổi tiếng trong học sâu bao gồm Mạng nơ-ron tích chập (CNN) và Mạng nơ-ron hồi quy (RNN).

Một video cho thấy Gemini mô tả bức tranh phát triển hình con vịt đang bơi trong nước chính xác.

Các nhà phát triển có thể sẽ chào đón Gemini như một sự thay thế thú vị cho sản phẩm của OpenAI. Google nói với tờ Financial Times rằng, vì mô hình Gemini Nano được xây dựng để "chạy tự nhiên" trên smartphone Pixel nên các nhà phát triển Android sẽ dễ dàng xây dựng ứng dụng AI hơn.

Vẫn còn nhiều ý kiến đánh giá về Gemini và khả năng của Google có thể thu hút người dùng từ ChatGPT hay không. Rất nhiều người dùng muốn thử nghiệm Gemini có thể phải chờ vì Google vẫn tiếp tục làm việc trên các phiên bản mô hình không phải tiếng Anh.

Gemini vẫn dường như vẫn có thể mắc phải những vấn đề liên quan đến "ảo giác" (trả lời sai như thật) ở ChatGPT.

Sundar Pichai, Demis Hassabis và các lãnh đạo Google khác hẳn đã quen với tình thế tiến thoái lưỡng nan của nhà đổi mới - ý tưởng cho rằng các công ty lớn có nguy cơ mất đi vị trí dẫn đầu thị trường nếu không nhanh nhẹn trong việc phát triển sản phẩm. Các phản hồi sớm với Gemini cho thấy vẫn còn sức sống trong cỗ máy tìm kiếm cũ của Google.

ky-su-nghien-cuu-ai-gemini-nhanh-hon-gpt-4-rat-nhieu-.jpg — Các phản hồi ban đầu cho thấy Gemini đang có hiệu suất tốt so với GPT-4 - Ảnh: Internet

Sẽ được ra mắt theo từng giai đoạn, Gemini là cơ hội để Google ngăn chặn quan điểm cho rằng hãng đang tụt hậu so với đối thủ OpenAI.

Dù người dùng sẽ có quyền truy cập vào Gemini trong tháng 12, phiên bản cao cấp nhất của mô hình AI này sẽ không xuất hiện cho đến đầu năm 2024.

Gemini có ba phiên bản được phát hành theo từng giai đoạn, gồm Ultra, Pro và Nano. Phiên bản Nano được thiết kế để chạy cục bộ trên các thiết bị, chẳng hạn smartphone.

Google sẽ cấp cho người dùng quyền truy cập vào phiên bản Gemini Pro hôm 6.12 thông qua chatbot Bard và cho khách hàng dùng Cloud trong những ngày tới. Song, Google cho biết Gemini Ultra (phiên bản lớn nhất và tiên tiến nhất về mặt kỹ thuật trong ba mô hình AI) vẫn đang trong quá trình thử nghiệm nội bộ và sẽ không triển khai cho đến đầu năm 2024.

Google thông báo có kế hoạch đưa Gemini vào các sản phẩm phổ biến nhất của mình theo thời gian. Công ty cũng ra mắt Gemini Ultra cho Bard phiên bản mới có tên Bard Advanced vào năm tới.

Sissie Hsiao, Phó chủ tịch Google kiêm quản lý Bard and Assistant, không tiết lộ liệu có tốn phí để sử dụng Bard Advanced hay không nhưng không phủ nhận khả năng đó.

Hiện Google phải chịu áp lực rất lớn để chứng minh họ vẫn là công ty dẫn đầu ngành AI với Gemini, được đào tạo để trở nên đa phương thức, nghĩa là có thể xử lý các loại phương tiện khác nhau như văn bản, hình ảnh, video và âm thanh. Google tự hào rằng Gemini cũng là mô hình AI "linh hoạt nhất" của họ, có khả năng chạy trên nhiều nguồn từ trung tâm dữ liệu đến smartphone.

Trong cuộc thảo luận bàn tròn với các phóng viên tuần này, các lãnh đạo Google nói Gemini Ultra là mô hình AI đầu tiên vượt trội hơn các chuyên gia về MMLU (hiểu biết ngôn ngữ đa nhiệm quy mô lớn), một phép đo kiểm tra các môn như Toán, Lịch sử, Luật và Đạo đức. Gemini Ultra đạt 90,0% số điểm, vượt qua con số 86,4% của GPT-4 của OpenAI.

Google tuyên bố Gemini Pro hoạt động tốt hơn GPT-3.5 (mô hình ngôn ngữ lớn làm nền tảng cho phiên bản ChatGPT miễn phí) và người dùng sẽ có thể thử nghiệm bản tinh chỉnh cho Bard bắt đầu từ ngày 6.12 (ban đầu chỉ bằng ngôn ngữ tiếng Anh).

Google đã bác bỏ những đề xuất rằng đã nỗ lực để đuổi kịp đối thủ, nhưng bên trong công ty, mọi thứ trông rất khác khi họ đua nhau tung ra Gemini và tích hợp AI vào tất cả sản phẩm chính của mình.

Hồi tháng 4, Sundar Pichai đã sáp nhập đơn vị DeepMind được đánh giá cao của Alphabet với nhóm AI nội bộ là Google Brain, để đẩy nhanh quá trình phát triển Gemini. Nhân viên cũng được thông báo rằng Google sẽ giảm số lượng nghiên cứu được xuất bản để hạn chế các đối thủ thương mại hóa ý tưởng của họ, trang Insider đưa tin.

Google tin rằng Gemini có lợi thế hơn trong cuộc cạnh tranh ở "lý luận phức tạp", cách mô hình xử lý thông tin phức tạp trên các loại phương tiện khác nhau.

Trong một bản demo được trình chiếu cho báo chí, các nhà nghiên cứu DeepMind đã sử dụng Gemini để tìm kiếm hàng trăm nghìn tài liệu nghiên cứu nhằm trích xuất các loại dữ liệu cụ thể. Google cho biết Gemini có thể phân biệt giữa những bài viết có liên quan đến nghiên cứu và không liên quan. Thú vị hơn, họ cho Gemini xem một biểu đồ với dữ liệu cũ và yêu cầu nó tạo ra một phiên bản cập nhật với dữ liệu mới được vẽ.

Dù Gemini có thể xử lý các loại phương tiện khác nhau, Eli Collins, Phó chủ tịch sản phẩm của DeepMind, cho biết các mô hình Gemini ban đầu sẽ không thể tạo hình ảnh và video, nhưng gợi ý rằng điều này sẽ xuất hiện trong các mô hình AI khác trong tương lai.

Eli Collins nói thêm rằng Google đã nhận thấy một số khả năng "mới lạ" ở Gemini có thể mang lại lợi thế cho nó so với các mô hình AI đối thủ, nhưng sẽ không nói rõ những khả năng đó có thể là gì.

Gemini đã được đào tạo và được hỗ trợ bởi các bộ xử lý Tensor (TPU). Google sử dụng buổi giới thiệu Gemini để công bố Cloud TPU v5p mới và siêu máy tính AI mới sẽ được sử dụng để cải thiện hoạt động đào tạo và phân phối AI. Điều thú vị là Amin Vahdat, Phó chủ tịch của Google Cloud AI, cho biết Gemini sẽ chạy trên cả GPU và TPU trong tương lai, nhưng không nói rõ hơn điều đó.

Google thông báo sẽ cung cấp Gemini Pro cho khách hàng doanh nghiệp thông qua chương trình Vertex AI và dành cho các nhà phát triển trong AI Studio vào ngày 13.12.

Bài liên quan

Nhân viên rời Apple thường gia nhập Google

Theo trang Switch on Business, phân tích về hồ sơ LinkedIn trong ngành công nghệ cho thấy điểm đến phổ biến nhất của các cựu nhân viên Apple là Google.

Đọc tiếp

Google DeepMind dùng AI dự đoán cấu trúc hơn 2 triệu vật liệu mới

Elon Musk đầu tư vào Google DeepMind vì lo ngại AI có thể phá hủy việc thuộc địa hóa sao Hỏa

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Các địa phương đón những vị khách 'xông đất' du lịch đầu năm

2 giờ trước Du lịch

Từ mùng 1 Tết Ất Tỵ, nhiều địa phương trên cả nước đã chào đón những vị khách đầu tiên "xông đất" các điểm du lịch nổi tiếng. Chuyến du xuân đầu năm không chỉ mở ra hành trình khám phá mà còn gửi gắm hy vọng về một năm mới an lành, may mắn.

SoftBank vung tiền vào OpenAI: Canh bạc 25 tỉ USD cho ngôi vương AI

Trong một động thái làm chấn động giới công nghệ, SoftBank - tập đoàn đầu tư Nhật Bản nổi tiếng...
Trung Quốc và ‘trò mèo vờn chuột’ trong AI: DeepSeek đang học từ Mỹ như thế nào?

Sự trỗi dậy của DeepSeek, một công ty AI đến từ Trung Quốc, đang đặt ra những thách thức lớn...
Làm khách ở quê mình

Xa nhà cũng là một thử thách. Cuộc sống xa nhà dạy cho ta nhiều điều. Tôi từng nhiều lần rời...

Đừng bỏ lỡ

Nvidia dự báo 2 bộ xử lý đồ họa RTX 5090 và 5080 sẽ cháy hàng

10 phút trước Khoa học - công nghệ

Trang Engadget dẫn lời tập đoàn Nvidia cảnh báo game thủ sẽ rất khó mua được hai bộ xử lý đồ họa (GPU) RTX 5090 và 5080 cao cấp sắp ra mắt do nhu cầu tăng cao dẫn đến tình trạng cháy hàng.
Tranh cãi việc Tổng thống Ukraine chỉ trích ông Biden và EU, khen ngợi ông Trump

một giờ trước Quốc tế

Trong một cuộc phỏng vấn gây chú ý với Fox News hôm 29.1, Tổng thống Ukraine Volodymyr Zelensky đã công khai chỉ trích chính quyền của cựu Tổng thống Joe Biden “chậm trễ” trong việc cung cấp vũ khí cho cuộc chiến chống Nga.
Lý do ông Trump đánh thuế vào chip TSMC?

2 giờ trước Khoa học - công nghệ

Quyết định áp thuế lên chip bán dẫn nhập khẩu từ Đài Loan (Trung Quốc) của Tổng thống Donald Trump đã gây bất ngờ và tạo ra làn sóng tranh cãi trong giới công nghệ, khi mà chuỗi cung ứng chip toàn cầu đang phụ thuộc lớn vào TSMC.
Định hình vị trí quan trọng của Việt Nam trong chuỗi cung ứng bán dẫn toàn cầu

5 giờ trước Nhịp đập khoa học

Bán dẫn không chỉ là nền tảng của các công nghệ tương lai như trí tuệ nhân tạo, Internet vạn vật và xe tự hành, còn là yếu tố cốt lõi để đảm bảo năng lực cạnh tranh quốc gia trong kỷ nguyên số.
Động thái ngừng viện trợ nước ngoài của ông Trump gây nên hậu quả gì?

5 giờ trước Chuyển động

Hãng Reuters cho biết cơ sở y tế dã chiến tại các trại tị nạn Thái Lan, việc rà phá bom mìn ở vùng chiến sự cùng thuốc để điều trị hàng triệu người mắc bệnh... trong một số chương trình đối mặt với nguy cơ bị cắt giảm nguồn tài chính vì động thái ngừng viện trợ nước ngoài của Tổng thống Mỹ Donald Trump.

Mới nhất

SoftBank vung tiền vào OpenAI: Canh bạc 25 tỉ USD cho ngôi vương AI

10 phút trước Khoa học - công nghệ

Trong một động thái làm chấn động giới công nghệ, SoftBank - tập đoàn đầu tư Nhật Bản nổi tiếng với những pha "tung tiền" táo bạo - đang đàm phán rót tới 25 tỉ USD vào OpenAI, công ty mẹ của ChatGPT, theo Financial Times.
Trung Quốc và ‘trò mèo vờn chuột’ trong AI: DeepSeek đang học từ Mỹ như thế nào?

25 phút trước Khoa học - công nghệ

Sự trỗi dậy của DeepSeek, một công ty AI đến từ Trung Quốc, đang đặt ra những thách thức lớn đối với ngành công nghệ của Mỹ.
Các địa phương đón những vị khách 'xông đất' du lịch đầu năm

2 giờ trước Du lịch

Từ mùng 1 Tết Ất Tỵ, nhiều địa phương trên cả nước đã chào đón những vị khách đầu tiên "xông đất" các điểm du lịch nổi tiếng. Chuyến du xuân đầu năm không chỉ mở ra hành trình khám phá mà còn gửi gắm hy vọng về một năm mới an lành, may mắn.
Làm khách ở quê mình

4 giờ trước Văn hóa

Xa nhà cũng là một thử thách. Cuộc sống xa nhà dạy cho ta nhiều điều. Tôi từng nhiều lần rời xa quê hương, nhưng đó chỉ là những quãng thời gian ngắn để học tập, rồi lại quay về. Lần này, tôi thực sự rời quê hương để xây dựng tổ ấm và sự nghiệp cho riêng mình.
Sau 100 năm trì trệ, việc chữa rắn cắn hứa hẹn có đột phá lớn

9 giờ trước Kiến thức - Học thuật

Vết rắn độc cắn giết chết hơn 100.000 người mỗi năm trên toàn thế giới và làm bị thương vô số người khác. Tuy nhiên, thuốc giải độc, tiêu chuẩn vàng của việc chữa trị, được sản xuất giống như cách đây 100 năm: bằng cách tiêm nọc độc vào động vật, sau đó thu thập và tinh chế các kháng thể mà chúng tạo ra.

Xem thêm

Cơ quan chủ quản: Hội Thông tin Khoa học và Công nghệ Việt Nam.

ĐC: 24 Lý Thường Kiệt, Hàng Bài, Hoàn Kiếm, Hà Nội.

ĐT: 024.38256203

Hotline nội dung : 0934999945

Tổng biên tập: Hoàng Đại Thanh

Tổng Thư ký Tòa soạn: Nguyễn Đình Mười

Giấy phép số 77/GP-BTTTT do Bộ Thông tin và Truyền thông cấp ngày 26 tháng 2 năm 2020.

Tòa nhà SIMCO Sông Đà, Tiểu KĐT mới Vạn Phúc, Phường Vạn Phúc, Quận Hà Đông, TP. Hà Nội

ĐT: 0984708866

TPHCM: 345/134 Trần Hưng Đạo, phường Cầu Kho, Quận 1

ĐT: 028.38389241

Email: toasoan@1thegioi.vn

Hotline quảng cáo: 0764575985

Email quảng cáo: sales@1thegioi.vn

Báo giá quảng cáo:

Công ty Cổ phần Truyền thông Một Thế Giới

Kỹ sư nghiên cứu AI: ‘Gemini nhanh hơn GPT-4 rất nhiều’

Nhân viên rời Apple thường gia nhập Google

Gemini

GPT-4

OpenAI

Google

Mihir Patel

MosaicML

mamba

học sâu

Google DeepMind dùng AI dự đoán cấu trúc hơn 2 triệu vật liệu mới

Elon Musk đầu tư vào Google DeepMind vì lo ngại AI có thể phá hủy việc thuộc địa hóa sao Hỏa

Google DeepMind dùng AI dự đoán cấu trúc hơn 2 triệu vật liệu mới

Elon Musk đầu tư vào Google DeepMind vì lo ngại AI có thể phá hủy việc thuộc địa hóa sao Hỏa

Cơ hội nào cho Việt Nam trong chuỗi giá trị công nghệ bán dẫn?

'SpaceX là thách thức chưa từng có với tham vọng thống trị vũ trụ của Trung Quốc'

Google ra mắt 3 phiên bản mô hình Gemini, vũ khí AI hạng nặng để đấu với OpenAI

Giám đốc AI cảnh báo Mark Zuckerberg rằng Facebook có thể lạc hậu nếu không bắt kịp ChatGPT

Nghiên cứu mới: ChatGPT cung cấp thông tin sai lệch hoặc không đầy đủ về thuốc

Gạo ST25 của ông Hồ Quang Cua đạt giải nhất cuộc thi gạo ngon nhất thế giới năm 2023

Các địa phương đón những vị khách 'xông đất' du lịch đầu năm

SoftBank vung tiền vào OpenAI: Canh bạc 25 tỉ USD cho ngôi vương AI

Trung Quốc và ‘trò mèo vờn chuột’ trong AI: DeepSeek đang học từ Mỹ như thế nào?

Làm khách ở quê mình

Nvidia dự báo 2 bộ xử lý đồ họa RTX 5090 và 5080 sẽ cháy hàng

Tranh cãi việc Tổng thống Ukraine chỉ trích ông Biden và EU, khen ngợi ông Trump

Lý do ông Trump đánh thuế vào chip TSMC?

Định hình vị trí quan trọng của Việt Nam trong chuỗi cung ứng bán dẫn toàn cầu

Động thái ngừng viện trợ nước ngoài của ông Trump gây nên hậu quả gì?

SoftBank vung tiền vào OpenAI: Canh bạc 25 tỉ USD cho ngôi vương AI

Trung Quốc và ‘trò mèo vờn chuột’ trong AI: DeepSeek đang học từ Mỹ như thế nào?

Các địa phương đón những vị khách 'xông đất' du lịch đầu năm

Làm khách ở quê mình

Sau 100 năm trì trệ, việc chữa rắn cắn hứa hẹn có đột phá lớn

Phong trào tẩy chay Meta không ảnh hưởng đến số người dùng Facebook, Instagram do lệnh cấm TikTok ở Mỹ

Meta và Google đang dẫn trước trong lĩnh vực AR nhưng Apple vẫn là mối đe dọa tiềm tàng

Mô hình AI nguồn mở mạnh mẽ của DeepSeek làm thị trường hỗn loạn, cổ phiếu Nvidia và nhiều hãng giảm sâu

Ông trùm AI tại Meta: R1 của DeepSeek cho thấy mô hình AI nguồn mở đang vượt mô hình độc quyền

Thành viên hội đồng quản trị lạc quan ByteDance tìm được giải pháp không cần bán TikTok ở Mỹ