Nhịp đập khoa học

Microsoft phát triển mô hình AI đủ lớn để cạnh tranh với Google và OpenAI

Sơn Vân • 07/05/2024 07:30

Microsoft đang phát triển một mô hình ngôn ngữ trí tuệ nhân tạo (AI) mới đủ lớn để cạnh tranh với các Gemini của Google và GPT của OpenAI, theo trang The Information.

Mô hình AI mới (có tên gọi nội bộ là MAI-1) đang được giám sát bởi Mustafa Suleyman – Giám đốc điều hành đơn vị Microsoft AI, The Information đưa tin, dẫn lời hai nhân viên Microsoft có hiểu biết về dự án.

Mustafa Suleyman là đồng sáng lập Google DeepMind và cựu Giám đốc điều hành công ty khởi nghiệp về Inflection AI.

Mục đích chính xác của mô hình AI này vẫn chưa được xác định và sẽ phụ thuộc vào hiệu suất hoạt động của nó. Microsoft có thể giới thiệu sơ lược về mô hình AI mới tại hội nghị dành cho nhà phát triển Build vào cuối tháng 5 này.

Microsoft từ chối bình luận khi được Reuters liên hệ.

MAI-1 sẽ "lớn hơn nhiều" so với các mô hình nguồn mở nhỏ hơn trước đây mà Microsoft đã đào tạo, nghĩa là sẽ gây tốn kém hơn, theo The Information.

Ngày 23.4 vừa qua, Microsoft đã trình làng Phi-3-mini, mô hình AI nhỏ gọn, tiết kiệm chi phí, có thể thực hiện các nhiệm vụ như tạo nội dung và bài đăng trên mạng xã hội trong khi sử dụng lượng dữ liệu nhỏ hơn đáng kể so với các mô hình thông thường.

Theo Microsoft, Phi-3-mini hoạt động tốt hơn các mô hình AI có kích thước gấp đôi nó về hiệu suất trên nhiều bài kiểm tra đánh giá kỹ năng ngôn ngữ, lập trình và toán học. Điều này biến Phi-3-mini thành lựa chọn hấp dẫn cho các công ty có nguồn lực hạn chế, vốn thường gặp khó khăn trong việc triển khai và vận hành các mô hình AI lớn.

Microsoft nói rằng doanh nghiệp có thể sử dụng Phi-3-mini để tóm tắt các điểm chính của tài liệu dài, trích xuất các thông tin có liên quan và xu hướng ngành từ các báo cáo nghiên cứu thị trường.

Phi-3-mini sẽ có sẵn ngay trên danh mục mô hình AI của nền tảng dịch vụ đám mây Azure, nền tảng mô hình học máy Hugging Face và Ollama (cấu trúc để chạy các mô hình AI trên máy tính cá nhân).

Microsoft đã đầu tư hàng tỉ USD vào OpenAI và triển khai công nghệ của công ty khởi nghiệp đứng sau ChatGPT trên toàn bộ bộ phần mềm năng suất của mình, giúp họ đi đầu trong cuộc đua AI tạo sinh.

Microsoft đã dành riêng một cụm máy chủ lớn được trang bị các bộ xử lý đồ họa (GPU) Nvidia cùng lượng dữ liệu khổng lồ để cải thiện mô hình AI mới, theo báo cáo. MAI-1 sẽ có khoảng 500 tỉ tham số, trong khi GPT-4 của OpenAI được cho có 1.000 tỉ tham số và Phi-3 mini có 3,8 tỉ tham số.

Vào tháng 3, Microsoft đã bổ nhiệm Mustafa Suleyman làm người đứng đầu đơn vị AI tiêu dùng mới thành lập và thuê một số nhân viên từ Inflection AI.

Theo The Information, mô hình AI mới của Microsoft không được chuyển giao từ Inflection AI dù có thể dựa trên dữ liệu đào tạo của công ty khởi nghiệp này.

Giữa tháng 4, Microsoft đã đầu tư 1,5 tỉ USD vào G42 - công ty AI đặt trụ sở tại UAE. Gã khổng lồ phần mềm Mỹ từng hợp tác với công ty khởi nghiệp Mistral AI (Pháp) để đưa mô hình AI của họ trên Azure.

microsoft-phat-trien-mo-hinh-ai-du-lon-de-canh-tranh-voi-google-va-openai.jpg — Microsoft đang phát triển mô hình MAI-1 để cạnh tranh với các Gemini của Google và GPT của OpenAI - Ảnh: Reuters

Microsoft đặt mục tiêu nội bộ là tích lũy 1,8 triệu GPU vào cuối năm 2024, theo tài liệu mà trang Insider nhìn thấy.

Gã khổng lồ công nghệ Mỹ đang cố gắng tạo ra mô hình AI nhanh hơn, tốt hơn và rẻ hơn, nhưng nỗ lực này chủ yếu phụ thuộc vào việc công ty mua chip, chủ yếu là GPU từ Nvidia. Tài liệu nội bộ gợi ý rằng Microsoft có kế hoạch tăng gấp ba số lượng GPU mà hãng đang có vào năm 2024.

Hợp tác với OpenAI, Microsoft đang dẫn đầu trong sự bùng nổ AI tạo sinh. Thế nhưng, duy trì vị trí hàng đầu trong lĩnh vực này là việc khó khăn và rất tốn kém.

Từ năm tài chính hiện tại đến năm tài chính 2027, Microsoft dự kiến sẽ chi khoảng 100 tỉ USD cho GPU và trung tâm dữ liệu, hai người quen thuộc với kế hoạch này nói với Insider.

Những gã khổng lồ công nghệ khác cũng đang xây dựng kho GPU khổng lồ. Đó là một trong những lý do giúp Nvidia tăng trưởng mạnh và hiện có vốn hóa thị trường hơn 2.300 tỉ USD. Nvidia hiện là nhà cung cấp GPU số 1 thế giới.

Mark Zuckerberg, Giám đốc điều hành Meta Platforms, hồi đầu năm nay cho biết công ty truyền thông xã hội này sẽ mua khoảng 350.000 GPU Nvidia H100 vào năm 2024. Kết hợp với số GPU tương đương từ các nhà cung cấp khác, Meta Platforms sẽ có tổng cộng khoảng 600.000 GPU vào cuối năm 2024, theo Mark Zuckerberg.

Nvidia gần đây đã giới thiệu B200 Blackwell, GPU mới nhất và nhanh nhất của hãng. Trong khi H100 của Nvidia (giá 30.000 USD) là một trong những GPU mạnh nhất hiện có trên thị trường, nhưng rất khan hiếm.

Theo Nvidia, B200 Blackwell có tốc độ xử lý một số tác vụ nhanh hơn 30 lần so với H100. Jensen Huang, Giám đốc điều hành Nvidia, nói với trang CNBC rằng B200 Blackwell sẽ có giá từ 30.000 đến 40.000 USD (gần 1 tỉ đồng). Sau đó, ông nói rằng Nvidia sẽ đưa B200 Blackwell vào các hệ thống máy tính lớn hơn và giá sẽ thay đổi tùy theo giá trị mà chúng mang lại.

Theo Nvidia, B200 Blackwell dự kiến sẽ xuất xưởng vào cuối năm 2024. Nvidia cho biết các khách hàng lớn gồm Amazon, Google, Microsoft, OpenAI và Oracle dự kiến sẽ sử dụng B200 Blackwell trong các dịch vụ điện toán đám mây mà họ cung cấp, cũng như các dịch vụ AI riêng.

Insider mới đây có được một tài liệu khác tiết lộ Microsoft đang đảm bảo có số lượng GPU kỷ lục để xử lý khối lượng công việc AI mới trong các trung tâm dữ liệu.

Trong nửa cuối năm ngoái, Microsoft đã cung cấp "lượng GPU ở mức kỷ lục", tăng hơn gấp đôi tổng số GPU đã được lắp đặt của mình, tài liệu nêu rõ mà không đề cập đến con số thực tế.

Số lượng và phạm vi GPU của Microsoft đã mở rộng sang thêm 39 trung tâm dữ liệu trong giai đoạn này. Gã khổng lồ công nghệ Mỹ hiện có nhóm các máy tính được kết nối và tối ưu hóa để thực hiện các tác vụ AI hoạt động tại 98 địa điểm trên toàn cầu.

Các nhà phân tích tại hãng DA Davidson ước tính rằng Microsoft đã chi 4,5 tỉ USD cho GPU Nvidia vào năm ngoái, con số mà một nhà quản lý tại Microsoft nói là gần với mức chi tiêu thực tế của họ.

Microsoft có nỗ lực nội bộ nhằm thiết kế chip AI của riêng mình nhằm giảm sự phụ thuộc vào Nvidia, nhưng một số nhân viên tỏ ra nghi ngờ dự án này vì công ty đi sau Nvidia nhiều năm và công nghệ tiên tiến phát triển quá nhanh.

Gần đây, Microsoft đã mở rộng đáng kể công suất trung tâm dữ liệu của mình và có kế hoạch gia tăng đến mức đáng kinh ngạc trong tương lai, theo một tài liệu nội bộ khác của công ty mà trang Insider có được.

Tài liệu tiết lộ, kể từ tháng 7.2023, thời điểm bắt đầu năm tài chính mới nhất của Microsoft, hãng công nghệ lớn này đã cung cấp hơn 500 megawatt công suất cho trung tâm dữ liệu mới.

Đây là một phần trong bản trình bày bí mật của nhóm Cloud Operations + Innovation thuộc Microsoft vào đầu năm nay.

Với tiêu đề “Nhu cầu về đám mây thương mại và AI: Thúc đẩy sự mở rộng của chúng ta”, tài liệu lưu ý rằng Microsoft đã vượt qua 5 gigawatt tổng công suất trung tâm dữ liệu được lắp đặt trong nửa đầu năm tài chính mới nhất.

AI tạo sinh và các mô hình ngôn ngữ lớn trỗi dậy đang thúc đẩy sự bùng nổ của các trung tâm dữ liệu mới. Những mô hình AI cần được đào tạo dựa trên lượng lớn dữ liệu và sau đó tinh chỉnh kỹ lưỡng. Việc đó cần hàng ngàn GPU và hàng loạt thiết bị liên quan khác được đặt trong các trung tâm dữ liệu khổng lồ. Những trung tâm này sử dụng nhiều năng lượng đến mức công suất của chúng được đo bằng megawatt và gigawatt điện.

Theo Shaolei Ren, giáo sư kỹ thuật điện và máy tính tại Đại học California ở Riverside (bang California, Mỹ), công suất trung tâm dữ liệu được lắp đặt đến 5 gigawatt của Microsoft tương đương với mức tiêu thụ năng lượng hàng năm của Hồng Kông hoặc Bồ Đào Nha.

Không dừng lại ở đó, Microsoft thậm chí còn vạch ra các kế hoạch tăng trưởng đáng kể cho các trung tâm dữ liệu của mình. Cụ thể hơn:

- Microsoft muốn tăng gấp đôi công suất trung tâm dữ liệu mới trong nửa cuối năm tài chính của mình. Quá trình này diễn ra từ đầu 2024 đến giữa năm nay.

- Trong nửa đầu năm tài chính 2025 của Microsoft (kéo dài từ đầu tháng 7 đến cuối 2024), công ty đặt mục tiêu “đạt mức tăng trưởng gấp 3 lần” về công suất của trung tâm dữ liệu mới. Điều này sẽ yêu cầu Microsoft phải cung cấp hơn 200 megawatt công suất cho trung tâm dữ liệu mỗi tháng.

“Đó là tốc độ đáng kinh ngạc. Đây là công suất trung tâm dữ liệu rất lớn", Shaolei Ren nói với Insider.

Shaolei Ren giải thích, các kế hoạch công suất của Microsoft cho thấy công ty đang nhận thấy nhu cầu rất lớn hoặc đơn giản là muốn duy trì tính cạnh tranh bằng cách đảm bảo có công suất điện trong tương lai mà các đối thủ có thể lấy mất.

Theo ông, điều này cũng đặt ra câu hỏi về tác động đến môi trường từ việc xây dựng thêm một trung tâm dữ liệu lớn như vậy, do lượng khí thải carbon và mức tiêu thụ nước ở cơ sở này.