DeepSeek (Trung Quốc) không vội vàng huy động thêm vốn hoặc tham gia vào các hoạt động thương mại mới, thay vào đó tập trung vào việc đạt được trí tuệ nhân tạo tổng quát (AGI).
Nhịp đập khoa học

DeepSeek tập trung đạt được siêu AI thay vì lợi nhuận nhanh chóng, chưa huy động thêm vốn

Sơn Vân 27/02/2025 13:17

DeepSeek (Trung Quốc) không vội vàng huy động thêm vốn hoặc tham gia vào các hoạt động thương mại mới, thay vào đó tập trung vào việc đạt được trí tuệ nhân tạo tổng quát (AGI).

Theo các nguồn tin và báo cáo phương tiện truyền thông, công ty khởi nghiệp trí tuệ nhân tạo (AI) DeepSeek đã ưu tiên nghiên cứu hơn là lợi nhuận tài chính nhanh chóng trong tháng 2 sau khi phát hành mô hình lý luận gây chấn động thế giới.

Kể từ khi mô hình lý luận R1 trở thành tâm điểm ở Thung lũng Silicon và Phố Wall, DeepSeek đã duy trì sự kín tiếng, với rất ít sự giao tiếp với công chúng bên ngoài cộng đồng nhà phát triển.

DeepSeek là công ty khởi nghiệp có trụ sở tại Hàng Châu do Lương Văn Phong sáng lập và tách ra từ quỹ đầu cơ định lượng High-Flyer.

Quỹ đầu cơ định lượng là một loại quỹ đầu cơ sử dụng mô hình toán học, thuật toán và AI để phân tích dữ liệu và ra quyết định đầu tư thay vì dựa vào cảm tính hoặc đánh giá chủ quan của con người.

Đặc điểm của quỹ đầu cơ định lượng

Dựa vào dữ liệu và thuật toán

Sử dụng dữ liệu tài chính, kinh tế và các chỉ báo thị trường để đưa ra quyết định giao dịch.

Áp dụng các mô hình toán học và AI để phát hiện cơ hội đầu tư.

Giao dịch tự động

Các quyết định mua/bán được thực hiện bởi hệ thống giao dịch thuật toán (algorithmic trading) mà không cần con người can thiệp.

Giao dịch tốc độ cao (High-Frequency Trading) có thể thực hiện hàng nghìn giao dịch chỉ trong vài giây.

Chiến lược đầu tư phức tạp

Arbitrage (kinh doanh chênh lệch giá): Tận dụng sự khác biệt giá giữa các thị trường.

Statistical Arbitrage (chênh lệch giá thống kê): Dựa vào phân tích thống kê để tìm ra các giao dịch có xác suất lợi nhuận cao.

Machine Learning & AI Trading: Ứng dụng AI để tìm quy luật trong dữ liệu tài chính.

Quản lý rủi ro cao

Hệ thống có thể cắt lỗ nhanh chóng nếu mô hình nhận thấy tín hiệu bất lợi. Tuy nhiên, rủi ro từ lỗi thuật toán hoặc sự kiện thị trường bất thường có thể gây thua lỗ lớn.

Vai trò của quỹ đầu cơ định lượng trong AI

Quỹ đầu cơ định lượng như High-Flyer (công ty mẹ của DeepSeek) thường sở hữu lượng lớn tài nguyên tính toán mạnh mẽ để phân tích dữ liệu và giao dịch thuật toán. Chính những nguồn lực này có thể được tái sử dụng để phát triển mô hình AI, giống cách DeepSeek sử dụng cơ sở hạ tầng từ High-Flyer để xây dựng các mô hình AI tiên tiến.

Lương Văn Phong không đưa ra bất kỳ bình luận công khai nào và không nhận lời phỏng vấn của giới truyền thông trong tháng 1. Dù Lương Văn Phong được Đài truyền hình Trung ương Trung Quốc (CCTV) chiếu thoáng qua khi tham dự hội nghị chuyên đề cấp cao do Chủ tịch Tập Cận Bình chủ trì tuần trước, ông không có phát biểu nào được trích dẫn trong bản tin của truyền thông.

Lương Văn Phong chỉ xuất hiện trước công chúng gần đây với tư cách là đồng tác giả của một bài báo có tựa đề Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention, cùng với 14 tác giả khác. Ít nhất 12 trong số 15 tác giả bài báo này cũng tham gia vào nghiên cứu về R1. Điều này cho thấy Lương Văn Phong đã trực tiếp tham gia nghiên cứu cùng các nhà khoa học trẻ của DeepSeek.

Một nguồn tin thân cận với công ty, yêu cầu giấu tên, cho biết DeepSeek không vội tiến hành gây quỹ thêm hoặc tham gia vào các hoạt động thương mại mới. Thay vào đó, Lương Văn Phong tập trung vào việc thúc đẩy trí tuệ nhân tạo tổng quát (AGI) bằng cách cải thiện hiệu quả và khả năng của mô hình với nguồn lực tối thiểu.

AGI là dạng AI có khả năng hiểu, học hỏi và thực hiện các nhiệm vụ đa dạng một cách linh hoạt, giống hay vượt trội con người. Không giống AI hẹp, vốn chỉ giỏi trong một lĩnh vực cụ thể (như nhận dạng giọng nói hoặc hình ảnh), AGI có khả năng áp dụng kiến thức và kỹ năng trong nhiều lĩnh vực khác nhau, từ đó giải quyết các vấn đề phức tạp một cách tự chủ và sáng tạo. OpenAI định nghĩa AGI là "một hệ thống có tính tự chủ cao, vượt trội hơn con người ở hầu hết công việc có giá trị kinh tế".

"Liệu đó có phải là một lựa chọn khôn ngoan không và có thể duy trì nghiên cứu trong bao lâu, chỉ có thời gian mới trả lời được. Một vấn đề quan trọng là quy luật mở rộng vẫn tồn tại, và rất khó để duy trì vị thế dẫn đầu chỉ bằng cách cải thiện thuật toán", người giấu tên này nói về các ưu tiên chính của DeepSeek.

DeepSeek không trả lời khi được trang SCMP đề nghị bình luận.

deepseek-tap-trung-vao-viec-dat-duoc-sieu-ai-thay-vi-loi-nhuan-nhanh-chong-tu-choi-nhan-dau-tu.jpg
DeepSeek không vội vàng huy động thêm vốn hoặc tham gia vào các hoạt động thương mại mới, thay vào đó tập trung vào việc đạt được AGI - Ảnh: Internet

Dù trở thành một trong những doanh nghiệp nổi tiếng và được kính trọng nhất Trung Quốc, DeepSeek vẫn giữ hình ảnh công ty khởi nghiệp kín tiếng, từ chối tiếp nhận khách ghé thăm và các nhà đầu tư tiềm năng. DeepSeek làm rõ rằng họ chỉ có ba tài khoản mạng xã hội chính thức trên X, WeChat và RedNote.

DeepSeek cũng giữ im lặng về đội ngũ, cấu trúc nội bộ và lịch trình nghiên cứu của mình.

Tuần này, Reuters đưa tin DeepSeek đang đẩy nhanh quá trình ra mắt R2 - phiên bản nâng cấp của R1 (trình làng tháng 1).

Công ty có trụ sở tại Hàng Châu ban đầu dự định phát hành R2 vào đầu tháng 5, nhưng giờ đây muốn tung ra sớm nhất có thể, hai trong số các nguồn tin của Reuters cho biết.

DeepSeek hy vọng R2 sẽ cải thiện khả năng lập trình và có thể suy luận bằng nhiều ngôn ngữ ngoài tiếng Anh.

Các đối thủ vẫn đang đánh giá tác động của R1, vốn được xây dựng bằng các chip Nvidia kém mạnh mẽ hơn nhưng vẫn có khả năng cạnh tranh với những mô hình AI được các gã khổng lồ công nghệ Mỹ phát triển với chi phí lên đến hàng tỉ USD.

"Sự ra mắt của mô hình R2 của DeepSeek có thể trở thành cột mốc quan trọng trong ngành AI", Vijayasimha Alilughatta, Giám đốc điều hành nhà cung cấp dịch vụ công nghệ Zensar (Ấn Độ), nhận định. Thành công của DeepSeek trong việc tạo ra các mô hình AI tiết kiệm chi phí "có thể sẽ thúc đẩy các công ty trên toàn thế giới đẩy nhanh nỗ lực phá vỡ sự thống trị của một số ít công ty lớn trong lĩnh vực này", ông nói.

R2 có khả năng làm dấy lên mối lo ngại với chính phủ Mỹ, khi nước này coi AI là ưu tiên quốc gia. Việc phát hành R2 có thể càng khiến chính quyền và doanh nghiệp Trung Quốc phấn khích, với hàng chục công ty tuyên bố bắt đầu tích hợp các mô hình AI DeepSeek vào sản phẩm của mình.

Trước đó, DeepSeek đã mất 7 tháng để chuyển từ mô hình ngôn ngữ lớn V2 (phát hành vào tháng 5.2024) sang phiên bản V3 được cập nhật trong tháng 12.2024. R1, mô hình lập luận dựa trên V3, được DeepSeek phát hành vào tháng 1.2025.

Đội ngũ của Lương Văn Phong vẫn tiếp tục chia sẻ những thành tựu nghiên cứu với cộng đồng nhà phát triển. Tuần này, DeepSeek đã thực hiện cam kết chia sẻ chi tiết kỹ thuật về hạ tầng AI của mình bằng cách phát hành ba kho lưu trữ mã nguồn mở, giúp làm sáng tỏ cách công ty xây dựng các mô hình AI hiệu suất cao với chi phí thấp.

Các nhà phát triển đã ca ngợi động thái của DeepSeek vì tạo điều kiện thúc đẩy tiến bộ trong lĩnh vực này. Một nhóm nhỏ các nhà nghiên cứu DeepSeek đã tham dự một phiên họp kín tại Hội nghị các nhà phát triển toàn cầu ở Thượng Hải cuối tuần trước, theo truyền thông địa phương.

Trong hai cuộc phỏng vấn trước đó với ấn phẩm tin tức công nghệ 36Kr (Trung Quốc), Lương Văn Phong cho biết mục tiêu cuối cùng của DeepSeek là đạt được AGI, sứ mệnh mà công ty dường như đặt lên trên lợi ích kinh doanh với trọng tâm là cung cấp công nghệ nguồn mở.

"Đích đến của chúng tôi là AGI. Mô hình ngôn ngữ lớn có thể là một con đường cần thiết dẫn đến AGI", Lương Văn Phong nói trong cuộc phỏng vấn với 36Kr vào tháng 7.2024.

Khi được hỏi về thời điểm có thể đạt được AGI, Lương Văn Phong nói rằng "có thể mất 2 năm, 5 năm hoặc thậm chí 10 năm, nhưng cuối cùng thì sẽ đạt được nó trong thời đại của chúng ta".

Hôm 26.2, DeepSeek đã giới thiệu mức giá giảm sâu cho các nhà phát triển muốn sử dụng mô hình AI của hãng để xây dựng sản phẩm riêng. Động thái này có thể gây áp lực lên các đối thủ ở Trung Quốc và quốc tế trong việc cắt giảm giá.

Các mô hình AI chi phí thấp của DeepSeek đã gây ra đợt bán tháo lớn trên thị trường chứng khoán toàn cầu vào tháng trước, khi các nhà đầu tư lo ngại rằng sự xuất hiện của chúng có thể đe dọa các ông lớn hiện tại trong ngành AI.

DeepSeek cho biết trong khung giờ từ 16:30 GMT đến 00:30 GMT, chi phí sử dụng API (nền tảng cho phép các nhà phát triển tích hợp mô hình AI của DeepSeek vào ứng dụng và sản phẩm web) sẽ giảm tới 75%.

Theo bảng giá trên trang web của DeepSeek, chi phí sử dụng API của các mô hình R1 và V3 trong khung giờ này sẽ giảm lần lượt 75% và 50%.

Dù DeepSeek gọi khung giờ này là "ngoài giờ cao điểm" vì kéo dài từ 0 giờ 30 đến 8 giờ 30 theo giờ Bắc Kinh, nhưng thực tế lại rơi vào ban ngày tại châu Âu và Mỹ.

Việc giảm giá hôm 26.2 là động thái mới nhất trong chuỗi hành động của DeepSeek khiến ngành công nghiệp AI tại Trung Quốc và toàn cầu bị xáo trộn.

Sau khi khi DeepSeek gây sốt toàn cầu, OpenAI (công ty đứng sau ChatGPT) phải giảm giá sử dụng mô hình AI của mình, trong khi Google cũng đã giới thiệu các gói truy cập Gemini với mức giá ưu đãi hơn.

Bài liên quan
Giới công nghệ mong chờ báo cáo tài chính đầu tiên của Nvidia từ khi DeepSeek khiến cổ phiếu AI lao dốc
Báo cáo tài chính quý 4/2024 của Nvidia là một trong những sự kiện được mong đợi nhất trên thị trường chứng khoán, với các nhà đầu tư háo hức muốn xem liệu sự bùng nổ AI có tiếp tục thúc đẩy tăng trưởng hay không.

(0) Bình luận
Nổi bật Một thế giới
Lịch sử và ý nghĩa của Ngày Thầy thuốc Việt Nam 27.2
21 phút trước Thông tin Y học
Lấy mốc là ngày Chủ tịch Hồ Chí Minh gửi thư cho Hội nghị cán bộ ngành y tế, nên 27.2 hằng năm đã được chọn làm Ngày Thầy thuốc Việt Nam.
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
DeepSeek tập trung đạt được siêu AI thay vì lợi nhuận nhanh chóng, chưa huy động thêm vốn