Theo các hồ sơ của tòa án, Meta Platforms sử dụng quy trình ablation để xác định dữ liệu nào giúp cải thiện các mô hình trí tuệ nhân tạo (AI) Llama của mình.
Đầu tuần này, Meta Platforms đã gặp rắc rối khi sử dụng một phiên bản thử nghiệm, chưa phát hành của mô hình Llama 4 Maverick để đạt điểm cao trên bảng xếp hạng LM Arena.
OpenAI cho rằng các mô hình trí tuệ nhân tạo (AI) suy luận của họ có khả năng vượt trội hơn mô hình thông thường trong một số lĩnh vực nhất định. Tuy điều này nhìn chung là đúng, nhưng các mô hình suy luận cũng gây tốn kém hơn nhiều khi đánh giá hiệu suất.
Các mô hình ngôn ngữ lớn được huấn luyện để phản hồi như con người. Giờ đây, chúng thể hiện một số đặc điểm gây bất tiện, đi kèm với khả năng suy luận và suy nghĩ quá mức (overthinking).
Với Llama 4, Meta Platforms đã thao túng các bài kiểm tra điểm chuẩn để làm cho mô hình trí tuệ nhân tạo (AI) mới của hãng trông vượt trội hơn so với các đối thủ cạnh tranh.
Google DeepMind vừa công bố hai mô hình AI tiên tiến dành cho robot, Gemini Robotics và Gemini Robotics-ER, đánh dấu một bước tiến lớn trong nỗ lực tạo ra những cỗ máy có thể hoạt động linh hoạt và thông minh hơn trong môi trường thực tế.
DeepSeek đã sử dụng kỹ thuật distillation (chưng cất) để tạo ra các mô hình trí tuệ nhân tạo (AI) nhỏ hơn nhưng mạnh mẽ, dựa trên công nghệ của các đối thủ như Meta Platforms và Alibaba.
Các công ty Trung Quốc đang đẩy mạnh đặt hàng chip trí tuệ nhân tạo (AI) H20 của Nvidia do nhu cầu tăng vọt với các mô hình AI nguồn mở của DeepSeek, theo sáu người am hiểu vấn đề.
Công ty khởi nghiệp DeepSeek (Trung Quốc) gây chấn động thị trường vào tháng 1 khi công bố mô hình AI nguồn mở có hiệu suất ngang hoặc hơn các sản phẩm tương tự của Mỹ nhưng được đào tạo với chi phí thấp hơn nhiều, dẫn đến đợt bán tháo cổ phiếu trong lĩnh vực công nghệ và bán dẫn.
Hashtag “hỏi DeepSeek liệu công việc của tôi có bị thay thế không” đang thịnh hành trên mạng xã hội Weibo của Trung Quốc, thu hút gần 7,2 triệu lượt xem.
Baidu tích hợp cả DeepSeek và các mô hình Ernie của riêng mình vào công cụ tìm kiếm, sau khi Tencent bắt đầu thử nghiệm công nghệ của công ty khởi nghiệp này trong tìm kiếm trên Weixin.
Khi công ty khởi nghiệp DeepSeek (Trung Quốc) khuấy đảo ngành công nghệ toàn cầu, nhiều người trong nước này đã thảo luận về những điều đã mang lại lợi thế bất ngờ cho các mô hình trí tuệ nhân tạo (AI) của họ so với đối thủ toàn cầu.
Trang Straits Times đưa tin Ấn Độ đẩy nhanh nỗ lực bắt kịp các quốc gia đang phát triển mô hình trí tuệ nhân tạo (AI) trên thế giới bằng cách hỗ trợ đội ngũ nghiên cứu lẫn doanh nghiệp tư nhân trong nước.