Chủ tịch Trung Quốc Tập Cận Bình đã gặp gỡ các đại diện từ một số công ty khởi nghiệp trong lĩnh vực trí tuệ nhân tạo (AI) và robot trong chuyến thăm thành phố Thượng Hải.
o3 và o4-mini, hai mô hình trí tuệ nhân tạo (AI) suy luận mới của OpenAI, được xem là công nghệ tiên tiến hàng đầu hiện này ở nhiều khía cạnh. Tuy nhiên, o3 và o4-mini vẫn gặp bị "ảo giác", thậm chí còn nhiều hơn một số mô hình AI cũ của OpenAI.
Theo các hồ sơ của tòa án, Meta Platforms sử dụng quy trình ablation để xác định dữ liệu nào giúp cải thiện các mô hình trí tuệ nhân tạo (AI) Llama của mình.
Nhằm bảo vệ “báu vật” của mình, OpenAI hiện yêu cầu các nhà phát triển phải xác minh danh tính bằng giấy tờ tùy thân do chính phủ cấp nếu muốn truy cập vào những mô hình trí tuệ nhân tạo (AI) tiên tiến nhất của hãng.
Hôm 14.4, OpenAI đã ra mắt mô hình trí tuệ nhân tạo (AI) mới GPT-4.1, cùng hai phiên bản nhỏ hơn là GPT-4.1 mini và GPT-4.1 nano, với những cải tiến lớn trong lập trình, khả năng tuân theo hướng dẫn và hiểu ngữ cảnh dài.
Khi ứng dụng di động gặp sự cố, thường sẽ có một cuộc chạy đua để truy tìm lỗi phần mềm và sửa chữa càng nhanh càng tốt. Giờ đây, đã có trí tuệ nhân tạo (AI) hỗ trợ cho việc đó.
Đầu tuần này, Meta Platforms đã gặp rắc rối khi sử dụng một phiên bản thử nghiệm, chưa phát hành của mô hình Llama 4 Maverick để đạt điểm cao trên bảng xếp hạng LM Arena.
OpenAI cho rằng các mô hình trí tuệ nhân tạo (AI) suy luận của họ có khả năng vượt trội hơn mô hình thông thường trong một số lĩnh vực nhất định. Tuy điều này nhìn chung là đúng, nhưng các mô hình suy luận cũng gây tốn kém hơn nhiều khi đánh giá hiệu suất.
Các mô hình ngôn ngữ lớn được huấn luyện để phản hồi như con người. Giờ đây, chúng thể hiện một số đặc điểm gây bất tiện, đi kèm với khả năng suy luận và suy nghĩ quá mức (overthinking).
Với Llama 4, Meta Platforms đã thao túng các bài kiểm tra điểm chuẩn để làm cho mô hình trí tuệ nhân tạo (AI) mới của hãng trông vượt trội hơn so với các đối thủ cạnh tranh.
Google DeepMind vừa công bố hai mô hình AI tiên tiến dành cho robot, Gemini Robotics và Gemini Robotics-ER, đánh dấu một bước tiến lớn trong nỗ lực tạo ra những cỗ máy có thể hoạt động linh hoạt và thông minh hơn trong môi trường thực tế.
DeepSeek đã sử dụng kỹ thuật distillation (chưng cất) để tạo ra các mô hình trí tuệ nhân tạo (AI) nhỏ hơn nhưng mạnh mẽ, dựa trên công nghệ của các đối thủ như Meta Platforms và Alibaba.
Các công ty Trung Quốc đang đẩy mạnh đặt hàng chip trí tuệ nhân tạo (AI) H20 của Nvidia do nhu cầu tăng vọt với các mô hình AI nguồn mở của DeepSeek, theo sáu người am hiểu vấn đề.
Công ty khởi nghiệp DeepSeek (Trung Quốc) gây chấn động thị trường vào tháng 1 khi công bố mô hình AI nguồn mở có hiệu suất ngang hoặc hơn các sản phẩm tương tự của Mỹ nhưng được đào tạo với chi phí thấp hơn nhiều, dẫn đến đợt bán tháo cổ phiếu trong lĩnh vực công nghệ và bán dẫn.