Hotline quảng cáo: 096 2445664 Hotline nội dung: 0934.999945

Khoa học - công nghệ

Dữ liệu đào tạo AI đã cạn kiệt

Cẩm Bình • 10/01/2025 12:30

Trang TechCrunch dẫn lời tỷ phú công nghệ Elon Musk tỏ ý đồng tình với nhiều chuyên gia khác rằng hiện còn rất ít dữ liệu thực tế để đào tạo các mô hình trí tuệ nhân tạo (AI).

“Về cơ bản chúng ta đã dùng hết tổng lượng kiến thức tích lũy của con người trong quá trình đào tạo AI. Điều đó xảy ra vào năm ngoái”, tỷ phú Musk phát biểu trong một cuộc trò chuyện phát trực tiếp trên mạng xã hội X.

Phát ngôn trên lặp lại quan điểm mà nhà khoa học AI Ilya Sutskever (từng làm việc cho công ty OpenAI) bày tỏ vào tháng 12.2024. Thời điểm đó chuyên gia này đánh giá ngành đã đạt đến “mức đỉnh dữ liệu”, tình trạng thiếu dữ liệu đòi hỏi phải thay đổi cách thức đào tạo các mô hình trí tuệ nhân tạo.

Theo tỷ phú Musk, dữ liệu tổng hợp (synthetic data) - dữ liệu được tạo ra bởi chính AI - là giải pháp khả thi trong tương lai. Ông nói: “Với dữ liệu tổng hợp, AI sẽ tự phân loại và trải qua quá trình tự học”.

Dữ liệu tổng hợp đang được không ít “ông lớn” công nghệ như Microsoft, Meta, OpenAI, Anthropic sử dụng cho công tác đào tạo các mô hình hàng đầu do họ phát triển. Đơn vị nghiên cứu Gartner ước tính 60% dữ liệu dùng cho số dự án AI và phân tích năm ngoái là dữ liệu tổng hợp.

Chẳng hạn Phi-4 của Microsoft tiếp nhận cả dữ liệu thực tế lẫn dữ liệu tổng hợp. Gemma của Google và Claude 3.5 Sonnet của Anthropic cũng tương tự. Thời gian gần đây Meta bắt đầu nhập dữ liệu tổng hợp cho mô hình Llama.

Đào tạo bằng dữ liệu tổng hợp có nhiều lợi ích, đặc biệt là tiết kiệm chi phí. Công ty khởi nghiệp AI Writer cho biết mô hình Palmyra X 004 của mình chỉ tốn 700.000 USD để phát triển khi sử dụng dữ liệu tổng hợp.

Tuy nhiên loại dữ liệu này cũng tồn tại rủi ro. Một số nghiên cứu chỉ ra dữ liệu tổng hợp có thể dẫn đến hiện tượng “sụp đổ mô hình” (model collapse) – mô hình AI trở nên kém sáng tạo hơn và có xu hướng thiên lệch trong đầu ra. Nguyên nhân do dữ liệu tổng hợp chứa đựng thiên kiến lẫn hạn chế từ chính mô hình tạo ra nó, dẫn đến dữ liệu đầu ra bị ảnh hưởng.

Bài liên quan

Đột phá với chip chạy bằng ánh sáng giúp tăng tốc đào tạo AI và giảm tiêu thụ năng lượng

Các kỹ sư tại Pennsylva (Mỹ) đã phát triển chip lập trình đầu tiên có khả năng đào tạo mạng nơ ron phi tuyến tính bằng ánh sáng - một bước tiến lớn có thể giúp tăng tốc đào tạo AI, giảm tiêu thụ năng lượng và có khả năng dẫn đến các hệ thống máy tính hoàn toàn sử dụng ánh sáng.

Đọc tiếp

'Ác mộng' của Nvidia: DeepSeek sử dụng chip Huawei để đào tạo AI

(0) Bình luận

Xếp theo:

Đọc thêm Khoa học - công nghệ

Nổi bật Một thế giới

Việt Nam mong muốn hợp tác chặt chẽ với Liên bang Nga để nâng tầm quan hệ

5 giờ trước Sự kiện

Tổng Bí thư Tô Lâm nhấn mạnh Việt Nam đặc biệt coi trọng quan hệ hữu nghị truyền thống, sẵn sàng hợp tác chặt chẽ với Liên bang Nga để nâng tầm quan hệ trên các trụ cột then chốt.

AI phân tích khuôn mặt giúp dự đoán khả năng sống sót ở bệnh nhân ung thư

Một nhóm các nhà khoa học đã phát triển công cụ trí tuệ nhân tạo (AI) có khả năng phân tích...
SoundCloud lên tiếng trước nghi ngờ liên quan sử dụng dữ liệu huấn luyện AI

SoundCloud đã lên tiếng sau bị nghi ngờ âm thầm thay đổi điều khoản sử dụng của mình. Điều...
Vì sao giá điện tăng 4,8%?

Theo EVN, quyết định tăng giá điện lần này được đưa ra sau quá trình cân nhắc kỹ lưỡng các...

Đừng bỏ lỡ

OpenAI đang loay hoay với bài toán quản trị

44 phút trước Khoa học - công nghệ

Dù vẫn duy trì mô hình quản trị bởi một hội đồng phi lợi nhuận, OpenAI đang đối mặt với những mâu thuẫn nội tại và thách thức trong định hướng phát triển khi các mô hình trí tuệ nhân tạo (AI) ngày càng tiến gần đến mức độ tự chủ cao.
Khác Mark Zuckerberg, Sam Altman không muốn con trai lớn lên với bạn thân là AI

2 giờ trước Nhịp đập khoa học

Sam Altman, Giám đốc điều hành OpenAI, cho biết không muốn con trai mình lớn lên với một người bạn thân là trí tuệ nhân tạo (AI).
Robot vừa theo dõi chất lượng nước, vừa là thức ăn cho cá

2 giờ trước Khoa học - công nghệ

Trang Interesting Engineering giới thiệu robot siêu nhỏ thực hiện nhiệm vụ theo dõi chất lượng nước, sau đó có thể trở thành thức ăn cho cá, do một nhóm nhà nghiên cứu từ Viện Bách khoa liên bang Thụy Sĩ (EPFL) phát triển.
Microsoft cấm nhân viên sử dụng DeepSeek

3 giờ trước Thế giới số

Trong phiên điều trần trước Thượng viện Mỹ vừa qua, lãnh đạo hãng Microsoft, Brad Smith đã tiết lộ các nhân viên của tập đoàn này không được phép sử dụng DeepSeek.
Pakistan cáo buộc Ấn Độ tấn công căn cứ không quân

4 giờ trước Chuyển động

Hãng Reuters dẫn lời phát ngôn viên quân đội Pakistan Ahmed Sharif Chaudhry cáo buộc Ấn Độ vừa bắn tên lửa vào 3 căn cứ không quân nước này vào rạng sáng 10.5, nhưng hầu hết đều bị đánh chặn.

Mới nhất

AI phân tích khuôn mặt giúp dự đoán khả năng sống sót ở bệnh nhân ung thư

30 phút trước Khoa học - công nghệ

Một nhóm các nhà khoa học đã phát triển công cụ trí tuệ nhân tạo (AI) có khả năng phân tích khuôn mặt bệnh nhân ung thư để dự đoán khả năng sống sót, với kết quả cho thấy trong một số trường hợp, AI vượt trội hơn so với đánh giá của bác sĩ lâm sàng về tiên lượng ngắn hạn.
SoundCloud lên tiếng trước nghi ngờ liên quan sử dụng dữ liệu huấn luyện AI

3 giờ trước Thế giới số

SoundCloud đã lên tiếng sau bị nghi ngờ âm thầm thay đổi điều khoản sử dụng của mình. Điều đó cho phép công ty sử dụng các tệp âm thanh do người dùng tải lên để huấn luyện trí tuệ nhân tạo (AI).
Việt Nam mong muốn hợp tác chặt chẽ với Liên bang Nga để nâng tầm quan hệ

5 giờ trước Sự kiện

Tổng Bí thư Tô Lâm nhấn mạnh Việt Nam đặc biệt coi trọng quan hệ hữu nghị truyền thống, sẵn sàng hợp tác chặt chẽ với Liên bang Nga để nâng tầm quan hệ trên các trụ cột then chốt.
Vì sao giá điện tăng 4,8%?

6 giờ trước Kinh tế - đầu tư - dự án

Theo EVN, quyết định tăng giá điện lần này được đưa ra sau quá trình cân nhắc kỹ lưỡng các yếu tố về biến động chi phí đầu vào.
Từng bước xây dựng hệ thống tài trợ khoa học chuẩn mực quốc tế

19 giờ trước Nhịp đập khoa học

Quỹ Phát triển KH-CN quốc gia không chỉ tài trợ cho nghiên cứu cơ bản, mà còn đảm nhận toàn diện các chương trình nghiên cứu ứng dụng và sản xuất. Đây là mô hình tổ chức quản lý nhiệm vụ mang tính hiện đại, hội nhập quốc tế…

Xem thêm

Cơ quan chủ quản: Hội Thông tin Khoa học và Công nghệ Việt Nam.

ĐC: 24 Lý Thường Kiệt, Hàng Bài, Hoàn Kiếm, Hà Nội.

ĐT: 024.38256203

Hotline nội dung : 0934999945

Tổng Thư ký Tòa soạn: Nguyễn Đình Mười

Giấy phép số 77/GP-BTTTT do Bộ Thông tin và Truyền thông cấp ngày 26 tháng 2 năm 2020.

Tòa nhà SIMCO Sông Đà, Tiểu KĐT mới Vạn Phúc, Phường Vạn Phúc, Quận Hà Đông, TP. Hà Nội

ĐT: 0984708866

TPHCM: 345/134 Trần Hưng Đạo, phường Cầu Kho, Quận 1

ĐT: 028.38389241

Email: toasoan@1thegioi.vn

Hotline quảng cáo: 096 2445664

Email quảng cáo: sales@1thegioi.vn

Báo giá quảng cáo:

Công ty Cổ phần Truyền thông Một Thế Giới

Dữ liệu đào tạo AI đã cạn kiệt

Đột phá với chip chạy bằng ánh sáng giúp tăng tốc đào tạo AI và giảm tiêu thụ năng lượng

đào tạo

trí tuệ nhân tạo

dữ liệu

'Ác mộng' của Nvidia: DeepSeek sử dụng chip Huawei để đào tạo AI

'Ác mộng' của Nvidia: DeepSeek sử dụng chip Huawei để đào tạo AI

Taxi bay dùng cả hydro và điện đầu tiên trên thế giới

Hội Thông tin KH-CN Việt Nam: Hành trình 25 năm phát triển

Liên hiệp Các hội KH-KT Việt Nam đẩy mạnh hợp tác quốc tế về phổ biến kiến thức khoa học

Siêu máy tính phục vụ y tế

Độc đáo robot hút bụi tự leo cầu thang

Cảnh giác với chiêu trò mạo danh nhân viên điện lực để lừa đảo

Việt Nam mong muốn hợp tác chặt chẽ với Liên bang Nga để nâng tầm quan hệ

AI phân tích khuôn mặt giúp dự đoán khả năng sống sót ở bệnh nhân ung thư

SoundCloud lên tiếng trước nghi ngờ liên quan sử dụng dữ liệu huấn luyện AI

Vì sao giá điện tăng 4,8%?

OpenAI đang loay hoay với bài toán quản trị

Khác Mark Zuckerberg, Sam Altman không muốn con trai lớn lên với bạn thân là AI

Robot vừa theo dõi chất lượng nước, vừa là thức ăn cho cá

Microsoft cấm nhân viên sử dụng DeepSeek

Pakistan cáo buộc Ấn Độ tấn công căn cứ không quân

AI phân tích khuôn mặt giúp dự đoán khả năng sống sót ở bệnh nhân ung thư

SoundCloud lên tiếng trước nghi ngờ liên quan sử dụng dữ liệu huấn luyện AI

Việt Nam mong muốn hợp tác chặt chẽ với Liên bang Nga để nâng tầm quan hệ

Vì sao giá điện tăng 4,8%?

Từng bước xây dựng hệ thống tài trợ khoa học chuẩn mực quốc tế

Đôi lời về 'vụ' sinh viên trường Văn Lang đối xử với cựu chiến binh

Cách giành lại quyền làm chủ bộ não khi nghiện ChatGPT và các chatbot AI

Huawei bị phát hiện bí mật xây đế chế chip ở Thâm Quyến, giúp Trung Quốc giảm phụ thuộc nước ngoài

The Information: iPhone 17 Air siêu mỏng nhưng pin yếu, chỉ có 1 loa

An Giang xử lý vụ hiệu trưởng bị tố quấy rối tình dục với nhiều nữ giáo viên