Những cải tiến đáng kinh ngạc và hạn chế của GPT-4

OpenAI đã chính thức công bố ChatGPT-4, xác nhận những tin đồn lâu nay xung quanh những cải tiến của nó với các kỹ năng ngôn ngữ vốn đã cực kỳ ấn tượng trong ChatGPT.

Công ty khởi nghiệp OpenAI (Mỹ) gọi đó là “hệ thống tiên tiến nhất của công ty, tạo ra các phản hồi an toàn hơn và hữu ích hơn”.

GPT-4 hiện chỉ khả dụng trong ChatGPT Plus (bản đăng ký trả phí). Phiên bản ChatGPT miễn phí hiện sẽ vẫn hoạt động dựa trên GPT-3.5.

GPT-4 cũng có sẵn dưới dạng API “dành cho nhà phát triển xây dựng ứng dụng và dịch vụ”. Một số công ty đã tích hợp GPT-4 có Duolingo, Be My Eyes, Stripe và Khan Academy. Được phát trực tiếp trên YouTube, video giới thiệu đầu tiên của OpenAI cho thấy một số tính năng mới của GPT-4.

Những cải tiến đáng kinh ngạc

GPT-4 là mô hình ngôn ngữ mới của OpenAI có thể tạo văn bản tương tự như lời nói con người. GPT-4 sẽ nâng cao công nghệ được sử dụng bởi ChatGPT, hiện hoạt động dựa trên GPT-3.5.

GPT là từ viết tắt của Generative Pre-training Transformer, công nghệ học sâu sử dụng mạng thần kinh nhân tạo để viết như con người.

Theo OpenAI, GPT-4 tiên tiến hơn trong ba lĩnh vực chính: Tính sáng tạo, đầu vào trực quan và ngữ cảnh dài hơn. Về khả năng sáng tạo, OpenAI cho biết GPT-4 tốt hơn nhiều trong cả việc tạo và cộng tác với người dùng trong các dự án sáng tạo. Ví dụ về những điều này gồm âm nhạc, kịch bản, viết kỹ thuật và thậm chí là “học phong cách viết của người dùng”.

GPT-4 hiện có thể xử lý tối đa 25.000 từ văn bản từ người dùng. Bạn thậm chí có thể gửi cho GPT-4 một liên kết web và yêu cầu nó tương tác với văn bản từ trang đó. OpenAI cho biết điều này có thể hữu ích cho việc tạo nội dung dài cũng như “các cuộc hội thoại mở rộng”.

GPT-4 hiện cũng có thể nhận hình ảnh làm cơ sở để tương tác. Trong ví dụ trên trang web GPT-4, mô hình ngôn ngữ mới được cung cấp hình ảnh của một số nguyên liệu làm bánh và được hỏi có thể làm gì với chúng. Hiện vẫn chưa biết liệu video cũng có thể được sử dụng theo cách tương tự hay không.

Ngoài ra, OpenAI cũng cho biết GPT-4 sử dụng an toàn hơn đáng kể so với thế hệ trước. Theo báo cáo, GPT-4 có thể tạo ra nhiều phản hồi thực tế hơn 40% trong thử nghiệm nội bộ của chính OpenAI, đồng thời giảm 82% khả năng "phản hồi yêu cầu cho nội dung bị cấm". Theo đại diện OpenAI, công ty đã dành 6 tháng để tinh chỉnh GPT-4 theo hướng an toàn và phù hợp hơn.

OpenAI cho biết GPT-4 được đào tạo với phản hồi của con người để đạt được những bước tiến này, đồng thời tuyên bố đã làm việc với “hơn 50 chuyên gia để có phản hồi sớm trong các lĩnh vực bao gồm an toàn và bảo mật AI”.

Trong sự kiện công bố GPT-4 ngày 14.3, Sam Altman, Giám đốc điều hành OpenAI, cho biết mô hình ngôn ngữ mới được cải tiến theo hướng sáng tạo hơn và ít thiên vị hơn so với bản trước đó. Ông nhấn mạnh đây là công nghệ AI tiên tiến chưa từng có, được đào tạo bằng cách sử dụng phản hồi của con người kết hợp công nghệ học sâu (deep learning).

GPT-4 có khả năng xử lý đa phương thức đầu vào, gồm cả hình ảnh, giúp người dùng tương tác với nhiều chế độ. Việc chấp nhận hình ảnh đầu vào và xuất ra văn bản là tính năng chưa có trước đây, được đánh giá giúp người dùng có thêm tùy chọn để sáng tạo.

Sam Altman cho biết GPT-4 có hàng loạt khả năng mà các hệ thống AI hiện chưa thể đạt được. Cụ thể hơn, GPT-4 có thể đạt 1.410 điểm trong kỳ thi SAT - một trong những kỳ thi chuẩn hóa cho việc đăng ký vào một số đại học tại Mỹ; đạt 4 hoặc 5 trong thang điểm 5 của các kỳ thi nâng cao (AP) ở các bộ môn Lịch sử Nghệ thuật, Sinh học, Giải tích và Hóa học - số điểm đủ cao để nhận được tín chỉ đại học.

GPT-4 đã đánh bại 90% số người tham gia để vượt qua kỳ thi sát hạch trở thành luật sư, vượt 99% học sinh thi Olympic Sinh học. GPT-4 cũng đạt điểm cao nhất trong ít nhất 34 bài kiểm tra khác nhau trong các lĩnh vực như kinh tế vĩ mô, viết bài, Toán học hay thậm chí nội dung về nghiên cứu rượu vang.

"GPT-4 thể hiện hiệu suất ở cấp độ con người trong phần lớn kỳ thi học thuật và chuyên nghiệp", đại diện OpenAI cho hay.

Hơn nữa, OpenAI tuyên bố GPT-4 có thể lập trình bằng nhiều loại ngôn ngữ khác nhau, tạo kịch bản nội dung tùy theo yêu cầu, trả lời câu hỏi phức tạp cũng như tương tác với hình ảnh. Với khả năng tạo văn bản nhiều hơn 8 lần so với GPT-3.5, OpenAI cho biết mô hình ngôn ngữ mới có thể được sử dụng như một công cụ giảng dạy cho sinh viên.

OpenAI gọi ChatGPT-4 là hệ thống tiên tiến nhất của công ty, tạo ra các phản hồi an toàn hơn và hữu ích hơn - Ảnh: Internet

Hạn chế

Trong khi thảo luận về các khả năng mới của GPT-4, OpenAI cũng lưu ý một số hạn chế của mô hình ngôn ngữ này. Giống như các phiên bản trước của GPT, OpenAI cho biết GPT-4 vẫn gặp vấn đề với “thành kiến xã hội, ảo giác và câu hỏi thù địch”.

Nói cách khác, GPT-4 không hoàn hảo, nhưng OpenAI cho biết đây là tất cả những vấn đề mà công ty đang nỗ lực giải quyết.

Bing chatbot có sử dụng GPT-4?

Microsoft ban đầu tuyên bố rằng Bing phiên bản mới (hay Bing chatbot) mạnh hơn ChatGPT. Vì tính năng trò chuyện của OpenAI sử dụng GPT-3.5, nên có ngụ ý rằng Bing chatbot đang dùng GPT-4 vào thời điểm đó. Bây giờ, Microsoft đã xác nhận rằng Bing chatbot thực sự được xây dựng trên GPT-4.

Tuy nhiên, các tính năng như đầu vào trực quan không khả dụng trên Bing chatbot, nên vẫn chưa rõ chính xác tính năng nào đã được và chưa được tích hợp.

Bất chấp điều đó, Bing chatbot rõ ràng đã được nâng cấp với khả năng truy cập thông tin hiện tại qua internet, cải tiến lớn so với ChatGPT hiện tại - chỉ có thể thu thập dữ liệu từ quá trình đào tạo nhận được cho đến năm 2021.

Ngoài khả năng truy cập internet, mô hình trí tuệ nhân tạo được sử dụng cho Bing chatbot còn xử lý nhanh hơn rất nhiều, điều đó rất quan trọng khi được áp dụng vào một công cụ tìm kiếm.

Tiến hóa chứ không phải cuộc cách mạng?

GPT-4 trên ChatGPT Plus chắc chắn ấn tượng hơn, xây dựng dựa trên thành công của ChatGPT. Trên thực tế, nếu đã thử dùng Bing chatbot, bạn có vẻ đã có một trải nghiệm về GPT-4. Song, bạn đừng mong GPT-4 là cái gì đó hoàn toàn mới.

Trước khi ra mắt GPT-4, Sam Altman đã nói trong một cuộc phỏng vấn với kênh SeriousVC rằng: “Mọi người đang kỳ vọng quá lớn và họ sẽ thất vọng”.

Sam Altman thừa nhận tiềm năng của generative AI có thể gây ra sự hỗn loạn cho nền kinh tế thế giới và bày tỏ rằng việc triển khai nhanh chóng một số thay đổi nhỏ sẽ tốt hơn là bước tiến đột phá đầy bất ngờ mang lại ít cơ hội cho thế giới thích nghi với những thay đổi.

Generative AI là một loại trí tuệ nhân tạo mà máy tính được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn. Các ví dụ của generative AI bao gồm các mô hình ngôn ngữ tự động tạo văn bản, các hệ thống nhận dạng hình ảnh, video và âm thanh.

Tóm lại, GPT-4 sẽ là sự tiến hóa chứ không phải cuộc cách mạng. Theo Sam Altman, phiên bản tiếp theo của ChatGPT sẽ không phải là generative AI và sẽ không có 100 ngàn tỉ tham số.