Ngày đầu tiên sau khi ra mắt, GPT-4 khiến nhiều người dùng bất ngờ trong các bài kiểm tra sơ bộ và bài trình diễn công ty với khả năng viết những bản kiện cáo, đỗ các kỳ thi chuẩn hóa, xây dựng trang web hoạt động từ một bản vẽ tay.
Hôm 14.3, OpenAI đã công bố GPT-4, phiên bản tiếp theo của công nghệ trí tuệ nhân tạo (AI) làm nền tảng cho ChatGPT.
GPT-4 mạnh mẽ hơn GPT-3.5, có khả năng thay đổi cách chúng ta sử dụng internet để làm việc, giải trí và sáng tạo. Tuy nhiên, GPT-4 cũng có thể đưa ra những câu hỏi đầy thách thức xung quanh cách các công cụ AI có thể làm đảo lộn nghề nghiệp, cho phép sinh viên gian lận và thay đổi mối quan hệ của chúng ta với công nghệ.
GPT-4 là phiên bản cập nhật mô hình ngôn ngữ lớn của OpenAI, được đào tạo trên lượng dữ liệu trực tuyến lớn để tạo ra các phản hồi phức tạp cho yêu cầu của người dùng.
Hiện GPT-4 có sẵn thông qua danh sách chờ và đã được tích hợp vào một số sản phẩm bên thứ ba, gồm cả phiên bản mới công cụ tìm kiếm Bing của Microsoft. Một số người dùng được cấp quyền truy cập sớm vào GPT-4 đã chia sẻ trải nghiệm của họ và đưa ra một số ví dụ hấp dẫn.
Dưới đây là cái nhìn sâu hơn về tiềm năng của GPT-4:
Phân tích cả hình ảnh
Về cốt lõi, thay đổi lớn nhất ở GPT-4 là khả năng hoạt động với ảnh mà người dùng tải lên. Một trong những trường hợp sử dụng đáng kinh ngạc nhất đến nay là từ bản trình diễn video của OpenAI cho thấy cách một bản vẽ có thể được chuyển thành trang web hoạt động trong vòng vài phút. Người trình diễn đã tải ảnh lên GPT-4, sau đó dán mã kết quả vào bản xem trước cho thấy đây có thể là một trang web đang hoạt động như thế nào.
Từ thông báo của mình, OpenAI cũng chỉ ra cách GPT-4 được yêu cầu giải thích một trò đùa từ loạt hình ảnh, trong đó có một chiếc smartphone cắm nhầm bộ sạc, và mô tả lý do tại sao điều đó buồn cười. Dù nghe có vẻ đơn giản nhưng việc phân tích một trò đùa phức tạp hơn với các công cụ AI do phải có bối cảnh cần thiết.
Trong một thử nghiệm khác, tờ The New York Times đã cho GPT-4 xem một bức ảnh bên trong tủ lạnh và nhắc nó nghĩ ra bữa ăn dựa trên các nguyên liệu trong đó.
Tính năng tải ảnh chưa khả dụng trên GPT-4 nhưng dự kiến sẽ được triển khai trong vài tuần tới.
Viết mã dễ dàng hơn
Một số người dùng ban đầu có rất ít hoặc không có kiến thức viết mã trước đó cũng đã sử dụng GPT-4 để tạo lại các game mang tính biểu tượng như Pong, Tetris hoặc Snake sau khi làm theo hướng dẫn từng bước do công cụ cung cấp về cách thực hiện. Những người khác tạo ra các game của riêng họ. GPT-4 có thể viết mã bằng tất cả các ngôn ngữ lập trình chính, theo OpenAI.
Arun Chandrasekaran, nhà phân tích tại công ty Gartner Research, cho biết: “Khả năng ngôn ngữ mạnh mẽ của GPT-4 sẽ được sử dụng cho mọi thứ, từ xây dựng cốt truyện, tạo nhân vật cho đến nội dung game. Điều này có thể tạo ra nhiều nhà cung cấp game độc lập hơn trong tương lai. GPT-4 và các mô hình tương tự có thể được sử dụng để tạo nội dung tiếp thị xung quanh các bản xem trước game, tạo các bài báo và thậm chí kiểm duyệt các diễn đàn thảo luận về game”.
Tương tự như game, GPT-4 có thể thay đổi cách nhiều người phát triển ứng dụng. Một người dùng trên Twitter cho biết đã tạo một ứng dụng vẽ đơn giản vài phút. Trong khi một người khác tuyên bố đã viết mã ứng dụng đề xuất 5 bộ phim mới mỗi ngày, cùng với việc cung cấp các đoạn giới thiệu và thông tin chi tiết về nơi xem chúng.
Lian Jye Su, nhà phân tích tại công ty ABI Research, nói: “Viết mã giống như học cách lái xe, miễn là người mới bắt đầu được hướng dẫn, thì bất kỳ ai cũng có thể viết mã. AI có thể là một giáo viên tốt”.
Vượt qua các bài kiểm tra với điểm cao
Dù OpenAI cho biết GPT-4 kém hơn con người trong nhiều tình huống ở thế giới thực, nhưng thể hiện “hiệu suất ở cấp độ con người” trong các bài kiểm tra chuyên môn và học thuật khác nhau.
OpenAI nói GPT-4 gần đây đã vượt qua kỳ thi trở thành luật sư ở Mỹ với số điểm nằm trong khoảng 10% người dự thi có điểm cao nhất, hoàn toàn trái ngược với GPT-3.5.
Theo OpenAI, phiên bản mới nhất cũng thể hiện tốt trong các kỳ thi LSAT, GRE, SAT và nhiều kỳ thi AP.
LSAT là kỳ thi chuẩn hóa được tổ chức bởi Hội đồng Kiểm định Luật sư (LSAC) của Mỹ.
SAT là bài thi đánh giá năng lực chuẩn hóa được sử dụng rộng rãi cho xét tuyển đại học trong hệ thống giáo dục Mỹ.
GRE là bài thi khảo thí theo tiêu chuẩn và điều kiện xét tuyển của các trường đại học ở Mỹ.
AP là kỳ thi xếp lớp nâng cao do College Board (tổ chức phi lợi nhuận chuyên về giáo dục và kiểm tra chuẩn đầu ra trong giáo dục trung học, đại học) tổ chức tại Mỹ và được thực hiện vào tháng 5 hàng năm cho học sinh.
Vào tháng 1, ChatGPT gây chú ý khi vượt qua các kỳ thi cấp độ sau đại học có uy tín, chẳng hạn kỳ thi của Trường Kinh doanh Wharton thuộc Đại học Pennsylvania, nhưng không đạt điểm quá cao.
OpenAI cho biết đã dành nhiều tháng để sử dụng các bài học từ chương trình thử nghiệm của mình và ChatGPT để cải thiện độ chính xác cùng khả năng bám sát chủ đề của hệ thống.
Cung cấp phản hồi chính xác hơn
Theo OpenAI, so với phiên bản trước, GPT-4 có thể tạo ra các phản hồi bằng văn bản dài hơn, chi tiết hơn và đáng tin cậy hơn.
GPT-4 hiện có thể đưa ra câu trả lời lên tới 25.000 từ, tăng từ khoảng 4.000 từ trước đây và có thể cung cấp hướng dẫn chi tiết cho cả những tình huống độc đáo nhất, từ cách làm sạch bể cá của cá piranha đến trích xuất DNA quả dâu tây. Một người dùng GPT-4 sớm nói rằng nó cung cấp các đề xuất chi tiết cho những câu nói tán tỉnh dựa trên một câu hỏi được liệt kê trên hồ sơ hẹn hò.
Hợp lý hóa công việc trong các ngành công nghiệp khác nhau
Joshua Browder, Giám đốc điều hành chatbot dịch vụ pháp lý DoNotPay, cho biết công ty của ông đang nghiên cứu sử dụng GPT-4 để tạo ra “các vụ kiện chỉ bằng một cú nhấp chuột” để kiện những kẻ lừa đảo. Đây là dấu hiệu ban đầu cho thấy tiềm năng to lớn của GPT-4 trong việc thay đổi cách mọi người làm việc trong các ngành.
“Hãy tưởng tượng bạn nhận được một cuộc gọi, bấm nút thì cuộc gọi được chuyển thành văn bản và một đơn kiện dài 1.000 từ được tạo ra. GPT-3.5 không đủ tốt, nhưng GPT-4 xử lý công việc này rất tốt”, Joshua Browder cho hay.
Theo Lian Jye Su, có thể chúng ta cũng sẽ thấy những tiến bộ lớn trong bảng điều khiển ô tô có khả năng kết nối, chẩn đoán từ xa trong chăm sóc sức khỏe và các ứng dụng AI khác mà trước đây không thể thực hiện được.
Hạn chế của GPT-4
Dù OpenAI đã thực hiện những cải tiến lớn với mô hình AI của mình, GPT-4 cũng có những hạn chế tương tự như các phiên bản trước. OpenAI cho biết GPT-4 thiếu kiến thức về các sự kiện xảy ra trước khi bộ dữ liệu của nó bị cắt (tháng 9.2021) và không học hỏi từ kinh nghiệm có được. Công ty khởi nghiệp có trụ sở ở thành phố San Francisco (Mỹ) cho biết GPT-4 cũng có thể mắc “lỗi suy luận đơn giản hoặc quá cả tin khi chấp nhận những tuyên bố sai rõ ràng từ người dùng” và không kiểm tra lại công việc.
Arun Chandrasekaran nói điều này cũng phản ánh nhiều mô hình AI ngày nay: “Đừng quên rằng những mô hình AI này không hoàn hảo. Đôi khi chúng có thể tạo ra thông tin không chính xác”.
Hiện tại, OpenAI cho biết người dùng GPT-4 nên thận trọng và sử dụng hết sức cẩn thận, đặc biệt là “trong bối cảnh rủi ro cao”.