CEO Be My Eyes: GPT-4 có thể giúp các công ty phục vụ tốt cộng đồng người mù

Nhịp đập khoa học - Ngày đăng : 18:35, 20/03/2023

Trí tuệ nhân tạo (AI) phát triển đã thúc đẩy nhiều công ty đầu tư và sử dụng công nghệ để cải tiến sản phẩm, dịch vụ của họ. Giám đốc điều hành Be My Eyes trình bày cách mà "bước nhảy vọt trong công nghệ" này giúp các công ty hoạt động tốt hơn trong việc cung cấp dịch vụ của họ.

"Những gì AI hứa hẹn là giải quyết những thách thức này nhanh hơn, không chỉ cho cộng đồng người khiếm thị mà còn cho các doanh nghiệp đang phục vụ người mù và khách hàng khác. Vì vậy, những gì chúng tôi thấy là một bước nhảy vọt trong công nghệ sẽ giúp cho các công ty hoạt động tốt hơn trong việc cung cấp dịch vụ của họ”, Mike Buckley, Giám đốc điều hành Be My Eyes, cho biết.

Trong ngành công nghiệp ô tô, chăm sóc sức khỏe, sản xuất và các ngành khác, các công ty đã dần áp dụng AI khi công nghệ này mở ra lãnh địa mới đầy hứa hẹn.

Cung cấp ứng dụng di động dành cho người khiếm thị, Be My Eyes vừa ra mắt công cụ trợ lý trực quan kỹ thuật số mới. Được tích hợp GPT-4, công cụ này có tên Virtual Volunteer, sử dụng AI để hỗ trợ người khiếm thị nhiều thứ trong cuộc sống.

Người dùng có thể gửi hình ảnh thông qua ứng dụng cho Virtual Volunteer để nhận bất kỳ câu hỏi nào về ảnh đó và được trợ giúp về thị giác tức thì cho các nhiệm vụ khác nhau.

Ví dụ, nếu người dùng gửi ảnh chụp bên trong tủ lạnh, Virtual Volunteer không chỉ có thể xác định chính xác những gì có trong đó, mà còn suy ra và phân tích những gì có thể được chuẩn bị với những nguyên liệu đó. Virtual Volunteer cũng có thể đưa ra một số công thức nấu ăn cho những nguyên liệu đó và gửi một hướng dẫn từng bước về cách làm chúng.

ceo-be-my-eyes-gpt-4-co-the-giup-cac-cong-ty-phuc-vu-tot-cong-dong-nguoi-mu.jpg — Virtual Volunteer của ứng dụng Be My Eyes hỗ trợ người khiếm thị nhiều thứ trong cuộc sống

Trong video quảng cáo bên dưới, Virtual Volunteer giúp người phụ nữ khiếm thị tên Lucy mô tả kiểu dáng chiếc váy, xác định một loại cây, đọc bản đồ, dịch nhãn trên chai, định hướng đến chiếc máy chạy bộ ở phòng tập thể dục và cho cô biết nên bấm nút nào tại máy bán hàng tự động.

Mike Buckley nói: "Chúng tôi có nửa triệu người mù và thị lực kém trên nền tảng này cùng hơn 6 triệu tình nguyện viên phục vụ họ. Chúng tôi cũng làm việc với các khách hàng như Microsoft, Spotify, P&G, Barilla để cải thiện dịch vụ khách hàng và khả năng tiếp cận của họ".

Hôm 14.3, OpenAI đã trình làng GPT-4, cung cấp phiên bản mới của ChatGPT Plus cho người dùng trả phí và API dành cho các nhà phát triển muốn xây dựng ứng dụng, dịch vụ.

Theo OpenAI, GPT-4 tiên tiến hơn trong ba lĩnh vực chính: Tính sáng tạo, đầu vào trực quan và ngữ cảnh dài hơn. Về khả năng sáng tạo, OpenAI cho biết GPT-4 tốt hơn nhiều trong cả việc tạo và cộng tác với người dùng trong các dự án sáng tạo. Ví dụ về những điều này gồm âm nhạc, kịch bản, viết kỹ thuật và thậm chí là “học phong cách viết của người dùng”.

GPT-4 hiện có thể xử lý tối đa 25.000 từ văn bản từ người dùng. Bạn thậm chí có thể gửi cho GPT-4 một liên kết web và yêu cầu nó tương tác với văn bản từ trang đó. OpenAI cho biết điều này có thể hữu ích cho việc tạo nội dung dài cũng như “các cuộc hội thoại mở rộng”.

GPT-4 hiện cũng có thể nhận hình ảnh làm cơ sở để tương tác. Trong ví dụ trên trang web GPT-4, mô hình ngôn ngữ mới được cung cấp hình ảnh của một số nguyên liệu làm bánh và được hỏi có thể làm gì với chúng.

Ngoài ra, OpenAI cũng cho biết GPT-4 sử dụng an toàn hơn đáng kể so với thế hệ trước. Theo báo cáo, GPT-4 có thể tạo ra nhiều phản hồi thực tế hơn 40% trong thử nghiệm nội bộ của chính OpenAI, đồng thời giảm 82% khả năng "phản hồi yêu cầu cho nội dung bị cấm". Theo đại diện OpenAI, công ty đã dành 6 tháng để tinh chỉnh GPT-4 theo hướng an toàn và phù hợp hơn.

OpenAI cho biết GPT-4 được đào tạo với phản hồi của con người để đạt được những bước tiến này, đồng thời tuyên bố đã làm việc với “hơn 50 chuyên gia để có phản hồi sớm trong các lĩnh vực bao gồm an toàn và bảo mật AI”.

Ngoài ra, OpenAI tuyên bố GPT-4 có thể lập trình bằng nhiều loại ngôn ngữ khác nhau, tạo kịch bản nội dung tùy theo yêu cầu, trả lời câu hỏi phức tạp cũng như tương tác với hình ảnh. Với khả năng tạo văn bản nhiều hơn 8 lần so với GPT-3.5, OpenAI cho biết mô hình ngôn ngữ mới có thể được sử dụng như một công cụ giảng dạy cho sinh viên.

"Chúng tôi mong muốn GPT-4 trở thành công cụ có giá trị trong việc cải thiện cuộc sống của mọi người bằng cách hỗ trợ nhiều ứng dụng. Vẫn còn rất nhiều việc phải làm và chúng tôi mong muốn cải thiện mô hình này thông qua nỗ lực chung của cộng đồng xây dựng trên cơ sở, khám phá và đóng góp cho mô hình", OpenAI viết.

Be My Eyes sử dụng GPT-4 để giúp giải quyết cụ thể các nhu cầu của cộng đồng người mù và thị lực kém.

"Công việc mà chúng tôi đang làm với việc mở rộng AI trong các công ty như Microsoft hiện nay là mang đến cho 253 triệu người tiêu dùng khiếm thị và thị lực kém trên thế giới khả năng tiếp cận các sản phẩm và dịch vụ của họ", Be My Eyes thông báo.

GPT-4 giúp chuyển đổi hình ảnh thành văn bản và mang đến cho những người mù hoặc thị lực kém một cơ hội mới để có thêm sự độc lập trong cuộc sống.

Jesper Hvirring Henriksen, Giám đốc công nghệ Be My Eyes, nói: “Sự khác biệt giữa GPT-4 với các mô hình máy học và ngôn ngữ khác là cả khả năng trò chuyện và năng lực phân tích chuyên sâu cao hơn do công nghệ này cung cấp”.

Ngoài Be My Eyes, các công ty như General Motors cũng đang mở rộng sản phẩm và dịch vụ thông qua tích hợp AI. Nhà sản xuất ô tô có trụ sở tại thành phố Detroit (bang Michigan, Mỹ) có kế hoạch sử dụng ChatGPT như trợ lý AI cho tài xế.

Bà Mary Barra, Giám đốc điều hành General Motors, đã trình bày chi tiết các sáng kiến mới của công ty tuần trước. ChatGPT sẽ đóng vai trò trợ lý ảo trên ô tô, hỗ trợ tài xế trong các tình huống di chuyển trên đường.

Chẳng hạn, tài xế có thể hỏi ChatGPT cách sử dụng một số tính năng nhất định trong ô tô thay vì phải mất thời gian tìm kiếm ở sách hướng dẫn sử dụng xe. Tài xế không chỉ có thể thiết lập các cuộc hẹn bảo trì mà còn có thể yêu cầu ChatGPT hỗ trợ khi cần thay lốp hoặc tìm điểm sạc xe điện.

Thực tế, điều khiển kích hoạt bằng giọng nói không mới mẻ trong thế giới ô tô, nhưng khả năng giao tiếp với AI có thể mang lại lợi ích. Theo giả thuyết được đưa ra, chủ ô tô có thể yêu cầu AI sắp xếp một cuộc hẹn dịch vụ để khắc phục sự cố.

Ngoài ra, tài xế thậm chí có thể sử dụng AI để lập trình các chức năng như mở cửa nhà để xe hoặc xem ChatGPT như một trợ lý cá nhân.

ChatGPT cũng có thể loại bỏ nhu cầu sử dụng ĐTDĐ khi lái xe. Các hệ thống thông tin giải trí hiện tại chủ yếu dựa vào Apple CarPlay và Android Auto, hiển thị thông tin cuộc gọi, tin nhắn lên màn hình giải trí.

Mary Barra nói: “Có một trợ lý và thực sự có thể sử dụng giọng nói đủ rõ ràng để bạn đặt câu hỏi cũng như nhận câu trả lời. Tôi nghĩ đó là điều mà AI sẽ giúp chúng ta làm được”.

Reuters đưa tin việc tích hợp ChatGPT này là một phần trong sự hợp tác giữa General Motors với Microsoft, công ty công bố có kế hoạch đầu tư 10 tỉ USD vào OpenAI.

Mike Buckley, Giám đốc điều hành Be My Eyes, lưu ý rằng một số báo cáo cho thấy AI là cơ hội trị giá 6.000 tỉ USD trên toàn cầu vì các lĩnh vực được ứng dụng của nó gần như vô hạn.

Bằng cách tích hợp AI, Mike Buckley lập luận rằng các công ty không chỉ có thể phát triển sản phẩm và dịch vụ của mình mà còn có cơ hội giúp đỡ nhiều đối tượng khách hàng hơn.

Sơn Vân