Nhịp đập khoa học

Ứng dụng AI mới của Ant Group khơi dậy giấc mơ trợ lý ảo cho Iron Man trở thành hiện thực

Sơn Vân • 07/09/2024 14:15

Gã khổng lồ công nghệ tài chính Ant Group bước vào lĩnh vực giống Jarvis khi ra mắt ứng dụng Zhixiaobao, trợ lý trí tuệ nhân tạo (AI) thông minh được thiết kế để sử dụng hàng ngày.

Ứng dụng AI mới nhất được công bố tại Trung Quốc dường như đang khơi dậy hy vọng của người tiêu dùng về một tương lai mà phiên bản Jarvis, trợ lý ảo thông minh của Tony Stark trong Vũ trụ Điện ảnh Marvel, trở nên phổ biến trong nền kinh tế lớn thứ hai thế giới.

Jarvis (Just a Rather Very Intelligent System) là trợ lý AI tinh vi xuất hiện trong bộ phim Iron Man năm 2008, trong đó nó quản lý và vận hành các hệ thống nội bộ phòng thí nghiệm, nhà riêng và áo giáp siêu anh hùng của Tony Stark.

Ant Group, công ty công nghệ tài chính thuộc gã khổng lồ thương mại điện tử Alibaba, bước vào lĩnh vực giống Jarvis khi ra mắt ứng dụng Zhixiaobao. Zhixiaobao được xem là “trợ lý cuộc sống” có thể giúp người dùng đặt bữa ăn, gọi taxi, đặt vé, khám phá các lựa chọn giải trí và ăn uống tại địa phương, đồng thời truy cập những dịch vụ bên thứ ba trên nền tảng thanh toán Alipay của công ty dễ dàng hơn.

Zhixiaobao còn cung cấp một số trợ lý AI tích hợp sẵn, chẳng hạn “gia sư tiếng Anh” và “chuyên gia thể hình”. Mỗi trợ lý AI có kiến thức chuyên môn để trở thành chuyên gia trong lĩnh vực của mình.

Sự phát triển này là một phần trong nỗ lực của Ant Group nhằm biến AI thành “giải pháp thực tế, tập trung vào người dùng”. Điều đó sẽ biến Zhixiaobao thành “công cụ có giá trị trong cuộc sống hàng ngày”, Chủ tịch kiêm Giám đốc tài chính Ant Group - Cyril Han Xinyi tuyên bố.

Zhixiaobao (cách chơi chữ dựa trên Zhifubao, tên tiếng Trung của Alipay) phản ánh ngành AI mới nổi của Trung Quốc đang tiếp tục củng cố danh tiếng, vì một số dịch vụ sáng tạo đã được triển khai rộng rãi ở nước ngoài.

Phần mềm chỉnh sửa video CapCut của gã khổng lồ truyền thông xã hội ByteDance (chủ sở hữu TikTok) và mô hình AI Doubao dẫn đầu lượt tải xuống ứng dụng AI toàn cầu hồi tháng 7, theo hãng nghiên cứu ngành Unique Capital. Đây là dấu hiệu cho thấy nỗ lực thúc đẩy AI tạo sinh của ByteDance đang mang lại hiệu quả.

Ứng dụng giáo dục hỗ trợ AI của Trung Quốc là Question.AI (được công ty khởi nghiệp công nghệ giáo dục Zuoyebang tại thủ đô Bắc Kinh phát triển) và Gauth của ByteDance nằm trong số 3 ứng dụng giáo dục miễn phí hàng đầu tại Mỹ trên Apple App Store và Google Play từ tháng 2 đến tháng 5, theo dịch vụ phân tích ứng dụng di động AppMagic.

Để sử dụng Zhixiaobao (được xây dựng trên mô hình ngôn ngữ lớn Bailing cơ bản của Ant Group), người dùng có thể tải xuống ứng dụng di động, hoặc kéo xuống trang chủ Alipay để truy cập tính năng này mà không cần cài thêm ứng dụng mới.

Mô hình ngôn ngữ lớn, công nghệ hỗ trợ các dịch vụ AI tạo sinh, là các thuật toán học sâu có thể nhận dạng, tóm tắt, dịch, dự đoán và tạo nội dung bằng cách sử dụng những tập dữ liệu rất lớn.

Chỉ cần một lời nhắc bằng giọng nói đơn giản, ví dụ “giúp đặt chuyến bay vào thứ 6 tuần tới từ Bắc Kinh đến Hạ Môn, giờ cất cánh trước buổi trưa”, Zhixiaobao sẽ đưa ra danh sách các chuyến bay để người dùng lựa chọn. Nhấp vào chuyến bay đã chọn, người dùng sẽ được chuyển trực tiếp đến phần đặt chỗ, do dịch vụ du lịch trực tuyến Fliggy của Alibaba xử lý.

Các lệnh để đặt giao đồ ăn, tạo biểu đồ phân tích chi tiêu hàng tháng, nạp tiền điện thoại di động, kiểm tra trạng thái giao hàng bưu kiện hoặc đặt lịch hẹn tại bệnh viện có thể được thực hiện ngay trên ứng dụng bằng cách khai thác nhiều dịch vụ của Alibaba, gồm nền tảng mua sắm Taobao, dịch vụ hậu cần Cainiao, đơn vị giao đồ ăn Ele.me và đơn vị lập bản đồ trực tuyến Gaode.

Người dùng Zhixiaobao có thể khai thác hơn 8.000 dịch vụ cuộc sống kỹ thuật số và hơn 4 triệu ứng dụng nhỏ do Alipay cung cấp để sử dụng cho hầu hết mọi chức năng trực tuyến ở Trung Quốc.

zhixiaobao-ung-dung-ai-moi-cua-ant-group-khoi-day-giac-mo-tro-ly-ao-cho-iron-man-tro-thanh-hien-thuc1.jpg — Zhixiaobao của Ant Group là trợ lý AI thông minh được thiết kế để sử dụng hàng ngày - Ảnh: SCMP

Đầu tuần này, gã khổng lồ tìm kiếm internet Baidu (Trung Quốc) đã công bố đổi tên thương hiệu ứng dụng AI hàng đầu Ernie Bot, với khoảng 200 triệu người dùng tính đến tháng 4, thành Wenxiaoyan. Động thái đó phản ánh vị thế của công cụ này như trợ lý “tìm kiếm mới”, theo Xue Su - Phó chủ tịch kiêm Giám đốc bộ phận đổi mới AI tại Baidu.

Dù kém tinh vi hơn Jarvis, Wenxiaoyan tỏ ra hữu ích trong việc tìm kiếm thông tin có liên quan, theo một thử nghiệm do trang SCMP thực hiện.

Khi xem video ngắn về một quán ăn trong ứng dụng, Wenxiaoyan có thể nhanh chóng chuẩn bị danh sách các mục liên quan đến video, chẳng hạn các món ăn nổi bật và trả lời câu hỏi về tuyến đường vận chuyển đến địa điểm đó. Điều này cho thấy Wenxiaoyan đã phát triển từ chatbot AI dựa trên văn bản truyền thống thành trợ lý tìm kiếm linh hoạt hơn bằng cách hỗ trợ dùng lệnh thoại, hình ảnh chụp bằng camera và nội dung video.

Chức năng "bộ nhớ" của Wenxiaoyan giúp ứng dụng thu thập và ghi nhớ thông tin cá nhân của người dùng, gồm cả ngày kỷ niệm, sở thích ăn uống cá nhân hoặc câu chuyện hàng ngày, để làm bối cảnh cho các cuộc trò chuyện. Việc sử dụng Wenxiaoyan thường xuyên giúp ứng dụng hiểu rõ hơn về người dùng. Điều đó không chỉ biến Wenxiaoyan thành kho lưu trữ lịch sử cá nhân có giá trị mà còn khiến người dùng khó chuyển sang dịch vụ khác hơn.

Trong văn hóa đại chúng, đặc biệt là Vũ trụ Điện ảnh Marvel, Jarvis được biết đến là một trợ lý ảo thông minh cực kỳ tiên tiến, được tạo ra bởi Tony Stark (Iron Man). Jarvis là hệ thống AI có khả năng:

- Điều khiển các thiết bị: Jarvis có thể điều khiển mọi thứ từ bộ giáp Iron Man đến các hệ thống trong nhà của Tony Stark chỉ bằng một lệnh thoại.

- Phân tích thông tin: Jarvis có thể xử lý và phân tích lượng lớn dữ liệu nhanh chóng, giúp Tony Stark đưa ra những quyết định đúng đắn.

- Học hỏi và phát triển: Jarvis không chỉ là công cụ, mà còn là một người bạn đồng hành, luôn học hỏi và phát triển để trở nên thông minh hơn.

Trong thực tế, ý tưởng về trợ lý ảo như Jarvis đã và đang được các nhà khoa học và kỹ sư trên toàn thế giới nghiên cứu và phát triển. Các trợ lý ảo như Siri của Apple, Google Assistant và Alexa của Amazon là những ví dụ về việc hiện thực hóa ý tưởng này. Tuy nhiên, để đạt được mức độ phức tạp và thông minh như Jarvis trong các bộ phim, chúng ta vẫn còn một chặng đường dài phía trước.

Mô hình AI chuyên về toán học được Alibaba quảng cáo vượt trội GPT-4o của OpenAI

Alibaba đang hướng đến mục tiêu nâng cao tiêu chuẩn trong phát triển AI bằng cách ra mắt một nhóm mô hình ngôn ngữ chuyên về toán học có tên Qwen2-Math, được quảng cáo có thể vượt trội khả năng của GPT-4o của OpenAI trong lĩnh vực đó.

"Trong năm qua, chúng tôi đã dành nhiều nỗ lực đáng kể để nghiên cứu và nâng cao khả năng lập luận của các mô hình ngôn ngữ lớn, đặc biệt tập trung vào khả năng giải quyết các bài toán số học và toán học", nhóm Qwen, một phần đơn vị điện toán đám mây của Alibaba, cho biết hồi đầu tháng 8 trong một bài viết đăng trên nền tảng dành cho nhà phát triển GitHub.

Được xây dựng trên mô hình ngôn ngữ lớn Qwen2 do Alibaba phát hành vào tháng 6, các Qwen2-Math gồm ba phiên bản dựa trên thang tham số của chúng. Trong học máy, tham số là các biến số có mặt ở hệ thống AI được đào tạo, giúp xác định cách dữ liệu đầu vào được xử lý để tạo ra kết quả đầu ra mong muốn.

Học máy là một lĩnh vực trong AI tập trung vào việc phát triển các thuật toán và mô hình máy tính có khả năng học hỏi từ dữ liệu và cải thiện hiệu suất của chúng theo thời gian mà không cần lập trình cụ thể. Các hệ thống học máy có khả năng tự động tìm hiểu và áp dụng kiến thức từ dữ liệu để thực hiện các nhiệm vụ cụ thể như phân loại, dự đoán, nhận dạng mẫu và tối ưu hóa quyết định.

Những ứng dụng của học máy rất đa dạng như xử lý ngôn ngữ tự nhiên, thị giác máy tính, xe tự hành, dự đoán thời tiết, quản lý dữ liệu lớn...

Học máy đã có sự tiến bộ đáng kể trong thập kỷ gần đây, nhờ sự phát triển của các mô hình học sâu và khả năng xử lý dữ liệu lớn (big data), mang lại nhiều cơ hội và tiềm năng giải quyết các vấn đề phức tạp và cải thiện hiệu suất trong nhiều lĩnh vực khác nhau.

Theo bài đăng của nhóm Qwen, mô hình có số lượng tham số lớn nhất là Qwen2-Math-72B-Instruct, vượt trội các mô hình AI do Mỹ phát triển, gồm GPT-4o của OpenAI, Claude 3.5 Sonnet của Anthropic, Gemini 1.5 Pro của Google và Llama-3.1-405B của Meta Platforms, trong các chuẩn mực toán học.

"Chúng tôi hy vọng rằng Qwen2-Math có thể đóng góp cho cộng đồng để giải quyết các bài toán phức tạp", trích bài viết của Alibaba. Theo đó, các Qwen2-Math đã được thử nghiệm trên cả chuẩn mực toán học tiếng Anh và tiếng Trung, gồm cả GSM8K (tập dữ liệu gồm 8.500 bài toán tiểu học đa dạng về mặt ngôn ngữ chất lượng cao), OlympiadBench (chuẩn mực khoa học đa phương thức song ngữ cấp cao), gaokao (kỳ thi tuyển sinh đại học khó khăn ở Trung Quốc).

Nhóm Qwen cho biết các mô hình mới vẫn còn một số hạn chế. Theo nhóm Qwen, kế hoạch là sớm phát hành các mô hình ngôn ngữ lớn song ngữ, với các mô hình đa ngôn ngữ cũng đang trong quá trình phát triển.

Các mô hình ngôn ngữ chuyên về toán học của Alibaba tiếp tục củng cố thêm uy tín về AI cho công ty có trụ sở tại thành phố Hàng Châu (Trung Quốc), sau khi Qwen-72B-Instruct gần đây dẫn đầu bảng xếp hạng 10 mô hình AI nguồn mở hàng đầu thế giới.

Alibaba đã mở cửa Tongyi Qianwen cho các nhà phát triển bên thứ ba trong hơn một năm. Mã nguồn mở cung cấp quyền truy cập công khai vào mã nguồn của chương trình, cho phép các nhà phát triển phần mềm bên thứ ba sửa đổi hoặc chia sẻ thiết kế của chương trình, sửa các liên kết bị hỏng hoặc mở rộng khả năng của chương trình.

Hồi tháng 7, Qwen2-72B-Instruct chỉ đứng sau GPT-4o và Claude 3.5 Sonnet trong bảng xếp hạng mô hình ngôn ngữ lớn của SuperClue. Đây là một nền tảng đánh giá chuẩn đánh giá các mô hình ngôn ngữ lớn dựa trên các số liệu như tính toán, suy luận logic, lập trình và hiểu văn bản cùng những thứ khác.

Theo SuperClue, khoảng cách giữa các mô hình AI của Trung Quốc và Mỹ dường như đang bị thu hẹp lại. SuperClue cho biết Trung Quốc đã đạt được tiến bộ đáng kể trong việc thúc đẩy các mô hình ngôn ngữ lớn trong nước nửa đầu năm 2024.

Một bài kiểm tra riêng biệt được công bố vào tháng 7 bởi LMSYS cho thấy Qwen2-72B được xếp hạng 20, trong khi các mô hình từ OpenAI, Anthropic và Google chiếm hầu hết vị trí trong top 10. LMSYS là tổ chức nghiên cứu mô hình AI được Đại học California – Berkeley (Mỹ) hỗ trợ.

Sơn Vân