Apple là gã khổng lồ công nghệ được biết đến với thiết kế bóng bẩy, công nghệ tiên tiến và các sản phẩm tiêu dùng sáng tạo. Song khi nói đến trí tuệ nhân tạo (AI), đặc biệt là Siri, Apple từ người dẫn đầu đã trở nên tụt hậu.
Các công ty như Google, Microsoft (đầu tư hàng tỉ USD vào OpenAI) đã và đang thể hiện những tiến bộ đáng kinh ngạc, trong khi những nỗ lực của Apple ở lĩnh vực AI tương đối mờ nhạt.
Siri được giới thiệu với thế giới vào 2011, cách đây 12 năm, và được ca ngợi vào thời điểm đó như bước đột phá trong công nghệ AI. Tuy nhiên trong những năm qua, Siri đã không phát huy hết tiềm năng của nó. Dù Siri đã được cải tiến kể từ khi ra mắt, những nỗ lực AI của Google và OpenAI đã làm lu mờ trợ lý ảo này rất nhiều.
Một trong những hạn chế lớn nhất của Siri là thiếu khả năng xử lý ngôn ngữ tự nhiên. Siri gặp khó khăn trong việc hiểu ngữ cảnh của cuộc trò chuyện và chỉ có thể thực hiện các tác vụ đơn giản một cách đáng tin cậy như đặt lời nhắc hoặc hẹn giờ. Ngay cả sau ngần ấy năm, việc yêu cầu Siri trả lời chính xác một câu hỏi hoặc đọc chính tả đoạn văn bản và gửi cho đúng người không đảm bảo sẽ thành công.
Ngược lại, Google Assistant và ChatGPT của OpenAI (được tích hợp vào Bing cùng các ứng dụng khác của Microsoft) có khả năng xử lý ngôn ngữ tự nhiên tiên tiến. Điều này cho phép chúng hiểu được các sắc thái của ngôn ngữ con người và phản ứng tương ứng.
Chẳng hạn, khi hỏi Bing Chat liệt kê những điều có thể làm mà Siri không thể, nó đề cập đến việc tóm tắt các tình huống chính trị phức tạp hoặc được sử dụng với các công cụ tìm kiếm khác như DuckDuckGo.
Khi được hỏi về những điều có thể làm được mà Bing Chat không thể, Siri trả lời bằng hướng dẫn về cách khởi chạy Bing bằng cách nói "Mở Bing". Dù cho điều này đúng, vì Bing không thể khởi chạy các ứng dụng trên iPhone, nhưng Siri đã bỏ lỡ điểm chính của câu hỏi.
Một lĩnh vực khác mà Siri chưa đủ tốt là tích hợp ứng dụng của bên thứ ba. Siri chỉ có thể thực hiện các tác vụ trong phạm vi hệ sinh thái Apple. Trong khi Google Assistant và ChatGPT được tích hợp với nhiều ứng dụng khác nhau, nên có thể thực hiện nhiều tác vụ hơn.
Hệ sinh thái khép kín của Apple cũng giới hạn lượng dữ liệu mà Siri có quyền truy cập. Việc thiếu dữ liệu này khiến Siri khó học hỏi và cải thiện theo thời gian, vì các thuật toán máy học yêu cầu lượng dữ liệu lớn để hoạt động hiệu quả.
Dù nhiều người có thể tranh luận về đạo đức trong cách Google và OpenAI sử dụng dữ liệu để huấn luyện các mô hình AI, không ai có thể phản đối việc họ tiếp cận lượng dữ liệu khổng lồ để giúp cải thiện liên tục các khả năng của AI.
Hơn nữa, Apple đã chậm chạp trong việc nắm bắt các công nghệ nguồn mở, vốn rất cần thiết cho nghiên cứu và phát triển AI. Công nghệ nguồn mở cho phép các nhà phát triển cộng tác và đóng góp cho một dự án, dẫn đến các chu kỳ phát triển nhanh hơn và hiệu quả hơn.
Song Apple có lịch sử về giữ bí mật, gồm cả các dự án AI, điều này khiến họ không thể tiếp cận các nghiên cứu tiên tiến trong nhiều năm. Điều đó đang dần thay đổi. Trong năm 2015, Apple đã không công bố bất kỳ tài liệu nghiên cứu nào về AI. Ngày nay, Apple có một trang web chia sẻ công khai khoảng 370 bài viết mà công ty xuất bản kể từ năm 2017. Tuy nhiên, Google, công ty có lịch sử lâu đời về sự tham gia của nguồn mở, đã xuất bản hàng trăm bài viết nghiên cứu về AI hàng năm.
Dù Apple cũng tham gia vào các cộng đồng như Hugging Face, nơi các nhà nghiên cứu AI chia sẻ các mô hình mà họ sử dụng để đào tạo các ứng dụng AI, sự tham gia của nhà sản xuất iPhone ở đó tương đối ít. Apple đã chia sẻ 11 mô hình, so với 245 của Microsoft và 587 của Google. Nhiều đóng góp của Apple cho các dự án mã nguồn mở AI lớn khác, bao gồm TensorFlow (dự án có nguồn gốc từ Google) và PyTorch (nguồn gốc từ Facebook), được nhắm đến những thay đổi cho phép nhà phát triển chạy các công nghệ này trên máy Mac.
Dù điều đó hữu ích (đặc biệt là để bán máy Mac cho các nhà phát triển AI), nhưng đó không phải là kiểu chia sẻ mang tính hợp tác mà cộng đồng nguồn mở dựa vào.
Dấu hiệu cho thấy sự phát triển của Siri trở nên trì trệ và bị cô lập là một số kỹ sư đã rời công ty để làm việc trên loại mô hình ngôn ngữ lớn như ở OpenAI, trang The Information đưa tin vào tháng trước.
Michael Gartenberg từng là cựu Giám đốc tiếp thị cấp cao của Apple và hiện là cổ đông. Ông đã theo dõi và đánh giá Apple trong gần ba thập kỷ với tư cách nhà phân tích nghiên cứu thị trường tại Gartner, Jupiter Research và Altimeter Group.
Là nhà phân tích công nghệ đã theo dõi Apple trong gần ba thập kỷ và từng làm việc tại đó, Michael Gartenberg cho rằng các chiến lược AI của công ty cũ, đặc biệt là với Siri, không thông minh lắm. Ông đưa ra ba lời khuyên cho Apple để giải quyết vấn đề phát triển của Siri:
1. Mở rộng khả năng của Siri ngoài các lệnh cơ bản: Apple nên đầu tư vào việc xây dựng khả năng của Siri để xử lý các tác vụ phức tạp hơn, chẳng hạn như đặt lịch hẹn, đặt chỗ trước và đặt món ăn.
2. Cải thiện khả năng xử lý ngôn ngữ tự nhiên của Siri: Khả năng xử lý ngôn ngữ tự nhiên hiện tại của Siri kém tiên tiến hơn so với Google Assistant hoặc ChatGPT. Apple có thể đầu tư vào việc cải thiện khả năng hiểu ngôn ngữ của Siri, giúp người dùng tương tác với trợ lý giọng nói dễ dàng hơn.
3. Mở nền tảng của Siri: Lẽ ra Apple nên đã làm điều này từ nhiều năm trước. Cho phép phần mềm của các công ty không phải Apple tích hợp với Siri khiến nó trở nên hữu ích hơn rất nhiều, từ đó khuyến khích sử dụng nhiều hơn, giúp cải thiện Siri. Bằng cách mở nền tảng của Siri, Apple cũng có thể khuyến khích các nhà phát triển tạo ra các ứng dụng sáng tạo và phức tạp hơn sử dụng khả năng nhận dạng giọng nói, xử lý ngôn ngữ tự nhiên của Siri.
Theo trang The Information, một số người trong cuộc nói rằng Apple đang làm việc trên tất cả những điều trên và đang lên kế hoạch phát hành một Siri mới, được cải tiến trong phiên bản iOS tương lai. Chúng ta sẽ theo dõi thông tin này vào tháng 6 tại Hội nghị các nhà phát triển toàn cầu của Apple (WWDC), nơi công ty dự kiến trình làng tai nghe thực tế hỗn hợp.
Trong khi đó, Siri hiện chỉ có vậy. Nếu muốn có thêm các tính năng AI phong phú hơn trong cuộc sống, người dùng Apple cần tìm nó ở nơi khác.
Apple từ chối bình luận về câu chuyện trên.
Apple thờ ơ với cuộc chiến về AI
Không như các hãng công nghệ lớn khác, Apple tỏ ra thờ ơ với cuộc chiến về AI.
Tim Cook, Giám đốc điều hành Apple, cho biết rằng làn sóng AI đang lan rộng trong ngành công nghệ, song ông tỏ ra thận trọng khi nói về cách AI sẽ được triển khai tại công ty của mình.
"Việc tiếp cận những điều này phải được suy nghĩ và cân nhắc thận trọng", Tim Cook nói trong buổi báo cáo kết quả kinh doanh quý 1/2023 của công ty. Ông tương đối dè dặt khi đưa ra ý kiến về AI dù các đối thủ của Apple hướng đến generative AI theo cách ồn ào.
Generative AI là một loại trí tuệ nhân tạo mà máy tính được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu hoặc học máy trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn.
Cuộc đua về AI giữa các hãng công nghệ diễn ra những tháng gần đây sau khi OpenAI phát hành ChatGPT vào tháng 11.2022 và thành công hơn mong đợi. ChatGPT trở thành ứng dụng tiêu dùng phát triển nhanh nhất lịch sử khi đạt 100 triệu người dùng chỉ sau 60 ngày trình làng.
Sau khi tuyên bố đầu tư hàng tỉ USD vào OpenAI, Microsoft tích hợp công nghệ đằng sau ChatGPT vào công cụ tìm kiếm Bing cùng nhiều sản phẩm khác.
Cũng trong tháng 2, Google giới thiệu Bard như đối thủ của ChatGPT và hôm 21.3 mời người dùng thử nghiệm chatbot này.
Trong tháng 3, Elon Musk đã thành lập công ty AI mang tên X.AI, có trụ sở tại bang Nevada (Mỹ), theo các tài liệu kinh doanh. Đến tháng 4, Elon Musk cho biết sẽ ra mắt một nền tảng AI có tên TruthGPT để thách thức ChatGPT.
Tim Cook nói rằng Apple đã tích hợp học máy và AI vào một số sản phẩm của mình. Tỷ phú 62 tuổi người Mỹ nhận thấy tiềm năng của AI để tiến xa hơn là "rất lớn".
Nói về việc sử dụng AI của Apple, Tim Cook đề cập đến các tính năng như "phát hiện rơi" trên các mẫu Apple Watch và "phát hiện tai nạn" trên một số thiết bị Apple khác, gồm cả dòng iPhone 14.
"Những thứ này không chỉ là tính năng tuyệt vời mà còn cứu sống được nhiều người. Chúng tôi xem AI là lĩnh vực rất lớn và sẽ tiếp tục tích hợp nó vào sản phẩm của mình một cách cẩn thận", ông chia sẻ.
Nhận xét này lặp lại lời Tim Cook tại buổi báo cáo kết quả kinh doanh trước đó của Apple hồi tháng 2, trong đó ông cũng khẳng định AI có tiềm năng to lớn.
Tim Cook cho biết Apple không bình luận về các kế hoạch sản phẩm trong tương lai của mình và chỉ đề cập đến AI rất ít so với các đối thủ công nghệ. Trong buổi báo cáo kết quả kinh doanh quý 1/2023 gần đây, Meta Platforms, Alphabet, Microsoft và Amazon đã nhắc đến từ AI tổng cộng 168 lần.
Ở cuộc gọi với các nhà phân tích tài chính Phố Wall kéo dài khoảng 1 giờ, Tim Cook chỉ trả lời một câu hỏi về AI và dành vài phút để nói về chủ đề này.
Tai nghe thực tế hỗn hợp được tích hợp nhiều công nghệ mới và nhiều khả năng, bao gồm:
- Khả năng chạy hầu hết ứng dụng iPad hiện có trong thực tế hỗn hợp, kết hợp giữa AR và VR, gồm cả Books, Camera, Contacts, FaceTime, Files, Freeform, Home, Mail, Maps, Messages, Music, Notes, Photos, Reminders, Safari, Stocks, TV và Weather.
- Một ứng dụng Wellness mới tập trung vào giảm căng thẳng với hàng loạt đồ họa, âm thanh và giọng nói êm dịu.
- Có thể chạy hàng trăm ngàn ứng dụng iPad hiện có của bên thứ ba từ App Store thông qua giao diện 3D mới.
- Cổng thông tin mới để xem thể thao trong thực tế ảo như một phần nỗ lực của Apple về việc phát trực tuyến game và tin tức.
- Tập trung lớn vào game, bao gồm các tựa game hàng đầu từ nhiều nhà phát triển bên thứ ba hiện có cho các thiết bị khác của Apple.
- Tính năng sử dụng tai nghe làm màn hình ngoài cho máy Mac được kết nối.
- Hội nghị truyền hình nâng cao và phòng họp ảo với hình đại diện chân thực, giúp người dùng cảm thấy như đang tương tác ở cùng một nơi.
- Các công cụ cộng tác mới thông qua ứng dụng Freeform cho phép người dùng làm việc trên bảng trắng ảo và cùng nhau xem qua tài liệu.
- Trải nghiệm Fitness+ tập trung vào VR mới để tập luyện khi đeo tai nghe dù tính năng này có thể không xuất hiện từ đầu.
- Một cách để xem video khi đắm mình trong một môi trường ảo, chẳng hạn như cảnh sa mạc hoặc trên bầu trời.
- Người dùng cũng sẽ có thể vận hành tai nghe theo nhiều cách khác nhau, bao gồm điều khiển bằng tay, mắt và Siri. Nó cũng sẽ hoạt động với bàn phím được kết nối hoặc các nút điều khiển từ một thiết bị Apple khác.
Những tính năng đó sẽ đi kèm với làn sóng ứng dụng từ các nhà phát triển bên thứ ba. Apple đang lên kế hoạch công bố bộ công cụ phát triển phần mềm và trình giả lập tai nghe dựa trên máy Mac tại WWDC (diễn ra từ 5.6 đến 9.6), nơi công ty sẽ thúc đẩy những người tham dự viết ứng dụng và dịch vụ cho xrOS, hệ điều hành thực tế hỗn hợp mới của hãng.