Microsoft cải tiến Copilot với giọng nói mới, khả năng lý luận, phân tích những gì người dùng thấy khi duyệt web

Nhịp đập khoa học - Ngày đăng : 23:17, 01/10/2024

Microsoft đã mang đến giọng nói thân thiện hơn cho trợ lý trí tuệ nhân tạo Copilot trong bản cập nhật mới nhất. Không những thế, chatbot này nay có khả năng phân tích những gì người dùng thấy khi duyệt web.

Nhịp đập khoa học

Microsoft cải tiến Copilot với giọng nói mới, khả năng lý luận, phân tích những gì người dùng thấy khi duyệt web

Sơn Vân • {Ngày xuất bản}

Công ty hiện có một đội ngũ giám đốc sáng tạo, gồm cả những nhà tâm lý học, tiểu thuyết gia và diễn viên hài, đang tinh chỉnh âm điệu và phong cách của Copilot để làm nổi bật sản phẩm này, Mustafa Suleyman, Giám đốc điều hành bộ phận Microsoft AI, chia sẻ trong một cuộc phỏng vấn với Reuters.

Trong buổi trình diễn phiên bản Copilot được cập nhật, một người tiêu dùng hỏi về món quà tân gia nào nên mua ở cửa hàng tạp hóa cho người bạn không uống rượu vang. Sau một vài lần trao đổi, Copilot nói to: "Dầu ô liu Ý đang rất hot hiện nay. Tôi thích dầu ô liu Tuscan. Siêu cay".

Việc Microsoft triển khai tính năng mới cho Copilot bắt đầu từ ngày 1.10. Đây là một trong những điều đầu tiên mà Mustafa Suleyman giám sát kể từ khi Microsoft thành lập bộ phận AI của mình vào tháng 3 để tập trung vào các sản phẩm tiêu dùng và nghiên cứu công nghệ.

Microsoft đã xây dựng được danh tiếng và sự thành công lớn trong lĩnh vực phần mềm dành cho doanh nghiệp, chẳng hạn hệ điều hành Windows và bộ ứng dụng văn phòng Microsoft Office. Song khi cố gắng mở rộng và phát triển các sản phẩm cho người tiêu dùng, Microsoft phải đối mặt với nhiều thách thức và khó khăn hơn. Ví dụ, công cụ tìm kiếm Bing của Microsoft vẫn bị Google bỏ xa về thị phần.

Mustafa Suleyman hy vọng rằng Copilot sẽ tạo được ấn tượng lớn hơn. Sản phẩm này ra mắt vào năm ngoái trong một lĩnh vực đông đúc các chatbot AI, gồm cả ChatGPT của OpenAI và Google Gemini.

Khả năng giọng nói mới khiến Copilot trở nên giống một người nghe tích cực hơn nhiều, đưa ra các tín hiệu bằng lời nói như "tuyệt vời" và "hả", theo Mustafa Suleyman. Đằng sau Copilot là mô hình Microsoft AI (MAI) cùng bộ công nghệ từ đối tác OpenAI, Suleyman cho biết.

Ông nói thêm rằng người tiêu dùng chi 20 USD hàng tháng cho Copilot Pro có thể bắt đầu thử nghiệm tính năng Think Deeper (suy nghĩ sâu hơn), cho phép suy luận qua các lựa chọn, như việc có nên chuyển đến thành phố này hay nơi khác.

Mustafa Suleyman cho biết một tính năng thử nghiệm với những người đăng ký trả tiền là Copilot Vision, tương tự "chỉ điểm kỹ thuật số", cho người dùng khả năng thảo luận với AI về những gì nhìn thấy trong trình duyệt Microsoft Edge. AI sẽ phản hồi thông tin liên quan đến những gì người dùng thấy khi duyệt web. Người dùng phải đồng ý tham gia và nội dung họ xem sẽ không được lưu lại hoặc sử dụng để đào tạo AI, Microsoft cho biết.

"Bản cập nhật này đại diện cho những tia sáng để AI có thể trở thành một người bạn đồng hành luôn hiện hữu, bên cạnh bạn", Mustafa Suleyman bình luận. Đây là một tầm nhìn mà ông đã nêu ra khi làm Giám đốc điều hành công ty khởi nghiệp Inflection AI, nơi Microsoft đã chiêu mộ tài năng hàng đầu trong một thương vụ được theo dõi chặt chẽ năm nay.

Mustafa Suleyman nói rằng cuối cùng, Copilot sẽ học hỏi ngữ cảnh từ các tài liệu Word của người dùng, máy tính để bàn cài Windows, thậm chí cả các bảng điều khiển chơi game nếu họ cho phép.

Khi được hỏi Bill Gates (nhà đồng sáng lập Microsoft) nghĩ gì về nỗ lực AI của công ty, Mustafa Suleyman nói tỷ phú này rất hào hứng.

"Bill Gates luôn hỏi tôi về việc khi nào Copilot có thể đọc và phân tích email của ông. Đó là một trong những sở thích của ông ấy. Chúng tôi đang làm việc về vấn đề đó", Suleyman kể.

microsoft-cai-tien-copilot-voi-giong-noi-moi-kha-nang-ly-luan-va-phan-tich-dieu-nguoi-dung-thay-khi-duyet-web.jpg — Copilot vừa được Microsoft bổ sung một số tính năng mới đáng giá - Ảnh: Reuters

Điều đáng nhắc đến là cuối tháng 5, Satya Nadella (Giám đốc điều hành Microsoft) nói muốn mọi người nhớ rằng AI là một công cụ chứ không phải trí thông minh thực sự của con người.

Hôm 21.5, một tuần sau khi OpenAI ra mắt mô hình AI đa phương thức GPT-4o có thể cười, hát và nói bằng nhiều giọng khác nhau, đối tác thân cận nhất của công ty khởi nghiệp này là Microsoft đã đưa ra cái nhìn khác về cách mọi người nên tương tác với các công cụ AI.

“Tôi không thích việc nhân cách hóa AI”, Satya Nadella nói với Bloomberg Television, đề cập đến việc sử dụng động từ và danh từ để mô tả AI thường chỉ dành riêng cho con người. “Tôi tin rằng đó là một công cụ”, ông nhấn mạnh.

Nhận xét của Satya Nadella gợi ý về cuộc tranh luận đang diễn ra trong ngành công nghệ về mức độ nhân hóa các dịch vụ AI vào thời điểm công nghệ đang phát triển và phản ứng theo những cách giống con người hơn. Nhân hóa là làm cho cái gì đó trở nên giống hoặc có những đặc điểm của con người.

Tuần trước, một lãnh đạo Google nói với hãng tin Bloomberg rằng dù có thể xây dựng các công cụ AI “thể hiện cảm xúc”, nhưng công ty lại muốn tập trung vào việc “siêu hữu ích và siêu tiện dụng”.

Sissie Hsiao, Phó chủ tịch kiêm Giám đốc điều hành Gemini Experiences và Google Assistant, cho hay: “Bạn có thể khiến các công nghệ này thể hiện cảm xúc nếu bạn muốn. Thế nhưng, tôi nghĩ sản phẩm của chúng tôi hướng tới việc trở nên siêu hữu ích và siêu tiện dụng”.

OpenAI đã thực hiện một cách tiếp cận khác. Công ty này đã trình diễn một trợ lý giọng nói AI mới vào tuần trước có thể hiểu được cảm xúc và bày tỏ cảm xúc của chính mình. Trong video trình diễn của OpenAI, GPT-4o dường như tác động mạnh đến nhân viên OpenAI trò chuyện với mô hình AI này hai lần bằng cách khen trang phục của anh và nói: “Ồ dừng lại đi! Anh làm tôi đỏ mặt" khi được tâng bốc.

Nhiều người đã so sánh giọng nói quyến rũ của ChatGPT với giọng trợ lý AI (do nữ diễn viên Scarlett Johansson lồng tiếng) trong bộ phim khoa học viễn tưởng Her năm 2013. Đây là sự so sánh mà Giám đốc điều hành OpenAI - Sam Altman ngầm ám chỉ thông qua bài đăng với một từ her trên mạng xã hội X.

Scarlett Johansson tiết lộ Sam Altman đã liên hệ và đề nghị cô xem xét lồng tiếng cho một tính năng trò chuyện âm thanh vào năm ngoái.

Theo Scarlett Johansson, Sam Altman đã cố gắng thuyết phục nữ diễn viên người Mỹ này về ý tưởng rằng cô có thể “giúp người tiêu dùng cảm thấy thoải mái với sự thay đổi lớn lao liên quan đến con người và AI”. Scarlett Johansson từ chối Sam Altman vì lý do cá nhân và cho biết buộc phải thuê luật sư vì chuyện OpenAI dùng giọng nói cho ChatGPT “giống giọng cô một cách kỳ lạ”.

OpenAI đã gỡ bỏ giọng nói giống Scarlett Johansson và thay thế bằng giọng khác.

Ngay cả trước khi ChatGPT đưa AI trở thành xu hướng phổ biến, các hãng công nghệ đã đưa tính cách con người vào các chương trình AI, thường có tên và đặc điểm hơi hướng giống phụ nữ, trong nỗ lực rõ ràng nhằm giúp người dùng kết nối và cảm thấy thoải mái với công nghệ.

Microsoft cũng không tránh khỏi hành vi đó. Gã khổng lồ công nghệ Mỹ đã phát hành nhiều chương trình đàm thoại và AI khác nhau trong nhiều năm, gồm cả Tay và Cortana, được đặt theo tên trợ lý AI có ngoại hình là nữ của Halo. Nhiều người có lẽ quên được Bing Chat (chatbot AI của Microsoft) bất hảo mang tên Sydney? Năm ngoái, Sydney đưa ra những câu trả lời kỳ lạ khiến người dùng giật mình. Nói gọi người dùng là hoang tưởng, cố gắng đánh lừa họ về 2023 là năm nào khác và thậm chí nói lời yêu với một số người.

Có xu hướng tự nhiên là muốn mô tả AI theo thuật ngữ của con người, khi nhiều người tìm cách giải thích toán học, các con số và mã đằng sau phần mềm theo những cách mà người dùng có thể liên tưởng đến, chẳng hạn nói rằng AI đang "học hỏi". Xu hướng đó sẽ mạnh mẽ hơn khi các hãng công nghệ tung ra nhiều sản phẩm có khả năng thực hiện cuộc trò chuyện theo thời gian thực.

Song trong cuộc phỏng vấn nêu trên, Satya Nadella cho biết người dùng cần lưu ý rằng khả năng mà phần mềm AI thể hiện không phải là trí thông minh của con người. “Nó có trí thông minh, nếu bạn muốn đặt cho nó biệt danh đó, nhưng không giống với trí thông minh mà tôi có”, doanh nhân 56 tuổi người Mỹ gốc Ấn Độ nói.

Trên thực tế, Satya Nadella còn đi xa hơn nữa khi than thở về việc lựa chọn thuật ngữ “trí tuệ nhân tạo”, được đặt ra lần đầu tiên vào những năm 1950. “Tôi nghĩ một trong những cái tên đáng tiếc nhất là trí tuệ nhân tạo. Tôi ước gì chúng ta gọi nó là trí tuệ khác biệt. Vì tôi có trí thông minh của mình, nên tôi không cần bất kỳ trí tuệ nhân tạo nào”, Giám đốc điều hành Microsoft lý giải.

Satya Nadella chỉ muốn phần mềm AI trợ giúp khi ông muốn. “Tôi nghĩ đó là mối quan hệ lý tưởng”, ông thổ lộ.

Sơn Vân