Lý do Nhật Bản tụt hậu trong lĩnh vực generative AI và tạo mô hình ngôn ngữ lớn
Nhịp đập khoa học - Ngày đăng : 16:37, 07/07/2023
Generative AI là một loại trí tuệ nhân tạo được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn.
Generative AI trở thành chủ đề thời thượng nhất trong công nghệ kể từ khi OpenAI gây chấn động thế giới với chatbot ChatGPT. Theo nghiên cứu của ngân hàng Goldman Sachs (Mỹ), những đột phá về generative AI có tiềm năng thúc đẩy mức tăng 7% cho GDP toàn cầu, tương đương gần 7.000 tỉ USD, trong thập kỷ tới.
Chìa khóa để phát triển generative AI là mô hình ngôn ngữ lớn (nền tảng cho ChatGPT của OpenAI hay Ernie Bot của Baidu) có khả năng xử lý các tập dữ liệu lớn để tạo ra văn bản và nội dung khác. Tuy nhiên, Nhật Bản đang tụt hậu so với Mỹ, Trung Quốc và Liên minh châu Âu (EU) trong việc phát triển các thuật toán này, theo Noriyuki Kojima, đồng sáng lập công ty khởi nghiệp Kotoba Technology (Nhật Bản).
Các tổ chức Trung Quốc, gồm cả gã khổng lồ công nghệ Alibaba và Tencent, đã ra mắt ít nhất 79 mô hình ngôn ngữ lớn trong nước 3 năm qua, Reuters đưa tin hồi tháng 5.
Cùng với OpenAI, các hãng công nghệ hàng đầu Mỹ như Microsoft, Google và Meta Platforms đóng vai trò quan trọng trong thúc đẩy sự tiến bộ về mô hình ngôn ngữ lớn ở nước này.
Nhật Bản đang tụt lại so với Mỹ, Trung Quốc và châu Âu về quy mô và tốc độ phát triển mô hình ngôn ngữ lớn.
Về chuyện này, Noriyuki Kojima giải thích: "Nhật Bản đang tụt hậu trong lĩnh vực trí generative AI chủ yếu do thiếu sót so với các nước khác trong học sâu (deep learning) và phát triển phần mềm quy mô lớn".
Học sâu yêu cầu "cộng đồng kỹ sư phần mềm mạnh mẽ" để phát triển cơ sở hạ tầng và ứng dụng cần thiết. Tuy nhiên, Nhật Bản sẽ đối mặt với sự thiếu hụt 789.000 kỹ sư phần mềm vào năm 2030, theo Bộ Kinh tế Thương mại và Công nghiệp nước này. Hiện Nhật Bản đứng thứ 28 trên tổng số 63 quốc gia về kiến thức công nghệ, theo IMD World Digital Competitiveness Ranking (Bảng xếp hạng Cạnh tranh Kỹ năng Kỹ thuật số Thế giới của IMD).
Hơn nữa, Nhật Bản cũng phải đối mặt với những thách thức về phần cứng vì các mô hình ngôn ngữ lớn cần được đào tạo bằng siêu máy tính AI như của Vela của IBM và hệ thống được lưu trữ trên Microsoft Azure. Thế nhưng, không có công ty tư nhân nào ở Nhật Bản sở hữu “siêu máy tính đẳng cấp thế giới” của riêng mình với những khả năng đó, trang Nikkei Asia đưa tin.
Do đó, các siêu máy tính do chính phủ kiểm soát như Fugaku “nắm giữ chìa khóa” để Nhật Bản theo đuổi mô hình ngôn ngữ lớn, Noriyuki Kojima giải thích.
Ông nói: “Việc truy cập vào các siêu máy tính như vậy là nền móng cho sự phát triển mô hình ngôn ngữ lớn, vì theo truyền thống, đó là một rào cản lớn nhất trong quá trình này”.
Siêu máy tính của Nhật Bản có thể giúp gì?
Viện Công nghệ Tokyo và Đại học Tohoku dự định sử dụng Fugaku để phát triển các mô hình ngôn ngữ lớn dựa chủ yếu trên dữ liệu Nhật Bản với sự hợp tác của nhà phát triển siêu máy tính Fujitsu và Riken. Fujitsu thông báo điều này vào tháng 5.
Các tổ chức có kế hoạch công bố kết quả nghiên cứu của họ vào năm 2024 để giúp các nhà nghiên cứu và kỹ sư Nhật Bản khác phát triển mô hình ngôn ngữ lớn, Fujitsu cho biết thêm.
Chính phủ Nhật Bản sẽ đầu tư 6,8 tỉ yên (48,2 triệu USD) để xây dựng một siêu máy tính mới ở Hokkaido, sẽ bắt đầu hoạt động vào đầu năm tới. Nikkei Asia cho biết siêu máy tính sẽ chuyên về đào tạo mô hình ngôn ngữ lớn để thúc đẩy sự phát triển generative AI của Nhật Bản.
Hồi tháng 4, Thủ tướng Nhật Bản - Fumio Kishida cho biết nước này ủng hộ việc sử dụng generative AI trong công nghiệp. Ông Fumio Kishida nói điều này sau cuộc gặp Sam Altman khi Giám đốc điều hành OpenAI cho biết công ty Mỹ đang tìm cách mở văn phòng tại Nhật Bản.
Các công ty Nhật Bản theo đuổi generative AI
Các hãng công nghệ lớn đã tham gia vào cuộc đua để nâng cao vị thế của Nhật Bản trong generative AI. Vào tháng 6, đơn vị di động của SoftBank Group cho biết dự định phát triển nền tảng generative AI, theo báo chí địa phương. Điều này được nhấn mạnh bởi thông báo của Masayoshi Son, Giám đốc điều hành SoftBank Group, rằng công ty dự định chuyển từ "chế độ phòng thủ" sang "chế độ tấn công" và tăng cường tập trung vào AI
“Chúng tôi muốn vị trí dẫn đầu trong cuộc cách mạng AI”, Masayoshi Son nói trong cuộc họp thường niên của các cổ đông.
SoftBank Group đã bán 85% cổ phần của mình trong SB Energy (công ty năng lượng tái tạo) cho Toyota Tsusho (kinh doanh nhiều lĩnh vực khác nhau) vào tháng 4 và gần đây đồng ý bán 90% cổ phần của mình trong Fortress Investment Group (hãng quản lý đầu tư Mỹ), Nikkei Asia đưa tin.
Việc cắt giảm các khoản đầu tư khác giúp SoftBank Group giải phóng tiền mặt, cho phép tập trung phần lớn vào AI thông qua đơn vị đầu tư vốn mạo hiểm của Vision Fund (quỹ đầu tư công nghệ quy mô lớn).
Công ty thiết kế chip Arm thuộc sở hữu của SoftBank Group cũng chuẩn bị theo đuổi việc chào bán cổ phiếu lần đầu ra công chúng (IPO) tại Mỹ vào cuối năm nay. Amir Anvarzadeh, chiến lược gia thị trường chứng khoán Nhật Bản tại hãng Asymmetric Advisors, cho biết: “Đây sẽ là vụ IPO lớn nhất trên toàn thế giới”.
Vụ IPO sẽ cung cấp một khoản tiền khổng lồ để tăng vốn tại SoftBank Group, công ty đã báo cáo khoản lỗ kỷ lục 4.300 tỉ yên tại Vision Fund cho năm tài chính kết thúc vào ngày 31.3.
Arm ban đầu tìm cách huy động từ 8 tỉ đến 10 tỉ USD. Song với nhu cầu về chip AI tăng vọt, Amir Anvarzadeh gợi ý rằng Arm có thể huy động từ 50 tỉ đến 60 tỉ USD (chiếm 85% vốn hóa thị trường của SoftBank Group).
Ông nói giá cổ phiếu SoftBank Group có thể sẽ tăng, dù điều này không đảm bảo sự thành công cho các nỗ lực AI của họ.
“Về cơ bản, tôi không nghĩ SoftBank sẽ thay đổi cục diện của Nhật Bản… Họ không phải là vị cứu tinh cho AI của Nhật Bản”, Amir Anvarzadeh nhận xét.
Hãng viễn thông NTT (Nhật Bản) đã công bố kế hoạch phát triển mô hình ngôn ngữ lớn riêng trong năm tài chính này, nhằm tạo ra một dịch vụ “nhẹ và hiệu quả” cho các doanh nghiệp.
NTT cho biết sẽ rót 8.000 tỉ yên trong 5 năm tới vào các lĩnh vực tăng trưởng như trung tâm dữ liệu và AI, tăng 50% so với mức đầu tư trước đó.
Hãng quảng cáo kỹ thuật số CyberAgent đã phát hành một mô hình ngôn ngữ lớn vào tháng 5, cho phép các công ty tạo ra các công cụ chatbot AI. CyberAgen cho biết đây là một trong số ít “mô hình chuyên về ngôn ngữ và văn hóa Nhật Bản”.
Dù chưa bắt kịp các nước trong lĩnh vực generative nhưng Nhật Bản đang có bước tiến đầu tiên với những nỗ lực của khu vực tư nhân. Khi một "cơ sở hạ tầng mạnh mẽ" được xây dựng, các thách thức kỹ thuật còn lại có thể được giảm đáng kể bằng cách sử dụng phần mềm nguồn mở và dữ liệu từ các nhà tiên phong trước đó, Noriyuki Kojima nói.
Bloom, Falcon và RedPajama đều là các mô hình ngôn ngữ lớn nguồn mở được đào tạo trên lượng lớn dữ liệu, có thể được tải xuống và nghiên cứu.
Tuy nhiên, các công ty tiến vào lĩnh vực này nên chuẩn bị cho cuộc cạnh tranh trong khoảng thời gian tương đối dài. Phát triển các mô hình ngôn ngữ lớn đòi hỏi đầu tư vốn đáng kể và đội ngũ lao động có kỹ năng cao về xử lý ngôn ngữ tự nhiên cùng tính toán hiệu năng cao, Noriyuki Kojima giải thích. Ông nhận định: “Dù tham gia cuộc đua này, SoftBank và NTT sẽ không thay đổi bối cảnh AI trong thời gian ngắn”.
Quy định AI tại Nhật Bản
Sự tham gia ngày càng tăng của các hãng công nghệ Nhật Bản vào quá trình phát triển generative AI trùng hợp với quan điểm tích cực về việc áp dụng AI trong các lĩnh vực khác. Một cuộc khảo sát của Teikoku Databank (ngân hàng dữ liệu khổng lồ về các doanh nghiệp Nhật Bản) cho thấy hơn 60% công ty ở Nhật Bản có thái độ tích cực với việc sử dụng generative AI trong hoạt động của họ, còn 9,1% đã làm như vậy.
Hitachi đã thành lập một trung tâm trí generative AI nhằm thúc đẩy việc sử dụng công nghệ an toàn và hiệu quả cho nhân viên, công ty thông báo vào tháng 5. Với chuyên môn của các nhà khoa học dữ liệu, nhà nghiên cứu AI và các chuyên gia có liên quan, trung tâm sẽ xây dựng hướng dẫn để giảm thiểu các rủi ro của generative AI, Hitachi tuyên bố.
Chánh văn phòng Nội các Hirokazu Matsuno nói Nhật Bản thậm chí sẽ xem xét việc chính phủ áp dụng công nghệ AI như ChatGPT, với điều kiện là các vấn đề về an ninh mạng và quyền riêng tư được giải quyết.
Theo Hiroki Habuka, giáo sư nghiên cứu tại Trường Luật Đại học Kyoto, khi Nhật Bản trở nên cởi mở hơn trong việc sử dụng AI, chính phủ nên xây dựng và tạo điều kiện thuận lợi cho các hướng dẫn mềm liên quan đến việc sử dụng nó, đồng thời đánh giá sự cần thiết của quy định cứng rắn dựa trên các rủi ro cụ thể.
Giáo sư Hiroki Habuka nói: “Nếu không có hướng dẫn rõ ràng hơn về những hành động mà các công ty nên thực hiện khi sử dụng generavie AI, thực tiễn có thể trở nên rời rạc”.