Hãng fintech Trung Quốc nói được ưu tiên truy cập Sora API khi mô hình AI tạo video từ văn bản gây sốt
Nhịp đập khoa học - Ngày đăng : 21:25, 21/02/2024
Hãng fintech Trung Quốc nói được ưu tiên truy cập Sora API khi mô hình AI tạo video từ văn bản gây sốt
Một hãng công nghệ tài chính Trung Quốc tuyên bố sẽ có quyền truy cập ưu tiên vào giao diện lập trình ứng dụng (API) Sora, mô hình trí tuệ nhân tạo (AI) chuyển văn bản thành video của OpenAI, thông qua hệ thống Microsoft Azure.
Đây là ví dụ mới nhất về cách các doanh nghiệp Trung Quốc đang gấp rút liên kết với các công nghệ AI tạo sinh tiên tiến không được cung cấp trực tiếp trong nước.
AI tạo sinh là một loại AI có mục tiêu chính là tạo ra thông tin mới, thường thông qua quá trình học máy và học sâu. Loại AI này không chỉ giải quyết các nhiệm vụ cụ thể, mà còn có khả năng tạo ra dữ liệu, văn bản, hình ảnh, âm thanh và nhiều loại thông tin khác.
Sinodata (có trụ sở tại Bắc Kinh, thủ đô Trung Quốc) cho biết sẽ là một trong những công ty đầu tiên đăng ký Sora API sau khi mô hình AI chuyển văn bản thành video của OpenAI có sẵn trên Azure. Azure là nền tảng điện toán đám mây của Microsoft, nhà đầu tư lớn nhất vào OpenAI.
Cổ phiếu Sinodata đã tăng 10% sau thông tin này, đạt 14,40 nhân dân tệ (2 USD).
Trong tuyên bố trên trang web của mình hôm 21.2, Sinodata cho biết đã tổ chức cuộc hội thảo kinh doanh với Microsoft Trung Quốc về các kịch bản ứng dụng tiềm năng của Sora.
Theo tuyên bố, Sinodata sẽ có quyền truy cập ưu tiên bằng cách tham gia Chương trình đối tác đám mây AI của Microsoft, trở thành một trong những đối tác giải pháp dữ liệu và AI của gã khổng lồ công nghệ Mỹ trong thỏa thuận đã ký vào tháng trước.
Được thành lập vào năm 2003, Sinodata niêm yết trên Sở giao dịch chứng khoán Thâm Quyến hồi năm 2012. Sinodata tập trung vào công nghệ liên quan đến AI, Web3 và đồng nhân dân tệ số, theo trang web của công ty. Các dịch vụ doanh nghiệp của Sinodata gồm giải pháp ngân hàng và trung tâm dữ liệu.
Kể từ khi OpenAI tung ra các video demo do Sora tạo hôm 15.2, các doanh nghiệp Trung Quốc và các bộ phận khác trong cộng đồng công nghệ đã thể hiện sự quan tâm mạnh mẽ đến việc sử dụng mô hình AI này. Song khác với ChatGPT, một số người bày tỏ lo ngại về khả năng cạnh tranh của Trung Quốc trong lĩnh vực này.
OpenAI không cung cấp dịch vụ của mình tại Trung Quốc cùng một số quốc gia bị Mỹ trừng phạt. OpenAI cũng chặn các địa chỉ giao thức internet (IP) của Hồng Kông, nhưng Microsoft lại cung cấp sản phẩm Copilot, hoạt động dựa trên các mô hình ngôn ngữ lớn GPT của OpenAI, ở thành phố này.
Các gã khổng lồ internet Trung Quốc đã đẩy nhanh quá trình nghiên cứu và phát triển để tạo ra mô hình chuyển văn bản thành video của riêng họ.
Vào tháng 1, ByteDance đã phát hành mô hình chuyển văn bản thành video MagicVideo-V2. Theo trang GitHub (nền tảng lưu trữ mã nguồn) của dự án, MagicVideo-V2 kết hợp “mô hình chuyển văn bản thành hình ảnh, trình tạo chuyển động video, mô đun nhúng hình ảnh tham chiếu và mô đun nội suy khung vào một đường dẫn tạo video từ đầu đến cuối”.
Nền tảng mã nguồn mở ModelScope, từ phòng thí nghiệm Damo Vision Intelligence Lab thuộc Alibaba, cũng ra mắt công cụ chuyển văn bản thành video. Hiện tại nó chỉ hỗ trợ đầu vào tiếng Anh và đầu ra video bị giới hạn trong hai giây.
Các công ty Trung Quốc đại chúng khác đã tìm cách đảm bảo với nhà đầu tư rằng đang theo dõi chặt chẽ sự phát triển trong lĩnh vực này.
Trả lời câu hỏi của các nhà đầu tư trên Hudongyi, nền tảng truyền thông tương tác do Sở giao dịch Thâm Quyến vận hành, hãng điều hành game Giant Network Group (có trụ sở tại thành phố Thượng Hải) kỳ vọng “tiến bộ đột phá của Sora sẽ cải thiện hiệu quả tạo nội dung trong ngành game”.
Nhà sản xuất máy tính bảng tương tác thông minh HiteVision cũng kỳ vọng giáo dục sẽ là một ứng dụng quan trọng của các sản phẩm AI tạo sinh. Giáo dục là một phân khúc thị trường quan trọng với công ty này.
Zhejiang Enjoyor Electronics thông báo trên nền tảng của Sở giao dịch chứng khoán Thượng Hải rằng các công cụ tạo video từ văn bản có thể được áp dụng trong nhiều trường hợp sử dụng thành phố kỹ thuật số trong tương lai, chẳng hạn đánh giá và xác định lỗi ở các vụ tai nạn giao thông. Zhejiang Enjoyor Electronics là hãng cung cấp dịch vụ xây dựng cho các thành phố thông minh.
Một số giám đốc điều hành công nghệ Trung Quốc bày tỏ sự kinh ngạc trước Sora - thành tựu mới nhất của OpenAI, khi cạnh tranh gia tăng trong lĩnh vực AI tạo sinh và những rủi ro có thể xuất phát từ căng thẳng thương mại Mỹ - Trung.
Một lãnh đạo doanh nghiệp Trung Quốc đã gọi Sora là “khoảnh khắc Newton”, lưu ý cách công nghệ tạo video AI học bằng cách sử dụng các định luật vật lý. Khoảnh khắc Newton ám chỉ một bước tiến lớn và quan trọng trong phát triển khoa học hoặc công nghệ, lấy tên từ nhà khoa học nổi tiếng Isaac Newton.
Một giám đốc điều hành công nghệ khác lưu ý rằng OpenAI có thể đang nghiên cứu các “vũ khí bí mật” khác làm gia tăng thêm khoảng cách giữa Mỹ với Trung Quốc trong lĩnh vực AI, do các hạn chế xuất khẩu của chính quyền Biden với bán dẫn và các thành phần cốt lõi khác cần thiết cho ứng dụng AI.
Yin Ye, Giám đốc điều hành BGI Group (tập đoàn khổng lồ về gien của Trung Quốc), cho biết khi OpenAI ra mắt ChatGPT vào năm 2022, các đối thủ về AI trong nước này cảm thấy tự tin có thể bắt kịp “vì chỉ tập trung vào ngôn ngữ và văn bản”. Sora chứng minh rằng “thế giới kỹ thuật số thực sự có thể kết hợp với các định luật vật lý trong thế giới thực”, ông nói thêm trong video được đăng lên kênh WeChat của mình.
“Tôi muốn so sánh điều này với khoảnh khắc Newton trong phát triển AI”, Yin Ye nhấn mạnh.
Zhou Hongyi, Chủ tịch kiêm Giám đốc điều hành hãng bảo mật 360 Security Technology, cho biết trên trang tiểu blog Weibo rằng khoảng cách giữa Mỹ và Trung Quốc trong phát triển AI “có thể lớn hơn” nếu OpenAI đang nghiên cứu các “vũ khí bí mật” khác.
Zhou Hongyi ước tính rằng các mô hình ngôn ngữ lớn tốt nhất của Trung Quốc, công nghệ hỗ trợ các ứng dụng AI tương tự ChatGPT, “đã tiến gần đến mức mô hình ngôn ngữ lớn GPT-3.5 nhưng vẫn còn khoảng cách 1,5 năm so với GPT-4”. OpenAI đã ra mắt mô hình ngôn ngữ lớn GPT-4 vào tháng 3.2023.
Một số doanh nhân Trung Quốc khác cho biết không muốn đánh giá quá cao khả năng của Sora.
Fang Han, Giám đốc điều hành hãng phát triển và phát hành game Kunlun Tech, nói trong một cuộc phỏng vấn với Thời báo Chứng khoán Thượng Hải: “Với các video demo do Sora cung cấp, mô hình này chưa đạt được những bước đột phá lớn trong việc hiểu biết thế giới. Khoảng cách giữa Sora và các công cụ chuyển văn bản thành video do Trung Quốc phát triển không lớn như trong lĩnh vực mô hình ngôn ngữ lớn”.
Các nhà đầu tư ở Trung Quốc dường như coi tin tức về sự xuất hiện của Sora là tín hiệu tích cực cho thị trường. Sora Index (chỉ số Sora), bao gồm 49 hãng công nghệ, giải trí và truyền thông niêm yết ở thành phố Thượng Hải cùng Thâm Quyến, tăng 11,4% hôm 19.2, ngày giao dịch đầu tiên sau kỳ nghỉ Tết Nguyên đán.
Các chuyên gia trên thị trường nhìn thấy cơ hội trong việc phát triển AI tạo sinh. Trong một báo cáo được công bố hôm 19.2, công ty tài chính Ping An Securities cho biết lĩnh vực mô hình ngôn ngữ lớn và AI tạo sinh đang phát triển nhanh chóng “sẽ tạo động lực mạnh mẽ cho sự phát triển sức mạnh tính toán ở Trung Quốc lẫn thế giới”.
Ping An Securities nói thêm rằng các ngành công nghiệp như sức mạnh tính toán, thuật toán và an ninh mạng đều sẽ được hưởng lợi.
Tuy nhiên, Ping An Securities cảnh báo có thể có “rủi ro chuỗi cung ứng” nếu Mỹ tiếp tục hạn chế xuất khẩu chip sang Trung Quốc. Theo Ping An Securities, các biện pháp trừng phạt “có thể đẩy nhanh sự trưởng thành của ngành công nghiệp chip AI ở Trung Quốc, nhưng các lựa chọn thay thế trong nước có thể không như mong đợi”.
Yin Ye (Giám đốc điều hành BGI) đặt câu hỏi liệu Trung Quốc có đủ thời gian để bắt kịp Mỹ hay không vì “nền tảng không thuận lợi của việc tách rời và gián đoạn chuỗi cung ứng”.
Chính quyền Biden đã chặn các công ty Trung Quốc tiếp cận công cụ bán dẫn tiên tiến nhất thế giới thông qua việc tăng cường hạn chế xuất khẩu sản phẩm sử dụng công nghệ có nguồn gốc từ Mỹ. Vào tháng 10.2023, Mỹ lại thắt chặt những hạn chế đó, chặn quyền tiếp cận của Trung Quốc vào các bộ xử lý đồ họa (GPU) mà Nvidia thiết kế riêng cho khách hàng quốc gia châu Á này.
Do đó, gã khổng lồ chip Mỹ phải phát triển ba GPU trung tâm dữ liệu mới cho Trung Quốc gồm H20, L20 và L2 . Tuy nhiên, Bộ trưởng Thương mại Mỹ - Gina Raimondo đã cảnh báo rằng chính quyền Biden sẽ không tán thành bất kỳ giải pháp lách luật nào để cung cấp GPU cho Trung Quốc.