Hotline quảng cáo: 076 4575985 Hotline nội dung: 0934.999945

Nhịp đập khoa học

Chủ sở hữu TikTok phản hồi cáo buộc lén lút dùng công nghệ OpenAI phát triển mô hình AI riêng

Sơn Vân • 18/12/2023 10:04

ByteDance cho biết việc sử dụng công nghệ từ OpenAI để hỗ trợ phát triển mô hình trí tuệ nhân tạo (AI) riêng tuân thủ các điều khoản dịch vụ của công ty Mỹ, bác bỏ cáo buộc cho rằng họ dùng công nghệ này để xây dựng một dịch vụ cạnh tranh.

Theo hãng tin công nghệ The Verge (Mỹ), ByteDance đang phát triển dự án AI Project Seed, gồm hai sản phẩm chính là Doubao (chatbot AI dành cho thị trường Trung Quốc) và một chatbot AI khác để thương mại hóa trên toàn cầu thông qua nền tảng đám mây. Cách phân bổ này tương tự khi tập đoàn Trung Quốc phát hành ứng dụng video ngắn Douyin và TikTok. Tuy nhiên theo The Verge, thay vì sử dụng công cụ huấn luyện AI theo mô hình ngôn ngữ lớn riêng, ByteDance được cho dùng giao diện lập trình ứng dụng (API) của OpenAI, vi phạm quy định trong ngành AI.

The Verge đưa tin ByteDance lạm dụng công cụ của OpenAI trong nhiều giai đoạn phát triển Project Seed, gồm công đoạn đào tạo và đánh giá mô hình AI. Song khi cần xin cấp phép hoạt động chatbot Doubao tại Trung Quốc vài tháng trước, ByteDance yêu cầu nhóm nghiên cứu dừng sử dụng API OpenAI để tránh rắc rối pháp lý.

Theo The Verge, Project Seed được khởi động khoảng một năm trước và nhận được sự ưu tiên từ lãnh đạo ByteDance. Mục tiêu của dự án là tạo một mô hình ngôn ngữ lớn mạnh mẽ trong thời gian tối thiểu. Dự kiến mô hình AI này đạt 200 tỉ tham số cuối năm 2023, vượt qua mốc 175 tỉ của GPT-3.5, đồng thời đuổi kịp GPT-4 vào 2024.

Hôm 17.12, ByteDance đã đưa ra lời giải thích sau khi bị The Verge cáo buộc lén lút sử dụng công nghệ của OpenAI để phát triển mô hình ngôn ngữ lớn riêng, đồng thời cố gắng che giấu dấu vết của mình thông qua “giảm dữ liệu nhạy cảm”.

Trong một tuyên bố với trang SCMP, ByteDance thừa nhận rằng khi bắt đầu khám phá mô hình ngôn ngữ lớn vào đầu năm nay, một nhóm nhỏ kỹ sư của họ đã sử dụng dịch vụ API của OpenAI trong một mô hình thử nghiệm chưa bao giờ được ra mắt công khai.

Công ty mẹ TikTok nói thêm rằng công việc ban đầu này đã bị ngừng vào tháng 4, sau khi giới thiệu một giao thức nhằm đảm bảo tuân thủ các điều khoản sử dụng của OpenAI, trong đó cấm sử dụng đầu ra từ các sản phẩm GPT của công ty Mỹ để “phát triển các mô hình cạnh tranh với OpenAI”.

Theo ByteDance – tập đoàn có trụ sở tại Bắc Kinh (thủ đô Trung Quốc), nhóm kỹ thuật của họ vẫn sử dụng API từ OpenAI cùng với một số mô hình bên thứ ba khác “ở một mức độ rất hạn chế trong quá trình đánh giá/thử nghiệm, chẳng hạn như đo điểm chuẩn”.

“ByteDance được cấp phép sử dụng API OpenAI và rất chú trọng đến việc tuân thủ các điều khoản sử dụng của OpenAI”, tập đoàn Trung Quốc cho biết.

Trước đó, Jodi Seth (đại diện ByteDance) xác nhận tập đoàn có dùng API của OpenAI trong giai đoạn khởi động Project Seed, nhưng đã ngừng hoàn toàn và xóa mọi dữ liệu đào tạo có liên quan từ giữa năm 2023.

"Công ty được Microsoft cấp phép truy cập API OpenAI. Ngoài ra, ByteDance chỉ sử dụng công cụ này để hỗ trợ sản phẩm AI ở thị trường quốc tế. Với chatbot Doubao tại Trung Quốc, chúng tôi có các mô hình tự phát triển", Jodi Seth nói.

Tuy nhiên, OpenAI thông báo đã đình chỉ ByteDance truy cập vào dịch vụ của mình.

“Dù việc sử dụng API của chúng tôi ở mức tối thiểu nhưng ByteDance đã bị đình chỉ tài khoản của họ trong khi điều tra thêm. Nếu phát hiện ra rằng việc sử dụng của ByteDance không tuân theo các chính sách này, chúng tôi sẽ yêu cầu thực hiện những thay đổi cần thiết hoặc chấm dứt tài khoản của họ”, OpenAI, công ty được Microsoft hậu thuẫn, cho biết trong một tuyên bố gửi tới The Verge.

OpenAI chưa được chính thức cung cấp dịch vụ của mình ở Trung Quốc.

chu-so-huu-tiktok-phan-hoi-cao-buoc-len-lut-dung-cong-nghe-openai-phat-trien-mo-hinh-ai-rieng.jpg — ByteDance bị cáo buộc lén lút dùng công nghệ OpenAI phát triển mô hình AI riêng - Ảnh: AP

Việc cáo buộc ByteDance sử dụng công nghệ của OpenAI để xây dựng mô hình ngôn ngữ lớn riêng đến sau khi công ty khởi nghiệp 01.AI và bị tố sao chép kiến trúc Llama của Meta Platforms trong mô hình Yi-34B LLM của mình, theo một bài đăng trên cộng đồng mã nguồn mở Huggingface.

01.AI được Lý Khải Phục, chuyên gia AI và cựu Chủ tịch Google Trung Quốc, thành lập.

Lời cáo buộc đã làm dấy lên cuộc tranh luận sôi nổi vào thời điểm đó về khả năng sáng tạo của các công ty khởi nghiệp AI Trung Quốc.

Kể từ khi OpenAI ra mắt ChatGPT (hoạt động dựa trên mô hình ngôn ngữ lớn GPT-3.5) vào tháng 11.2022, các hãng công nghệ Trung Quốc đã cố gắng tận dụng làn sóng AI để tung ra sản phẩm cạnh tranh. Tuy nhiên, những người trong ngành và các nhà phân tích cho biết việc trình làng mô hình ngôn ngữ lớn GPT-4 Turbo vào đầu tháng 11 dự kiến sẽ giúp OpenAI tiếp tục kéo dài vị trí dẫn đầu trước các đối thủ Trung Quốc.

GPT-4 Turbo là phiên bản mạnh mẽ hơn và rẻ hơn GPT-4. Các cải tiến của GPT-4 Turbo bao gồm bộ nhớ lớn hơn để ghi nhớ tới 300 trang văn bản chỉ trong một lời nhắc, giá rẻ hơn cho nhà phát triển và ngày được đào tạo kiến thức đến tháng 4.2023, theo Sam Altman - Giám đốc điều hành OpenAI.

GPT-4 Turbo gồm hai phiên bản, một phiên bản phân tích văn bản chặt chẽ và phiên bản còn lại có tìm hiểu về bối cảnh của văn bản, hình ảnh.

OpenAI cho biết đã tối ưu hóa hiệu suất để có thể cung cấp GPT-4 Turbo với mức giá cho chuỗi ký tự đầu vào và đầu ra lần lượt chỉ bằng 1/3 và 1/2 so với giá GPT-4.

Nếu như GPT-4 được cập nhật dữ liệu lấy từ các trang web đến tháng 9.2021 thì GPT-4 Turbo lấy dữ liệu cập nhật tới tháng 4.2023. GPT-4 Turbo có thể đưa ra câu trả lời với độ dài tương đương hơn 300 trang văn bản trong một lần nhận yêu cầu.

Trong khi đó, Trung Quốc đã chứng kiến sự tăng trưởng bùng nổ về số lượng mô hình ngôn ngữ lớn đang được phát triển. Tính đến tháng 7 năm nay, ít nhất 130 mô hình ngôn ngữ lớn đã được các hãng công nghệ và viện nghiên cứu Trung Quốc phát hành, khiến Lý Ngạn Hoành (người sáng lập kiêm Giám đốc điều hành Baidu) nói rằng nước này có quá nhiều mô hình AI nền tảng, gọi đó là “sự lãng phí tài nguyên rất lớn”.

“Tôi đã quan sát thấy một hiện tượng ở Trung Quốc, trong đó nhiều ngành công nghiệp, công ty và thậm chí cả thành phố đang mua phần cứng, dự trữ chip và xây dựng các trung tâm máy tính để đào tạo các mô hình ngôn ngữ lớn riêng từ đầu.

Bản thân mô hình ngôn ngữ lớn là nền tảng cơ bản giống như hệ điều hành, nhưng cuối cùng các nhà phát triển cần phải dựa vào một số lượng hạn chế các mô hình đó để phát triển ứng dụng gốc khác nhau. Do đó, việc liên tục phát triển lại các mô hình ngôn ngữ lớn mang tính nền tảng sẽ gây lãng phí rất lớn tài nguyên xã hội", Lý Ngạn Hoành nói.

Bài liên quan

Elon Musk: OpenAI có thể phát hiện ra yếu tố nguy hiểm của AI nên sa thải Sam Altman

Elon Musk đưa ra một số giả thuyết về lý do tại sao Sam Altman ban đầu bị OpenAI sa thải.

Đọc tiếp

OpenAI đăng ký thương hiệu GPT-6 và GPT-7 ở Trung Quốc, thúc đẩy giới hạn của công nghệ

Ilya Sutskever trở nên vô hình tại OpenAI, tương lai không chắc chắn sau khi biểu quyết sa thải Sam Altman

Sam Altman tiết lộ điều tồi tệ hơn cả việc bị OpenAI sa thải

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Cuộc họp Thủ tướng ba nước Việt Nam, Lào, Campuchia

5 giờ trước Sự kiện

Chiều 22.2, nhân dịp tham dự Cuộc gặp giữa ba người đứng đầu ba Đảng Việt Nam, Campuchia và Lào tại TP.HCM, Thủ tướng Chính phủ Phạm Minh Chính đã có cuộc gặp làm việc với Thủ tướng Campuchia Hun Manet và Thủ tướng Lào Sonexay Siphandone nhằm quán triệt các nội dung thỏa thuận tại kết luận của cuộc gặp giữa ba người đứng đầu ba đảng.

Những khác biệt chính của iPhone 16e và iPhone 16: Nên chọn máy nào?

iPhone 16e là lựa chọn kinh tế hơn iPhone 16, nhưng đi kèm với một số hạn chế nhất định.
TP.HCM: Người nhận hỗ trợ 2,7 tỉ đồng do sắp xếp bộ máy phải đáp ứng điều kiện gì?

Kỳ họp lần thứ 21 (kỳ họp chuyên đề), HĐND TP.HCM chiều 20.2 đã thông qua Nghị quyết về chế...
Kiện toàn Ban Chỉ đạo xây dựng Luật KH-CN (sửa đổi): Phó thủ tướng Bùi Thanh Sơn làm trưởng ban

Thủ tướng Chính phủ Phạm Minh Chính vừa ký Quyết định số 380/QĐ-TTg ngày 20.2.2025 về việc...

Đừng bỏ lỡ

Thành công nhờ... không học đạo diễn chính quy

5 giờ trước Văn hóa

Lý Hải, Trấn Thành, Thu Trang là những đạo diễn thành công với điện ảnh, ít nhất là về mặt doanh thu phòng vé khi phim thu về trên 100 tỉ.
Ai mì Quảng không - ca khúc hay nhất về món ăn của một vùng quê

7 giờ trước Văn hóa

Có thể nói ca khúc Ai mì quảng không của cố nhạc sĩ Trần Phú Thiên là bài hát hay nhất viết về ẩm thực vùng miền.
Kiểm định cầu Đồng Nai, hạn chế lưu thông

7 giờ trước Hạ tầng và bất động sản

Ngày 22.2, Khu Quản lý đường bộ IV (Cục Đường bộ Việt Nam) cho biết đang triển khai công tác kiểm định cầu Đồng Nai cũ theo hướng từ TP.HCM đi Đồng Nai.
'Áo giáp' cho tài xế công nghệ

9 giờ trước Góc bình luận

Nhiều vụ việc xâm phạm sức khỏe, tính mạng và tài sản của shipper, tài xế công nghệ trong thời gian gần đây cho thấy dường như lái xe công nghệ cũng là “nghề nguy hiểm”, nhất là khi nữ giới cầm lái.
Sôi nổi giải giao lưu Pickleball Bộ đội Biên phòng tỉnh An Giang

10 giờ trước Sự kiện

Giải giao lưu pickleball chào mừng kỷ niệm 66 năm ngày truyền thống Bộ đội Biên phòng Việt Nam (3.3.1959 – 3.3.2025) và 36 năm ngày Biên phòng toàn dân (3.3.1989 – 3.3.2025), do Bộ đội Biên phòng tỉnh An Giang tổ chức thu hút đông đảo các vận động viên đến từ cơ quan Bộ Chỉ huy và các đơn vị cơ sở tham gia.

Mới nhất

Cuộc họp Thủ tướng ba nước Việt Nam, Lào, Campuchia

5 giờ trước Sự kiện

Chiều 22.2, nhân dịp tham dự Cuộc gặp giữa ba người đứng đầu ba Đảng Việt Nam, Campuchia và Lào tại TP.HCM, Thủ tướng Chính phủ Phạm Minh Chính đã có cuộc gặp làm việc với Thủ tướng Campuchia Hun Manet và Thủ tướng Lào Sonexay Siphandone nhằm quán triệt các nội dung thỏa thuận tại kết luận của cuộc gặp giữa ba người đứng đầu ba đảng.
Những khác biệt chính của iPhone 16e và iPhone 16: Nên chọn máy nào?

6 giờ trước Thế giới số

iPhone 16e là lựa chọn kinh tế hơn iPhone 16, nhưng đi kèm với một số hạn chế nhất định.
TP.HCM: Người nhận hỗ trợ 2,7 tỉ đồng do sắp xếp bộ máy phải đáp ứng điều kiện gì?

8 giờ trước Theo dòng thời sự

Kỳ họp lần thứ 21 (kỳ họp chuyên đề), HĐND TP.HCM chiều 20.2 đã thông qua Nghị quyết về chế độ hỗ trợ thêm đối với cán bộ, công chức, viên chức, người lao động khi thực hiện sắp xếp tổ chức bộ máy.
Kiện toàn Ban Chỉ đạo xây dựng Luật KH-CN (sửa đổi): Phó thủ tướng Bùi Thanh Sơn làm trưởng ban

10 giờ trước Theo dòng thời sự

Thủ tướng Chính phủ Phạm Minh Chính vừa ký Quyết định số 380/QĐ-TTg ngày 20.2.2025 về việc kiện toàn Ban Chỉ đạo xây dựng Luật Khoa học và Công nghệ (KH-CN) (sửa đổi).
Thủ tướng yêu cầu khắc phục hậu quả vụ TNGT đặc biệt nghiêm trọng tại Sơn La

11 giờ trước Theo dòng thời sự

Ngày 22.2, Thủ tướng Phạm Minh Chính đã có Công điện chỉ đạo khắc phục hậu quả vụ tai nạn giao thông (TNGT) đặc biệt nghiêm trọng tại huyện Yên Châu, tỉnh Sơn La.