Hotline quảng cáo: 076 4575985 Hotline nội dung: 0934.999945

Nvidia ra mắt phần mềm ngăn các chatbot AI nói chủ đề có hại và sai sự thật

Sơn Vân | 25/04/2023, 23:11

Hôm 25.4, Nvidia đã công bố phần mềm NeMo Guardrails giúp các công ty ngăn chặn các mô hình AI trả lời sai sự thật, nói về các chủ đề có hại hoặc để lộ lỗ hổng bảo mật.

NeMo Guardrails là ví dụ về cách ngành công nghiệp trí tuệ nhân tạo (AI) đang cố gắng giải quyết vấn đề “ảo giác” của thế hệ mô hình ngôn ngữ lớn mới nhất, vốn là trở ngại lớn với các doanh nghiệp.

Các mô hình ngôn ngữ lớn, như GPT của OpenAI và LaMDA từ Google, được đào tạo trên hàng terabyte dữ liệu để tạo ra các chương trình có thể phản hồi giống như con người. Tuy nhiên, chúng cũng có xu hướng tạo ra các thông tin không chính xác, thường được các chuyên gia gọi là "ảo tưởng".

Các ứng dụng ban đầu của công nghệ này, chẳng hạn như tóm tắt tài liệu hoặc trả lời các câu hỏi cơ bản, cần giảm thiểu hiện tượng “ảo giác” để trở nên hữu ích hơn.

NeMo Guardrails có thể làm điều này bằng cách thêm các rào cản để ngăn phần mềm khỏi việc đề cập đến các chủ đề không nên. NeMo Guardrails có thể buộc chatbot AI nói về một chủ đề cụ thể, loại bỏ nội dung độc hại và ngăn các hệ thống mô hình ngôn ngữ lớn thực thi những lệnh có hại trên máy tính.

“Bạn có thể viết kịch bản để hệ thống phản hồi theo một cách nhất định nếu có ai đó đề cập về chủ đề cụ thể, bất kể tình huống là gì. Chẳng hạn, nếu người dùng nói về một chủ đề nhạy cảm, kịch bản sẽ được sử dụng để đảm bảo rằng chatbot AI sẽ phản hồi theo cách xác định trước, ngăn chặn các nội dung không thích hợp hoặc nguy hiểm do mô hình ngôn ngữ lớn tạo ra”, Jonathan Cohen, Phó chủ tịch nghiên cứu ứng dụng của Nvidia, nói.

Thông báo này cũng nhấn mạnh chiến lược của Nvidia nhằm duy trì vị trí dẫn đầu trên thị trường chip AI bằng cách đồng thời phát triển phần mềm quan trọng cho máy học.

Nvidia cung cấp hàng ngàn GPU (bộ xử lý đồ họa) cần thiết để đào tạo và triển khai phần mềm như ChatGPT. Theo các nhà phân tích, Nvidia chiếm hơn 95% thị phần chip AI, nhưng sự cạnh tranh đang gia tăng.

nemo-guardrails-ngan-cac-chatbot-noi-chu-de-co-hai-va-sai-su-that.jpg — NeMo Guardrails giúp các công ty ngăn chặn chatbot AI trả lời sai sự thật, nói về các chủ đề có hại hoặc để lộ lỗ hổng bảo mật - Ảnh: Nvidia

NeMo Guardrails hoạt động như thế nào?

NeMo Guardrails là lớp phần mềm nằm giữa người dùng và mô hình ngôn ngữ lớn hoặc các công cụ AI khác. Phần mềm mới của Nvidia loại bỏ những kết quả xấu hoặc những truy vấn xấu trước khi mô hình phản hồi.

Nvidia đề xuất một trong những trường hợp áp dụng NeMo Guardrails khả thi là chatbot dịch vụ khách hàng. Nhà phát triển có thể sử dụng NeMo Guardrails để ngăn nói về các chủ đề không liên quan hoặc lạc đề, điều này dễ dẫn đến khả năng phản hồi vô nghĩa hoặc độc hại.

“Nếu có một chatbot dịch vụ khách hàng được thiết kế để nói về sản phẩm của mình, có lẽ bạn không muốn nó trả lời các câu hỏi về đối thủ cạnh tranh. Bạn muốn giám sát cuộc trò chuyện. Nếu điều đó xảy ra, bạn sẽ điều hướng cuộc trò chuyện trở lại các chủ đề mình thích hơn”, Jonathan Cohen lý giải.

Nvidia đưa ra một ví dụ khác về chatbot trả lời các câu hỏi về nguồn nhân lực nội bộ của công ty. Trong ví dụ này, Nvidia có thể thêm “các rào cản” để chatbot dựa trên ChatGPT không trả lời các câu hỏi về hiệu quả tài chính của công ty hoặc truy cập dữ liệu riêng tư về các nhân viên khác.

NeMo Guardrails cũng có thể sử dụng mô hình ngôn ngữ lớn để phát hiện "ảo giác" bằng cách yêu cầu mô hình ngôn ngữ lớn khác kiểm tra sự đúng đắn của câu trả lời từ cái đầu tiên. Sau đó, nó trả lời “Tôi không biết” nếu mô hình không đưa ra các câu trả lời phù hợp.

Hôm 25.4, Nvidia cũng thông báo NeMo Guardrails giúp đảm bảo an ninh và có thể buộc các mô hình ngôn ngữ lớn chỉ tương tác với phần mềm của bên thứ ba trong danh sách được cho phép.

NeMo Guardrails là nguồn mở, được cung cấp thông qua các dịch vụ của Nvidia và có thể sử dụng trong các ứng dụng thương mại. Theo Nvidia, các lập trình viên sẽ sử dụng ngôn ngữ lập trình Golang để viết các quy tắc tùy chỉnh cho mô hình AI.

Các công ty AI khác, gồm cả Google và OpenAI, đã dùng phương pháp học tăng cường từ phản hồi của con người để ngăn chặn chatbot trả lời có hại. Phương pháp này sử dụng những người thử nghiệmđể tạo dữ liệu về câu trả lời nào có thể chấp nhận được hay không, sau đó đào tạo mô hình AI bằng dữ liệu đó.

Nvidia đang ngày càng chuyển sự chú ý của mình sang AI khi đang thống trị các chip được sử dụng để tạo ra công nghệ này. Tận dụng làn sóng AI giúp Nvidia trở thành cổ phiếu tăng điểm nhiều nhất trong S&P 500 đến nay trong năm 2023, tăng 85% tính đến ngày 24.4.

S&P 500 là chỉ số chứng khoán được dựa trên vốn hóa của 500 công ty đại chúng lớn nhất Mỹ, phần nào phản ánh tình trạng của nền kinh tế nước này.

Bài liên quan

Microsoft xây dựng hệ thống với hơn 10.000 chip Nvidia cho OpenAI để phát triển GPT-4

Những công nghệ mới như generative AI dựa trên việc sử dụng hàng ngàn chip Nvidia cùng lúc để huấn luyện hệ thống AI trên kho dữ liệu khổng lồ.

Đọc tiếp

Google nói về siêu máy tính AI nhanh hơn, tiết kiệm năng lượng hơn loại dùng chip Nvidia

Nvidia, Qualcomm tranh giành vị trí đầu bảng trong các bài kiểm tra hiệu suất chip AI

Elon Musk định lập công ty AI cạnh tranh với OpenAI, Nvidia hưởng lợi

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Phát triển trung tâm đào tạo xuất sắc và tài năng về công nghệ 4.0 đến năm 2030

3 giờ trước Nhịp đập khoa học

Phó thủ tướng Chính phủ Lê Thành Long ký Quyết định số 374/QĐ-TTg phê duyệt Đề án phát triển hệ thống trung tâm đào tạo xuất sắc và tài năng về công nghệ 4.0 đến năm 2030.

Mỹ dùng Starlink đàm phán thỏa thuận đất hiếm với Ukraine

Hãng Reuters dẫn nguồn tin tiết lộ Mỹ dùng quyền tiếp cận dịch vụ internet vệ tinh Starlink...
Bài toán năng lượng để biến CO₂ thành nhiên liệu lỏng: Đáp án từ mặt trời

Trong nhiều thập kỷ qua, các nhà khoa học đã không ngừng tìm kiếm các phương pháp để giảm thiểu...
Không khí lạnh tràn xuống Bắc Bộ, rét đậm về đêm

Bắc Bộ trời rét, mưa nhỏ, mưa phùn, sương mù. Tây Nguyên và Nam Bộ mưa rào, dông rải rác.

Đừng bỏ lỡ

Ca sĩ sửa lời quốc ca Canada để phản đối ông Trump

một giờ trước Chuyển động

Trong trận chung kết giải hockey 4 Nations Face-Off giữa hai đội tuyển Mỹ và Canada, ca sĩ Chantal Kreviazuk không ngần ngại sửa lời quốc ca Canada để phản ứng trước một phát ngôn gây căng thẳng của Tổng thống Mỹ Donald Trump.
OpenAI loại bỏ một số người dùng ở Trung Quốc, Campuchia bị nghi có hoạt động độc hại

một giờ trước Thế giới số

OpenAI cho biết đã loại bỏ tài khoản của những người dùng từ một số nước mà công ty này tin rằng sử dụng công nghệ của họ cho các mục đích độc hại, gồm cả lừa đảo tài chính, giám sát và thao túng dư luận.
Lầu Năm Góc sắp sa thải 5.400 nhân viên

1 giờ trước Chuyển động

Hãng Reuters dẫn lời quan chức Lầu Năm Góc ngày 21.2 thông báo chuẩn bị cắt giảm 5.400 vị trí như một phần trong chiến dịch tinh gọn bộ máy nhà nước.
Ngành y tế Cần Thơ “Đi bộ hướng về bệnh nhân nghèo” năm 2025

1 giờ trước Theo dòng thời sự

Sáng 22.2, nhằm kỷ niệm Ngày thầy thuốc Việt Nam (27.2), ngành y tế TP.Cần Thơ tổ chức đi bộ nhằm vận động, quyên góp tiền, trang thiết bị y tế để hỗ trợ nâng cao chất lượng khám chữa bệnh tuyến y tế cơ sở.
Kỳ 2: Gặp Đặng Lê Nguyên Vũ ở Sài Gòn: Có gì trong đồ hình không chữ?

3 giờ trước Kinh tế - đầu tư - dự án

Vừa qua, Chủ tịch Tập đoàn Trung Nguyên Legend Đặng Lê Nguyên Vũ đã có cuộc gặp gỡ trao đổi với nhà báo Nguyên Hằng (Báo Thanh Niên). Trong cuộc trò chuyện kéo dài hơn 3 giờ đồng hồ, nhà báo Nguyên Hằng đã ghi chép lại những suy tư, trăn trở đầy tâm huyết của Chủ tịch Vũ về sứ mệnh dân tộc, khát vọng đất nước hùng cường trong bối cảnh mới. Nhằm mang đến cho đông đảo độc giả những thông tin, nhiều góc nhìn đầy đủ hơn về Chủ tịch Vũ, tòa soạn trân trọng giới thiệu bài báo ấy.

Mới nhất

Mỹ dùng Starlink đàm phán thỏa thuận đất hiếm với Ukraine

2 giờ trước Chuyển động

Hãng Reuters dẫn nguồn tin tiết lộ Mỹ dùng quyền tiếp cận dịch vụ internet vệ tinh Starlink để gây sức ép với Ukraine trong nỗ lực đàm phán thỏa thuận đổi đất hiếm lấy bảo đảm an ninh.
Phát triển trung tâm đào tạo xuất sắc và tài năng về công nghệ 4.0 đến năm 2030

3 giờ trước Nhịp đập khoa học

Phó thủ tướng Chính phủ Lê Thành Long ký Quyết định số 374/QĐ-TTg phê duyệt Đề án phát triển hệ thống trung tâm đào tạo xuất sắc và tài năng về công nghệ 4.0 đến năm 2030.
Bài toán năng lượng để biến CO₂ thành nhiên liệu lỏng: Đáp án từ mặt trời

3 giờ trước Kiến thức - Học thuật

Trong nhiều thập kỷ qua, các nhà khoa học đã không ngừng tìm kiếm các phương pháp để giảm thiểu lượng khí carbon dioxide (CO₂) thải ra và biến chúng thành những thứ hữu ích một cách bền vững. Vấn đề khó nhất là năng lượng để chạy các phương pháp này.
Không khí lạnh tràn xuống Bắc Bộ, rét đậm về đêm

4 giờ trước Theo dòng thời sự

Bắc Bộ trời rét, mưa nhỏ, mưa phùn, sương mù. Tây Nguyên và Nam Bộ mưa rào, dông rải rác.
Câu chuyện đằng sau chiếc áo vest kỷ vật của ca sĩ Nguyên Vũ

14 giờ trước Văn hóa

Ngoài mang vẻ đẹp thời thượng, một trong những lý do khiến chiếc áo vest trở thành kỷ vật đặc biệt trong hành trình hoạt động nghệ thuật của Nguyên Vũ chính là nó đã đồng hành cùng anh trong khắp các sân khấu, tụ điểm âm nhạc lớn nhỏ.