Hotline quảng cáo: 096 2445664 Hotline nội dung: 0934.999945

Thuật toán đào tạo mới khiến robot biết coi 'thất bại là mẹ thành công'

Vũ Trung Hương | 03/03/2018, 05:42

Thuật toán mới cho phép robot học tập hiệu quả bằng cách coi mọi lỗi của mình như là một bước tiến tới thành công.

Theo IEEE Spectrum, OpenAI - một tổ chức phi lợi nhuận ở San Francisco mà một trong những người sáng lập là tỉphú sáng chế lừng danh Ilon Musk, đã phát hành một thuật toán mã nguồn mở gọi là Hindsight Experience Replay (HER), cho phép robot học tập hiệu quả bằng cách coi mọi lỗi của mình như là một bước tiến tới thành công.

Nếu trước đây, hầu hết các chiến lược đào tạo robot (và cả con người nữa) chỉ quy về việc đánh giá số lần thành công và thất bại thì ngày nay thuật toán mới của OpenAI hoàn toàn thay đổi cách tiếp cận này.

Thuật toán mới xem xét mọi nỗ lực bị thất bại không phải là một thất bại, mà là một bước tiến tới thành công.Theo các nhà phát triển, điều này thay đổi về cơ bản cách tiếp cận và tốc độ đào tạo. Vì chỉ đến khi bạn mắc phải một sai lầm, bạn mới hiểu làm thế nào để tránh nó.

Một ưu điểm khác của thuật toán mới là nó sử dụng một kỹ thuật mà các nhà nghiên cứu gọi là “phần thưởng hiếm có”. Hầu hết các thuật toán đào tạo đều sử dụng “phần thưởng trọn gói” (“full-pack rewards”)khi robot nhận được phần thưởng có quy mô khác nhau tùy thuộc vào mức độ hoàn thành nhiệm vụ. Trong thuật toán mới, robot chỉ nhận được một phần thưởng trong trường hợp thành công.

Phương pháp khuyến khích truyền thống có hiệu quả, nhưng sự phát triển các chương trình như vậy sẽ lâu hơn và chúng không phải lúc nào cũng phù hợp với cuộc sống thực. Hầu hết các ứng dụng là định hướng vào những kết quả cụ thể mà robot có thể đạt được và cũng có thể không đạt được. Các phần thưởng hiếm có nghĩa là robot chỉ nhận được một phần thưởng. Nó dễ dàng hơn để đo lường và dễ thực hiện hơn. Tuy nhiên, cách tiếp cận này làm cho việc đào tạo chậm hơn, bởi vì robot không nhận được phản hồi liên tục. Đây chính là ý tưởng của thuật toán mới: nó cho phép robot học hỏi với phần thưởng hiếm hoi, nhưng lại coi từng nỗ lực như một bài học và cứ mỗi lần lại thay đổi mục tiêu để robot có thể học được một điều gì đó.

Trong khi đó, các nhà nghiên cứu ở phòng thí nghiệm của quân đội Mỹ và Đại học Texas tại Austin lại phát triển một thuật toán được thiết kế để dạy cho robot thực hiện nhiệm vụ đồng thời tương tác với một người hướng dẫn. Thuật toán được gọi là Deep TAMER.

Vũ Trung Hương

Bài liên quan

(0) Bình luận

Xếp theo:

Đọc thêm Khoa học - công nghệ

Nổi bật Một thế giới

Cơ hội vàng đưa Việt Nam trở thành trung tâm công nghệ

9 giờ trước Khoa học - công nghệ

Theo Thủ tướng Phạm Minh Chính, Việt Nam coi AI và bán dẫn chính là cơ hội vàng giúp đất nước ta thu hút những nguồn lực lớn về tri thức, đầu tư, đưa Việt Nam trở thành một trung tâm, một điểm đến công nghệ của khu vực và thế giới.

DeepSeek làm thung lũng Silicon bối rối: Tinh gọn, không đua doanh thu, nhường sân cho Alibaba và Tencent

Trong khi nhiều công ty AI tại Thung lũng Silicon chạy đua khai thác doanh thu từ cơn sốt trí...
AI và công nghệ bán dẫn cần song hành với yếu tố bền vững

Theo ông Lợi Nguyễn (Phó chủ tịch Marvell), sự phát triển của AI và công nghệ bán dẫn cần phải...
Giám đốc ĐHQG TP.HCM: Nhân lực là chìa khóa để tự chủ công nghệ

Ngày 14.3, Đại học Quốc gia TP.HCM (ĐHQG TP.HCM) phối hợp cùng Tập đoàn CT Group tổ chức hội...

Đừng bỏ lỡ

Bắt nhiều người tại 4 trung tâm thuộc Trường Cao đẳng GTVT Trung ương III

1 giờ trước Theo dòng thời sự

Ngày 14.3, Công an TP.HCM cho biết Phòng Cảnh sát kinh tế (PC03) đã khởi tố bổ sung 14 bị can ở 4 trung tâm thuộc Trường Cao đẳng giao thông vận tải (GTVT) Trung ương III vì các tội danh "Giả mạo trong công tác" và "Mua bán trái phép hóa đơn".
7 hãng công nghệ lớn nhất Mỹ mất 2.700 tỉ USD trong ba tuần qua: Nvidia giảm mạnh nhất

2 giờ trước Thế giới số

Đợt bán tháo cổ phiếu kéo dài 3 tuần trong ngành công nghệ đã xóa sổ 2.700 tỉ USD vốn hóa thị trường của Magnificent Seven.
Hơn 13.000 người Việt chết vì bệnh lao mỗi năm, chuyên gia chỉ cách nhận diện và điều trị

2 giờ trước Thông tin Y học

Tại Việt Nam, mỗi năm ghi nhận thêm 182.000 người mới mắc lao và trên 13.000 người tử vong. Đây là con số tử vong còn cao hơn cả tai nạn giao thông.
Hoàng Thùy Linh ra mắt phim mới, né tránh câu hỏi về chuyện tình cảm với Đen Vâu

4 giờ trước Văn hóa

Lấn sân sang đề tài điện ảnh, cái tên Hoàng Thùy Linh đang được chú ý khi ra mắt dự án phim tài liệu Chúng ta là người Việt Nam vào chiều 14.3 tại Hà Nội.
Tesla sản xuất ô tô điện rẻ hơn, nâng cấp phần mềm hỗ trợ tự lái để kìm hãm đà giảm doanh số ở Trung Quốc

4 giờ trước Thế giới số

Thị phần của Tesla tại Trung Quốc, thị trường ô tô điện lớn nhất thế giới, đã giảm xuống còn 4,3% từ mức hơn 16% vào năm 2022.

Mới nhất

DeepSeek làm thung lũng Silicon bối rối: Tinh gọn, không đua doanh thu, nhường sân cho Alibaba và Tencent

5 giờ trước Khoa học - công nghệ

Trong khi nhiều công ty AI tại Thung lũng Silicon chạy đua khai thác doanh thu từ cơn sốt trí tuệ nhân tạo, công ty khởi nghiệp DeepSeek của Trung Quốc lại chọn một con đường khác: ưu tiên nghiên cứu thay vì thương mại hóa.
AI và công nghệ bán dẫn cần song hành với yếu tố bền vững

6 giờ trước Khoa học - công nghệ

Theo ông Lợi Nguyễn (Phó chủ tịch Marvell), sự phát triển của AI và công nghệ bán dẫn cần phải song hành với yếu tố bền vững.
Từ 1.4, BHXH khu vực II hoạt động với cơ cấu tổ chức ra sao?

6 giờ trước Theo dòng thời sự

Ngày 14.3, Bảo hiểm xã hội (BHXH) TP.HCM có thông báo về thực hiện chức năng, nhiệm vụ theo cơ cấu tổ chức mới từ ngày 1.4.2025.
Giám đốc ĐHQG TP.HCM: Nhân lực là chìa khóa để tự chủ công nghệ

7 giờ trước Khoa học - công nghệ

Ngày 14.3, Đại học Quốc gia TP.HCM (ĐHQG TP.HCM) phối hợp cùng Tập đoàn CT Group tổ chức hội thảo "Công nghệ đóng gói, kiểm thử tiên tiến: Cơ hội cho Việt Nam".
Ông Đỗ Anh Tuấn gia nhập CLB tỉ phú USD sau chuỗi ngày cổ phiếu thăng hoa

7 giờ trước Thông tin doanh nghiệp

Cổ phiếu Sunshine Homes (Upcom: SSH) và Tập đoàn Sunshine (HNX: KSF) tăng trần nhiều phiên liên tiếp giúp ông Đỗ Anh Tuấn gia nhập nhóm tỉ phú USD tại Việt Nam, tổng tài sản tăng hơn 12.000 tỉ đồng vượt hơn 37.000 tỉ đồng.

Xem thêm

Cơ quan chủ quản: Hội Thông tin Khoa học và Công nghệ Việt Nam.

ĐC: 24 Lý Thường Kiệt, Hàng Bài, Hoàn Kiếm, Hà Nội.

ĐT: 024.38256203

Hotline nội dung : 0934999945

Tổng biên tập: Hoàng Đại Thanh

Tổng Thư ký Tòa soạn: Nguyễn Đình Mười

Giấy phép số 77/GP-BTTTT do Bộ Thông tin và Truyền thông cấp ngày 26 tháng 2 năm 2020.

Tòa nhà SIMCO Sông Đà, Tiểu KĐT mới Vạn Phúc, Phường Vạn Phúc, Quận Hà Đông, TP. Hà Nội

ĐT: 0984708866

TPHCM: 345/134 Trần Hưng Đạo, phường Cầu Kho, Quận 1

ĐT: 028.38389241

Email: toasoan@1thegioi.vn

Hotline quảng cáo: 096 2445664

Email quảng cáo: sales@1thegioi.vn

Báo giá quảng cáo:

Công ty Cổ phần Truyền thông Một Thế Giới

Thuật toán đào tạo mới khiến robot biết coi 'thất bại là mẹ thành công'

Clip quân nhân bắt quả tang vợ đi nhà nghỉ với trai có ô tô ở Ninh Bình

New Orleans sử dụng hệ thống dự báo tội phạm thông minh

Năm mới, đừng nói với phụ nữ độc thân những lời này

Flores gặp Johnny Trí Nguyễn giao lưu võ thuật, hiệp sĩ Nguyễn Việt Sin nóng mắt

Bắc Kinh trải thảm đỏ thu hút nhân tài công nghệ thông tin

Clip nữ sinh Hà Tĩnh bị đánh và lột áo ngay trong trường gây bức xúc

Cơ hội vàng đưa Việt Nam trở thành trung tâm công nghệ

DeepSeek làm thung lũng Silicon bối rối: Tinh gọn, không đua doanh thu, nhường sân cho Alibaba và Tencent

AI và công nghệ bán dẫn cần song hành với yếu tố bền vững

Giám đốc ĐHQG TP.HCM: Nhân lực là chìa khóa để tự chủ công nghệ

Bắt nhiều người tại 4 trung tâm thuộc Trường Cao đẳng GTVT Trung ương III

7 hãng công nghệ lớn nhất Mỹ mất 2.700 tỉ USD trong ba tuần qua: Nvidia giảm mạnh nhất

Hơn 13.000 người Việt chết vì bệnh lao mỗi năm, chuyên gia chỉ cách nhận diện và điều trị

Hoàng Thùy Linh ra mắt phim mới, né tránh câu hỏi về chuyện tình cảm với Đen Vâu

Tesla sản xuất ô tô điện rẻ hơn, nâng cấp phần mềm hỗ trợ tự lái để kìm hãm đà giảm doanh số ở Trung Quốc

DeepSeek làm thung lũng Silicon bối rối: Tinh gọn, không đua doanh thu, nhường sân cho Alibaba và Tencent

AI và công nghệ bán dẫn cần song hành với yếu tố bền vững

Từ 1.4, BHXH khu vực II hoạt động với cơ cấu tổ chức ra sao?

Giám đốc ĐHQG TP.HCM: Nhân lực là chìa khóa để tự chủ công nghệ

Ông Đỗ Anh Tuấn gia nhập CLB tỉ phú USD sau chuỗi ngày cổ phiếu thăng hoa

Người dân TP.Cao Lãnh vui mừng vì đường Phạm Hữu Lầu được mở rộng

Google Gemini thu thập nhiều dữ liệu cá nhân của người dùng hơn cả DeepSeek và ChatGPT

Đằng sau việc Apple ra mắt iPhone 6e và hàng loạt sản phẩm mới trong 2 tuần qua

Ông Trump nói gì với giới tinh hoa ngành tiền điện tử trong hội nghị thượng đỉnh ở Nhà Trắng?

Apple chuẩn bị đại tu phần mềm cho iPhone, iPad và Mac đi kèm với rủi ro