Vào ngày 25.8, Elon Musk bước vào chiếc ô tô điện Model S của mình tại trụ sở Tesla ở thành phố Palo Alto (bang California, Mỹ), chọn một vị trí ngẫu nhiên trên màn hình điều hướng và để chiếc xe tự lái bằng công nghệ Full Self Driving (FSD), theo trang CNBC.
Trong 45 phút, tỷ phú giàu nhất thế giới vừa nghe nhạc Mozart vừa phát trực tiếp (livestream) chuyến đi của mình, gồm cả khi đi ngang qua nhà Mark Zuckerberg (Giám đốc điều hành Meta Platforms), người mà ông đã đùa giỡn thách đấu võ trong một lồng sắt.
“Có lẽ tôi nên gõ cửa và hỏi một cách lịch sự xem liệu cậu ấy có muốn đánh tay đôi hay không”, Elon Musk cười nói trước khi chiếc Model S chạy tiếp.
Elon Musk đã sử dụng FSD hàng trăm lần trước đây, nhưng chuyến đi lần này hoàn toàn khác biệt, không chỉ vì mượt mà mà đáng tin cậy hơn nhiều.
Phiên bản FSD 12 mà Elon Musk đang sử dụng dựa trên một khái niệm hoàn toàn mới mà ông tin rằng sẽ không chỉ biến đổi hoàn toàn các phương tiện tự hành mà còn là một bước nhảy vọt về lượng tử với trí tuệ nhân tạo (AI) tổng hợp có thể hoạt động trong các tình huống vật lý thực tế.
Thay vì dựa trên hàng trăm ngàn dòng mã giống tất cả phiên bản FSD trước đây, hệ thống mới này đã tự dạy cách lái xe bằng cách xử lý hàng tỉ khung hình video về cách con người thực hiện điều đó, giống như cách các chatbot AI dựa trên mô hình ngôn ngữ lớn để tạo ra câu trả lời bằng cách xử lý hàng tỉ từ ngữ trong văn bản của con người.
Thật ngạc nhiên khi Elon Musk đưa Tesla vào phương pháp tiếp cận mới này chỉ 8 tháng trước.
“Nó giống như ChatGPT, nhưng dành cho ô tô”, Dhaval Shroff, thành viên trẻ trong đội Autopilot của Tesla, giải thích với Elon Musk trong một cuộc họp vào tháng 12.2022. Dhaval Shroff đang so sánh ý tưởng mà họ đang thực hiện với chatbot AI được OpenAI, tổ chức mà Elon Musk đồng sáng lập vào năm 2015, phát hành hồi tháng 11.2022.
“Chúng tôi xử lý một lượng dữ liệu khổng lồ về cách lái ô tô thực sự của con người trong các tình huống phức tạp. Sau đó, chúng tôi đào tạo mạng lưới thần kinh nhân tạo của máy tính để bắt chước điều đó”, Dhaval Shroff nói.
Trước đây, hệ thống Autopilot của Tesla vẫn dựa vào cách tiếp cận dựa trên các quy tắc. Camera của ô tô điện đã xác định những thứ như vạch kẻ làn đường, người đi bộ, phương tiện, biển báo và tín hiệu giao thông.
Sau đó, Autopilot áp dụng một bộ quy tắc, chẳng hạn như dừng khi đèn đỏ, đi khi đèn xanh, đi giữa vạch kẻ làn đường, chỉ qua giao lộ khi không có xe nào chạy tới đủ nhanh để tông vào bạn… Các kỹ sư của Tesla đã viết và cập nhật hàng trăm ngàn dòng mã C++ theo cách thủ công để áp dụng các quy tắc này cho những tình huống phức tạp.
“Công cụ lập kế hoạch mạng lưới thần kinh nhân tạo” mà Dhaval Shroff và những người khác đang nghiên cứu áp dụng một cách tiếp cận khác. Dhaval Shroff nói: “Thay vì xác định đường đi thích hợp của ô tô điện dựa trên các quy tắc, chúng tôi xác định đường đi thích hợp của xe bằng cách dựa vào mạng lưới thần kinh nhân tạo học hỏi từ hàng triệu ví dụ về những gì con người đã làm”.
Nói cách khác, đó là sự bắt chước của con người. Đối mặt với một tình huống, mạng lưới thần kinh nhân tạo chọn con đường dựa trên những gì con người đã làm trong hàng ngàn tình huống tương tự. Nó giống như cách con người học nói, lái xe, chơi cờ, ăn mì spaghetti và làm hầu hết mọi thứ khác.
Chúng ta có thể được đưa ra một bộ quy tắc để tuân theo, nhưng chủ yếu chúng ta tiếp thu các kỹ năng bằng cách quan sát cách người khác thực hiện chúng. Đó là cách tiếp cận học máy được Alan Turing hình dung trong bài viết năm 1950 của ông mang tên Máy tính và trí thông minh và đã bùng nổ vào hai năm nay với ChatGPT.
Đến đầu năm 2023, dự án quy hoạch mạng lưới thần kinh nhân tạo đã phân tích 10 triệu video clip được thu thập từ ô tô điện của khách hàng Tesla. Phải chăng điều đó có nghĩa là nó chỉ hoạt động tốt ở mức trung bình của những tài xế? “Không, vì chúng tôi chỉ sử dụng dữ liệu từ con người khi họ xử lý tốt một tình huống”, Dhaval Shroff giải thích.
Những người đánh giá, nhiều người trong số họ ở thành phố Buffalo (bang New York, Mỹ), xem các video và đưa ra điểm số cho chúng. Elon Musk đã yêu cầu họ tìm kiếm những điều mà "tài xế Uber 5 sao làm", và đó là các video được sử dụng để đào tạo AI.
Elon Musk thường xuyên đi qua không gian làm việc của đội Autopilot ở Palo Alto và quỳ xuống cạnh các kỹ sư để thảo luận ngẫu hứng. Khi nghiên cứu phương pháp bắt chước con người mới, Elon Musk đã đặt câu hỏi: "Nó có thực sự cần thiết không? Có lẽ nó hơi quá mức cần thiết?".
Một trong những châm ngôn của ông là bạn không bao giờ được dùng tên lửa hành trình để diệt ruồi, chỉ cần sử dụng một vỉ đập ruồi. Việc sử dụng mạng lưới thần kinh nhân tạo phức tạp có cần thiết không?
Dhaval Shroff đã cho Elon Musk thấy những trường hợp mà việc lập kế hoạch mạng lưới thần kinh nhân tạo sẽ hoạt động tốt hơn cách tiếp cận dựa trên quy tắc. Bản demo có một con đường rải đầy thùng rác, nón giao thông rơi và các mảnh vụn ngẫu nhiên. Một chiếc ô tô điện được điều khiển bởi người lập kế hoạch mạng lưới thần kinh nhân tạo có thể chạy vòng quanh các chướng ngại vật, vượt qua đường kẻ và vi phạm một số quy tắc khi cần.
Dhaval Shroff nói với Elon Musk: “Đây là những gì xảy ra khi chúng ta chuyển từ dựa trên quy tắc sang dựa trên mạng lưới nhân tạo thần kinh. Chiếc ô tô điện sẽ không bao giờ bị va chạm nếu ông bật thứ này lên, ngay cả trong những môi trường không có cấu trúc”.
Đó là kiểu nhảy vọt vào tương lai khiến Elon Musk phấn khích. “Chúng ta nên thực hiện một màn trình diễn theo phong cách James Bond, trong đó có bom nổ tứ phía và một UFO đang rơi từ trên trời xuống trong khi chiếc ô tô điện lao qua mà không va vào bất cứ thứ gì”, tỷ phú 52 tuổi người Mỹ nói.
Các hệ thống học máy thường cần một tiêu chí để hướng dẫn chúng trong quá trình tự đào tạo. Là người thích quản lý bằng cách ra quyết định những số liệu nào là tối quan trọng, Elon Musk đã đưa cho hệ thống học máy kim chỉ nam: Số dặm (1 dặm = 1,6 km) mà những chiếc ô tô điện có hệ thống FSD có thể đi được mà không cần sự can thiệp của con người.
“Tôi muốn dữ liệu mới nhất về số dặm trên mỗi lần can thiệp sẽ là trang bắt đầu tại mỗi cuộc họp của chúng ta”, Elon Musk ra quyết định. Giám đốc điều hành Tesla đề nghị nhân viên hãy biến nó thành game có thể xem điểm mỗi ngày. “Game không có điểm thì nhàm chán, vì vậy sẽ có động lực để xem mỗi ngày khi số dặm cho mỗi lần can thiệp tăng lên”, ông nói.
Các thành viên của đội đã lắp đặt các màn hình tivi lớn 85 inch trong không gian làm việc của họ để hiển thị theo thời gian thực số dặm mà ô tô điện có FSD đã đi trung bình mà không cần can thiệp. Họ đặt một chiếc chiêng gần bàn làm việc của mình. Bất cứ khi nào giải quyết thành công một vấn đề cần can thiệp, họ phải đánh chiếc chiêng.
Giữa tháng 4, đã đến lúc Elon Musk thử nghiệm công cụ lập kế hoạch mạng lưới thần kinh nhân tạo mới. Ông ngồi ở ghế lái cạnh Ashok Elluswamy, Gám đốc phần mềm Autopilot của Tesla. Ba thành viên của đội Autopilot ở phía sau. Khi họ chuẩn bị rời bãi đậu xe tại khu phức hợp văn phòng Palo Alto của Tesla, Elon Musk đã chọn một vị trí trên bản đồ để ô tô điện đi và bỏ tay ra khỏi vô lăng.
Khi ô tô điện rẽ vào đường chính, thử thách đáng sợ đầu tiên nảy sinh là một người đi xe đạp đang lao tới. Ô tô điện đã nhượng bộ, giống như con người đã làm.
Trong suốt 25 phút, chiếc ô tô điện tự lái đã đi trên các con đường và trong các khu phố, xử lý những khúc cua phức tạp và tránh xa xe đạp, người đi bộ, thú cưng.
Elon Musk không chạm vào vô lăng. Chỉ có một vài lần Elon Musk can thiệp bằng cách nhẹ nhàng nhấn ga khi ông nghĩ rằng ô tô điện đang quá cẩn thận, chẳng hạn quá "phục tùng" tại biển báo dừng tại ngã tư. Tại một thời điểm nào đó, ô tô điện thực hiện một động tác mà Elon Musk cho rằng tốt hơn ông đã làm.
“Công việc thật tuyệt vời, các bạn. Điều này thực sự ấn tượng”, Elon Musk thốt lên. Sau đó, tất cả họ đến cuộc họp hàng tuần của đội Autopilot, nơi có 20 chàng trai, hầu hết đều mặc áo phông đen, ngồi quanh bàn hội nghị để nghe Elon Musk phán quyết. Nhiều người đã không tin rằng dự án mạng lưới thần kinh nhân tạo sẽ thành công. Elon Musk tuyên bố rằng bây giờ ông là một người có niềm tin và họ nên huy động nguồn lực của mình để thúc đẩy nó phát triển.
Trong cuộc thảo luận, Elon Musk đã nắm bắt được một thực tế quan trọng mà đội đã phát hiện ra: Mạng lưới thần kinh nhân tạo không hoạt động tốt cho đến khi nó được huấn luyện trên ít nhất 1 triệu video clip. Điều này mang lại cho Tesla lợi thế lớn so với các công ty ô tô và AI khác. Tesla có một đội gần 2 triệu chiếc Tesla trên khắp thế giới thu thập các video clip mỗi ngày. Ashok Elluswamy nói tại cuộc họp: “Chúng tôi có vị thế đặc biệt để làm điều này”.
4 tháng sau, hệ thống mới đã sẵn sàng thay thế phương pháp cũ và trở thành nền tảng của FSD 12, mà Tesla dự định phát hành ngay khi các cơ quan quản lý phê duyệt. Vẫn còn một vấn đề cần khắc phục: Những tài xế, ngay cả những người giỏi nhất, thường thay đổi một chút quy tắc giao thông và FSD mới bắt chước những gì con người làm. Ví dụ, hơn 95% người lái ô tô ở Mỹ thường đi qua biển báo dừng, thay vì dừng hoàn toàn.
Cục An toàn Giao thông Quốc gia Mỹ cho biết đang nghiên cứu xem liệu điều đó có được phép áp dụng cho ô tô tự lái hay không.