Vì sao các 'ông lớn' AI đổ xô tuyển dụng các nhà triết học?
AI càng phát triển, vai trò của các nhà triết học càng trở nên quan trọng trong việc xây dựng những hệ thống an toàn và đáng tin cậy.
Trong nhiều thập kỷ, lời khuyên quen thuộc dành cho sinh viên các ngành nghệ thuật và nhân văn là: Nếu muốn có công việc lương cao, hãy học lập trình. Khi công nghệ bùng nổ, kỹ năng viết mã trở thành tấm vé bước vào những công ty giá trị hàng tỉ USD, là biểu tượng của nền kinh tế số. Nhưng trí tuệ nhân tạo (AI) đang làm thay đổi trật tự ấy.
Khi các mô hình như ChatGPT, Claude hay Gemini ngày càng có khả năng viết mã, kiểm tra lỗi và hỗ trợ phát triển phần mềm, những người được các công ty AI săn đón lại không chỉ là kỹ sư, mà còn có cả các nhà triết học.
Google DeepMind, Anthropic và OpenAI đều đã tuyển các tiến sĩ triết học tham gia phát triển mô hình AI, không phải để viết thuật toán mà để giải quyết một vấn đề còn khó hơn lập trình: Làm thế nào để AI biết đâu là điều nên và không nên làm.

Henry Ajder, chuyên gia tư vấn về AI, từng nhận xét rằng "đây có lẽ là thời điểm thuận lợi nhất để trở thành một nhà triết học kể từ khi Aristotle được mời làm gia sư cho Alexander Đại đế". Câu nói mang tính ví von này phản ánh một thực tế rằng triết học đang quay trở lại trung tâm của cuộc cách mạng công nghệ.
Khi bài toán kỹ thuật trở thành bài toán đạo đức
Ở giai đoạn đầu, cuộc đua AI chủ yếu xoay quanh năng lực tính toán. Các công ty tìm cách xây dựng những mô hình thông minh hơn, xử lý dữ liệu nhanh hơn và tạo ra câu trả lời chính xác hơn.
Nhưng khi AI bắt đầu tham gia vào những lĩnh vực như y tế, giáo dục, tài chính hay xe tự lái, các bài toán kỹ thuật nhanh chóng chuyển thành những câu hỏi mang tính đạo đức.
Một chatbot nên phản ứng thế nào khi người dùng tìm kiếm thông tin để tự làm hại bản thân? Một trợ lý AI có nên trả lời mọi yêu cầu nếu nội dung đó có thể bị lạm dụng? Trong trường hợp xe tự lái không thể tránh khỏi va chạm, hệ thống sẽ ưu tiên bảo vệ hành khách hay người đi bộ?
Đó đều là những câu hỏi không thể giải quyết chỉ bằng thuật toán. Chúng đòi hỏi AI phải có khả năng cân nhắc giữa các giá trị, điều mà giới nghiên cứu gọi là "value alignment" - bảo đảm mô hình AI hành xử phù hợp với lợi ích và chuẩn mực của con người.
Chính vì vậy, triết học trở thành một phần quan trọng trong quá trình phát triển AI.
Từ Socrates đến Claude
Một trong những ví dụ tiêu biểu là Anthropic - công ty phát triển mô hình Claude.
Amanda Askell, tiến sĩ triết học và là một trong những nhân sự chủ chốt của Anthropic, tham gia xây dựng phương pháp Constitutional AI (AI lập hiến). Thay vì chỉ huấn luyện mô hình bằng lượng dữ liệu khổng lồ, nhóm nghiên cứu còn xây dựng một "bộ hiến pháp" gồm hàng chục nguyên tắc đạo đức để AI tham chiếu khi đưa ra phản hồi.
Những nguyên tắc này được tổng hợp từ nhiều nguồn khác nhau, từ triết học của Immanuel Kant, Tuyên ngôn Quốc tế Nhân quyền cho đến các quy tắc về an toàn và quyền riêng tư trong môi trường số. Mục tiêu không phải biến AI thành một "người tốt", mà giúp mô hình biết cân nhắc giữa những lựa chọn khi gặp các tình huống nhạy cảm.
Bên cạnh đó, Anthropic còn áp dụng tinh thần đối thoại của Socrates vào quá trình huấn luyện AI. Thay vì luôn cố gắng trả lời mọi câu hỏi, mô hình được khuyến khích thừa nhận giới hạn hiểu biết của mình khi thiếu thông tin. Đây là cách tiếp cận nhằm giảm hiện tượng hallucination (ảo giác AI), khi mô hình tạo ra thông tin sai nhưng lại trình bày với sự tự tin tuyệt đối.
Nghe có vẻ đơn giản, nhưng đây là một thay đổi đáng chú ý. Trong nhiều năm, các công ty công nghệ tập trung vào việc khiến AI trả lời nhanh và đầy đủ hơn. Giờ đây, một tiêu chí mới được đặt ra: AI cũng cần biết nói "Tôi không biết" khi cần thiết.
Đó cũng là một trong những tư tưởng nổi tiếng nhất của Socrates. Theo triết gia Hy Lạp, điểm khởi đầu của tri thức không phải là biết mọi thứ, mà là ý thức được giới hạn của chính mình.
Triết lý có từ hơn 2.000 năm trước vì thế lại trở thành nền tảng cho một trong những công nghệ hiện đại nhất thế giới.

Đạo đức hay lợi nhuận: Cuộc tranh luận chưa có hồi kết
Việc các tập đoàn công nghệ tuyển dụng ngày càng nhiều nhà triết học không đồng nghĩa mọi nghi ngại về AI đều biến mất. Ngược lại, nó mở ra một cuộc tranh luận mới: liệu các công ty thực sự muốn xây dựng AI có trách nhiệm, hay chỉ đang tạo thêm một lớp "vỏ bọc" đạo đức cho hoạt động kinh doanh?
Edward Harcourt, giáo sư triết học tại Đại học Oxford, là một trong những người đặt ra câu hỏi này. Ông cảnh báo về hiện tượng "ethics-washing" - sử dụng các tuyên bố hoặc đội ngũ chuyên gia đạo đức để xây dựng hình ảnh doanh nghiệp có trách nhiệm, trong khi mục tiêu cuối cùng vẫn là tăng trưởng và lợi nhuận.
Đó không phải là nghi ngờ vô căn cứ. Các công ty AI hiện nay đều phải chạy đua về tốc độ phát triển mô hình, thu hút người dùng và tạo doanh thu. Trong bối cảnh ấy, những nguyên tắc đạo đức đôi khi phải đối mặt với áp lực rất lớn từ lợi ích kinh doanh.
Ngay cả giữa các công ty AI cũng tồn tại những triết lý phát triển khác nhau.
Anthropic nổi tiếng với cách tiếp cận dựa trên thuyết nghĩa vụ (Deontology) - nhấn mạnh việc tuân thủ các nguyên tắc như trung thực, không gây hại hay không ép buộc người dùng. Với họ, có những giới hạn mà AI không nên vượt qua, bất kể kết quả cuối cùng có mang lại lợi ích hay không.
Trong khi đó, nhiều mô hình của Google hay OpenAI được cho là chịu ảnh hưởng nhiều hơn từ thuyết vị lợi (Consequentialism), nơi một quyết định được đánh giá dựa trên kết quả và lợi ích tổng thể mà nó mang lại.
Sự khác biệt này có thể thấy rõ trong các hệ thống xe tự lái. Khi tai nạn là điều không thể tránh khỏi, thuật toán phải lựa chọn phương án giúp giảm thiểu thiệt hại nhiều nhất. Đó không chỉ là một phép tính kỹ thuật mà còn là một bài toán đạo đức kéo dài nhiều thập kỷ.
Vì thế, công việc của các nhà triết học trong các phòng thí nghiệm AI không phải tìm ra một đáp án đúng tuyệt đối, mà là giúp các kỹ sư hiểu rằng mỗi lựa chọn đều phản ánh một hệ giá trị nhất định.

AI có thể đạo đức hơn con người?
Nếu vài năm trước, câu hỏi phổ biến nhất là liệu AI có thông minh hơn con người hay không, thì hiện nay một chủ đề khác bắt đầu thu hút sự quan tâm của giới nghiên cứu: AI có thể đưa ra những quyết định đạo đức tốt hơn con người?
Một số học giả cho rằng điều này hoàn toàn có thể xảy ra. Triết gia Sam Elgin gọi đó là "morality explosion" - thời điểm AI đạt đến năng lực suy luận đạo đức vượt qua con người trong một số tình huống nhất định. Theo lập luận này, AI không bị chi phối bởi cảm xúc, thành kiến hay lợi ích cá nhân, vì vậy có thể đưa ra những quyết định nhất quán hơn.
Dù vậy, không phải ai cũng đồng tình.
Khác với toán học hay vật lý, đạo đức không có đáp án duy nhất. Điều được xem là đúng ở một quốc gia có thể không phù hợp với nền văn hóa khác. Ngay trong cùng một xã hội, chuẩn mực đạo đức cũng thay đổi theo thời gian. Chính vì vậy, nhiều chuyên gia cho rằng sẽ rất nguy hiểm nếu con người giao toàn bộ các quyết định đạo đức cho máy móc. Khi AI ngày càng giỏi đưa ra lời khuyên, con người cũng có nguy cơ dần đánh mất khả năng tự cân nhắc, tranh luận và chịu trách nhiệm về những lựa chọn của mình.
Đó là nghịch lý của AI: Công nghệ càng thông minh, con người càng phải chủ động giữ vai trò quyết định.
Cuộc đua AI cần có sự đóng góp của triết học và khoa học xã hội
Sự xuất hiện ngày càng nhiều của các nhà triết học trong các phòng thí nghiệm AI cho thấy cuộc đua công nghệ đang bước sang một giai đoạn mới.
Nếu trước đây, lợi thế được quyết định bởi sức mạnh tính toán, dữ liệu hay chip bán dẫn, thì giờ đây những câu hỏi về đạo đức, trách nhiệm và giá trị con người cũng trở thành một phần của cuộc cạnh tranh.
Iason Gabriel, nhà nghiên cứu tại Google DeepMind, từng nhận định rằng để hiểu một công nghệ thực sự mang lại lợi ích cho con người hay không thì kiến thức kỹ thuật là chưa đủ. Điều đó còn đòi hỏi sự đóng góp của triết học, khoa học xã hội và nhiều lĩnh vực khác.
Có lẽ vì vậy, những cái tên như Socrates, Aristotle hay Immanuel Kant đang được nhắc đến nhiều hơn trong các phòng nghiên cứu AI của Thung lũng Silicon.
(Nguồn tham khảo: Economist, Wired, Theatlantic)