Nhóm khoa học Trung-Mỹ tạo mô hình AI tiên tiến giúp vượt qua thách thức lớn để phát triển các loại thuốc mới
Nhịp đập khoa học - Ngày đăng : 18:47, 26/08/2024
Nhóm khoa học Trung-Mỹ tạo mô hình AI tiên tiến giúp vượt qua thách thức lớn để phát triển các loại thuốc mới
Nhóm nhà khoa học ở Trung Quốc và Mỹ cho biết đã phát triển mô hình trí tuệ nhân tạo (AI) mới mang tên ActFound, có thể giúp vượt qua một số thách thức lớn với việc phát triển và khám phá thuốc mới.
Theo một bài viết được đăng trên tạp chí Nature Machine Intelligence, ActFound hoạt động tốt hơn các mô hình AI cạnh tranh và vượt qua các thách thức khi sử dụng học máy để dự đoán hoạt tính sinh học.
"Hoạt tính sinh học gồm nhiều đặc tính khác nhau của hợp chất, chẳng hạn tương tác của chúng với mục tiêu, tác động đến hệ thống sinh học và hiệu quả điều trị", các nhà nghiên cứu từ Đại học Bắc Kinh (Trung Quốc), Đại học Washington (Mỹ) và INF Technology Shanghai (hãng công nghệ AI ở thành phố Thượng Hải) cho biết.
Những thách thức chính khi sử dụng học máy bao gồm việc dán nhãn dữ liệu hạn chế và sự không tương thích giữa các thử nghiệm đo lường hoạt tính hoặc hiệu lực của thuốc.
Học máy là một lĩnh vực trong AI tập trung vào việc phát triển các thuật toán và mô hình máy tính có khả năng học hỏi từ dữ liệu và cải thiện hiệu suất của chúng theo thời gian mà không cần lập trình cụ thể. Các hệ thống học máy có khả năng tự động tìm hiểu và áp dụng kiến thức từ dữ liệu để thực hiện các nhiệm vụ cụ thể như phân loại, dự đoán, nhận dạng mẫu và tối ưu hóa quyết định.
Những ứng dụng của học máy rất đa dạng như xử lý ngôn ngữ tự nhiên, thị giác máy tính, xe tự hành, dự đoán thời tiết, quản lý dữ liệu lớn...
Học máy đã có sự tiến bộ đáng kể trong thập kỷ gần đây, nhờ sự phát triển của các mô hình học sâu và khả năng xử lý dữ liệu lớn (big data), mang lại nhiều cơ hội và tiềm năng giải quyết các vấn đề phức tạp và cải thiện hiệu suất trong nhiều lĩnh vực khác nhau.
ActFound không chỉ vượt trội hơn các mô hình AI cạnh tranh mà còn hoạt động tốt như phương pháp tính toán truyền thống là free-energy perturbation (FEP).
FEP là phương pháp tính toán được sử dụng rộng rãi trong mô hình hóa phân tử để ước tính sự thay đổi năng lượng tự do Gibbs khi hệ thống trải qua một quá trình biến đổi nhỏ, ví dụ như khi một phân tử thay đổi cấu trúc hoặc một chất hòa tan được thêm vào dung môi.
Tại sao FEP lại quan trọng?
- Dự đoán tính ổn định của phân tử: FEP giúp chúng ta dự đoán được phân tử nào sẽ ổn định hơn trong một môi trường nhất định, từ đó có thể thiết kế các phân tử có tính ổn định cao hơn.
- Tính toán năng lượng liên kết: FEP được sử dụng để tính toán năng lượng liên kết giữa các phân tử. Thông tin này rất quan trọng trong việc nghiên cứu các tương tác phân tử, chẳng hạn như tương tác thuốc - protein.
- Thiết kế thuốc: FEP đóng vai trò quan trọng trong quá trình thiết kế thuốc, giúp các nhà khoa học dự đoán được hiệu quả của một phân tử thuốc tiềm năng trước khi tiến hành tổng hợp và thử nghiệm thực nghiệm.
Nguyên lý hoạt động của FEP
FEP dựa trên lý thuyết thống kê cơ học, cụ thể là định lý của Kirkwood. Phương pháp này liên kết sự thay đổi năng lượng tự do Gibbs với sự khác biệt về phân bố Boltzmann giữa trạng thái ban đầu và trạng thái cuối của hệ thống. Bằng cách thực hiện một loạt các mô phỏng động lực học phân tử, chúng ta có thể thu thập thông tin về phân bố Boltzmann và từ đó tính toán được năng lượng tự do Gibbs.
Ưu điểm của FEP
- Độ chính xác cao: FEP có thể cung cấp kết quả tính toán với độ chính xác cao, tương đương với các kết quả thực nghiệm.
- Linh hoạt: FEP có thể được áp dụng cho nhiều hệ thống phân tử khác nhau, từ các phân tử nhỏ đến macromolecule phức tạp.
Hạn chế của FEP
- Tốn kém về mặt tính toán: Các tính toán FEP thường yêu cầu các nguồn máy tính mạnh và thời gian tính toán dài.
- Yêu cầu kiến thức chuyên môn: Để thực hiện các tính toán FEP, người dùng cần có kiến thức sâu rộng về lý thuyết thống kê cơ học và các phần mềm mô phỏng phân tử.
Ứng dụng của FEP
- Thiết kế thuốc: Dự đoán ái lực liên kết của các hợp chất với protein mục tiêu.
- Nghiên cứu enzyme: Nghiên cứu cơ chế hoạt động của enzyme và các chất ức chế enzyme.
- Nghiên cứu protein: Nghiên cứu tính ổn định và động học của protein.
- Nghiên cứu vật liệu: Nghiên cứu các tương tác phân tử trong vật liệu.
Kết luận
FEP là một công cụ tính toán mạnh mẽ và linh hoạt, đóng vai trò quan trọng trong nhiều lĩnh vực nghiên cứu, đặc biệt là trong lĩnh vực hóa sinh và dược phẩm. Dù có một số hạn chế, FEP vẫn là công cụ không thể thiếu trong việc thiết kế và phát triển các phân tử mới, chẳng hạn như thuốc.
Dù các phép tính FEP có độ chính xác cao, nhóm nghiên cứu cảnh báo rằng chúng "yêu cầu các nguồn tài nguyên tính toán lớn mà thường không đủ khả năng chi trả cho các ứng dụng quy mô lớn".
Các phương pháp như vậy thường dựa vào những cấu trúc protein ba chiều khó có được để chạy, chỉ có thể thu được bằng thiết bị đắt tiền và quy trình phòng thí nghiệm mở rộng.
Nhóm nghiên cứu cho biết ActFound có thể hoạt động chính xác với ít điểm dữ liệu hơn, cung cấp một giải pháp thay thế chính xác và ít tốn kém hơn cho FEP.
"Kết quả đầy hứa hẹn của chúng tôi chỉ ra rằng ActFound có thể là mô hình nền tảng hoạt tính sinh học hiệu quả cho nhiều loại hoạt động khác nhau", Wang Sheng, tác giả chính của nghiên cứu và phó giáo sư tại Đại học Washington, nói.
Trung Quốc là nơi có ngành công nghiệp dược phẩm đang bùng nổ, với việc chính phủ đầu tư mạnh vào nghiên cứu và phát triển các loại thuốc cải tiến. Nhiều công ty đã chuyển sang AI để tìm các mục tiêu thuốc tiềm năng nhằm rút ngắn thời gian phát triển, với một số sản phẩm trải qua thử nghiệm lâm sàng.
Nhóm nghiên cứu viết trong bài báo của mình rằng: "Đánh giá hoạt tính sinh học của các hợp chất là trọng tâm quá trình khám phá và phát triển thuốc".
Đánh giá hoạt tính sinh học nhằm dự đoán giá trị cho các hợp chất, giúp nhà khoa học xác định các hợp chất có thể hữu ích từ một số lượng lớn ứng viên trong khi giảm thiểu những thí nghiệm tốn thời gian và tốn kém.
Dù học máy có tiềm năng, một số thách thức lớn vẫn hạn chế việc áp dụng công nghệ này.
"Các phương pháp học máy hiện tại có khả năng tổng quát hóa kém trong dự đoán hoạt tính sinh học do số lượng nhỏ hợp chất trong mỗi thử nghiệm ít và các phép đo không tương thích giữa nhữngthử nghiệm", nhóm nghiên cứu viết.
Các mô hình nền tảng, được đào tạo trước trên tập dữ liệu lớn để tổng quát hóa dự đoán cho những tập dữ liệu không có nhãn, là một cách để vượt qua vấn đề này.
ActFound đã được đào tạo bằng 35.644 thử nghiệm từ cơ sở dữ liệu hóa học phổ biến cũng như 1,6 triệu hoạt tính sinh học được đo lường bằng thực nghiệm.
Ngoài ra, ActFound cũng sử dụng hai phương pháp học máy là học meta (siêu dữ liệu) và học từng cặp.
Học meta là khuôn khổ cho phép tối ưu hóa mô hình bằng cách sử dụng dữ liệu có nhãn hạn chế để dự đoán các đặc tính của các hợp chất chưa được đo lường. Một mô hình AI được đào tạo với số lượng lớn thử nghiệm có thể được sử dụng để hoạt động trong các thử nghiệm có dữ liệu hạn chế.
“Học meta rất phù hợp để dự đoán hoạt tính sinh học, vì có tình trạng thiếu hụt nghiêm trọng dữ liệu hoạt tính sinh học chưa được đo lường trong nhiều dự án khám phá thuốc do chi phí trong phòng thí nghiệm cao”, Wang Sheng nói.
Trong khi đó, học từng cặp giúp khái quát hóa mô hình AI. Thay vì dự đoán các giá trị tuyệt đối có khả năng không tương thích, nó tính toán sự khác biệt tương đối giữa các cặp hợp chất.
“Trực giác của chúng tôi là dù các hợp chất từ các thử nghiệm khác nhau có thể có những đơn vị, phạm vi giá trị hoặc số liệu đo lường khác nhau, những hợp chất trong cùng một xét nghiệm là tương đương nhau. Chúng tôi là những người đầu tiên kết hợp học meta và học từng cặp trong dự đoán hoạt tính sinh học”, nhóm nghiên cứu viết.
ActFound đã được thử nghiệm trên 6 tập dữ liệu hoạt tính sinh học trong thế giới thực và được phát hiện là vượt trội 9 mô hình AI cạnh tranh về dự đoán trong miền và hoạt động mạnh mẽ trong dự đoán liên miền.
Dự đoán trong miền đề cập đến việc dự đoán các kết quả trong phạm vi hoặc miền mà mô hình AI đã được huấn luyện.
Dự đoán liên miền đề cập đến việc áp dụng mô hình AI cho các dữ liệu hoặc tình huống ngoài phạm vi hoặc miền mà mô hình từng được huấn luyện ban đầu.
Nói cách khác, ActFound không chỉ hoạt động tốt trong các điều kiện mà nó đã được huấn luyện, mà còn thể hiện hiệu suất tốt khi áp dụng cho các trường hợp mới hoặc khác biệt.
Nhóm cũng tiến hành một nghiên cứu điển hình để xem liệu ActFound có thể được sử dụng để dự đoán hoạt tính sinh học thuốc điều trị ung thư hay không và thấy rằng nó hoạt động tốt hơn các mô hình AI khác.
Nhóm nghiên cứu cho biết: "Kết quả đầy hứa hẹn của chúng tôi chỉ ra rằng ActFound có thể là mô hình nền tảng hoạt tính sinh học hiệu quả để dự đoán hoạt tính sinh học của hợp chất, mở đường cho việc phát triển và khám phá thuốc dựa trên học máy".