Trí thông minh dữ liệu tạo

AI này vừa thiết kế một trình chỉnh sửa gen CRISPR chính xác hơn cho tế bào người ngay từ đầu

Ngày:

CRISPR đã cách mạng hóa khoa học. AI hiện đang đưa trình chỉnh sửa gen lên một tầm cao mới.

Nhờ khả năng chỉnh sửa chính xác bộ gen, các công cụ CRISPR hiện được sử dụng rộng rãi trong công nghệ sinh học và y học để giải quyết các bệnh di truyền. Vào cuối năm 2023, một liệu pháp sử dụng Giành giải thưởng Nobel công cụ đã được FDA chấp thuận để điều trị bệnh hồng cầu hình liềm. CRISPR cũng đã kích hoạt Liệu pháp tế bào CAR T để chống lại bệnh ung thư và đã quen giảm mức cholesterol cao nguy hiểm trong các thử nghiệm lâm sàng.

Ngoài y học, các công cụ CRISPR còn thay đổi cục diện nông nghiệp, với các dự án đang được thực hiện để thiết kế bò đực không sừng, cà chua giàu dinh dưỡnggia súc và cá với khối lượng cơ bắp nhiều hơn.

Bất chấp tác động của nó trong thế giới thực, CRISPR không hoàn hảo. Công cụ này cắt cả hai chuỗi DNA, có thể gây đột biến nguy hiểm. Nó cũng có thể vô tình cắt đứt những vùng ngoài ý muốn của bộ gen và gây ra những tác dụng phụ khó lường.

CRISPR lần đầu tiên được phát hiện ở vi khuẩn như một cơ chế bảo vệ, cho thấy rằng thiên nhiên ẩn chứa rất nhiều thành phần CRISPR. Trong thập kỷ qua, các nhà khoa học đã sàng lọc các môi trường tự nhiên khác nhau—ví dụ như cặn ao—để tìm ra các phiên bản khác của công cụ có khả năng tăng hiệu quả và độ chính xác. Dù thành công nhưng chiến lược này vẫn phụ thuộc vào những gì thiên nhiên ban tặng. Một số lợi ích, chẳng hạn như kích thước nhỏ hơn hoặc tuổi thọ cao hơn trong cơ thể, thường đi kèm với sự đánh đổi như hoạt động hoặc độ chính xác thấp hơn.

Thay vì dựa vào sự tiến hóa, chúng ta có thể theo dõi nhanh các công cụ CRISPR tốt hơn bằng AI không?

Tuần này, Giàu có, một công ty khởi nghiệp có trụ sở tại California, vạch ra một chiến lược sử dụng AI để tạo ra một vũ trụ mới gồm các trình chỉnh sửa gen CRISPR. Dựa trên các mô hình ngôn ngữ lớn—công nghệ đằng sau ChatGPT phổ biến—AI đã thiết kế một số thành phần chỉnh sửa gen mới.

Trong tế bào người, các thành phần được liên kết với nhau để chỉnh sửa các gen mục tiêu một cách đáng tin cậy. Hiệu suất tương đương với CRISPR cổ điển nhưng có độ chính xác cao hơn nhiều. Trình soạn thảo hứa hẹn nhất, được đặt tên là OpenCRISPR-1, cũng có thể hoán đổi chính xác các chữ cái DNA đơn lẻ—một công nghệ được gọi là chỉnh sửa cơ sở—với độ chính xác sánh ngang với các công cụ hiện tại.

“Chúng tôi chứng minh việc chỉnh sửa bộ gen người thành công đầu tiên trên thế giới bằng cách sử dụng hệ thống chỉnh sửa gen trong đó mọi thành phần đều được thiết kế hoàn chỉnh bởi AI,” đã viết các tác giả trong một bài đăng trên blog.

Trận đấu được thực hiện trên thiên đường

CRISPR và AI đã có một mối tình lãng mạn lâu dài.

Công thức CRISPR có hai phần chính: Một protein Cas “cắt kéo” cắt hoặc cắt bộ gen và một hướng dẫn RNA “chó săn” giúp gắn protein cắt kéo vào gen mục tiêu.

Bằng cách thay đổi các thành phần này, hệ thống sẽ trở thành một hộp công cụ, với mỗi thiết lập được điều chỉnh để thực hiện một loại chỉnh sửa gen cụ thể. Một số protein Cas cắt cả hai sợi DNA; những người khác chỉ cắt nhanh một sợi. Các phiên bản thay thế cũng có thể cắt RNA, một loại vật liệu di truyền có trong virus và có thể được sử dụng làm công cụ chẩn đoán hoặc điều trị bằng thuốc kháng vi-rút.

Các phiên bản khác nhau của protein Cas thường được tìm thấy bằng cách tìm kiếm trong môi trường tự nhiên hoặc thông qua một quá trình gọi là tiến hóa trực tiếp. Ở đây, nhà khoa học đã hoán đổi một cách hợp lý một số phần của protein Cas để có khả năng nâng cao hiệu quả.

Đó là một quá trình tốn rất nhiều thời gian. Đó là nơi AI xuất hiện.

Học máy đã giúp ích rất nhiều dự đoán tác động ngoài mục tiêu trong các công cụ CRISPR. Nó cũng là cắm vào trên các protein Cas nhỏ hơn để giúp các trình chỉnh sửa thu nhỏ dễ dàng đưa vào tế bào hơn.

Profluent đã sử dụng AI theo một cách mới: Thay vì thúc đẩy các hệ thống hiện tại, họ đã thiết kế các thành phần CRISPR từ đầu bằng cách sử dụng các mô hình ngôn ngữ lớn.

Dựa trên nền tảng của ChatGPT và DALL-E, những mô hình này đã đưa AI trở thành xu hướng phổ biến. Họ học từ lượng lớn văn bản, hình ảnh, âm nhạc và dữ liệu khác để chắt lọc các mô hình và khái niệm. Đó là cách các thuật toán tạo ra hình ảnh từ một lời nhắc văn bản duy nhất—chẳng hạn như “con kỳ lân đeo kính râm nhảy múa trên cầu vồng”—hoặc bắt chước phong cách âm nhạc của một nghệ sĩ nhất định.

Công nghệ tương tự cũng có đã thay đổi thế giới thiết kế protein. Giống như các từ trong sách, protein được xâu chuỗi từ các “chữ cái” phân tử riêng lẻ thành chuỗi, sau đó gấp lại theo những cách cụ thể để làm cho protein hoạt động. Bằng cách đưa các chuỗi protein vào AI, các nhà khoa học đã kháng thể thời trang và khác protein chức năng chưa được biết đến trong tự nhiên.

“Các mô hình ngôn ngữ protein tổng hợp lớn nắm bắt được bản thiết kế cơ bản về những gì tạo nên chức năng của protein tự nhiên,” đã viết nhóm trong bài đăng trên blog. “Họ hứa hẹn một con đường tắt để vượt qua quá trình tiến hóa ngẫu nhiên và hướng chúng ta tới việc thiết kế các protein có chủ ý cho một mục đích cụ thể.”

AI có mơ về cừu CRISPR không?

Tất cả các mô hình ngôn ngữ lớn đều cần dữ liệu huấn luyện. Điều này cũng đúng với thuật toán tạo ra các trình chỉnh sửa gen. Không giống như văn bản, hình ảnh hoặc video có thể dễ dàng tìm kiếm trực tuyến, cơ sở dữ liệu CRISPR khó tìm hơn.

Theo các nhà nghiên cứu, lần đầu tiên, nhóm sàng lọc hơn 26 terabyte dữ liệu về các hệ thống CRISPR hiện tại và xây dựng tập bản đồ CRISPR-Cas—tập bản đồ rộng nhất cho đến nay, theo các nhà nghiên cứu.

Cuộc tìm kiếm đã tiết lộ hàng triệu thành phần CRISPR-Cas. Sau đó nhóm đã huấn luyện họ Mô hình ngôn ngữ ProGen2—đã được tinh chỉnh để phát hiện protein—sử dụng tập bản đồ CRISPR.

AI cuối cùng đã tạo ra bốn triệu chuỗi protein có hoạt tính Cas tiềm năng. Sau khi lọc ra những điểm chết rõ ràng bằng một chương trình máy tính khác, nhóm nghiên cứu đã tập trung vào một thế giới mới của “kéo protein” Cas.

Thuật toán không chỉ tạo ra các protein như Cas9. Protein Cas có nhiều dòng, mỗi dòng có đặc điểm riêng về khả năng chỉnh sửa gen. AI cũng thiết kế các protein giống Cas13, nhắm vào RNA và Cas12a, nhỏ gọn hơn Cas9.

Nhìn chung, kết quả đã mở rộng số lượng protein Cas tiềm năng lên gần gấp 5 lần. Nhưng có ai trong số họ làm việc?

Xin chào, Thế giới CRISPR

Đối với thử nghiệm tiếp theo, nhóm tập trung vào Cas9 vì nó đã được sử dụng rộng rãi trong y sinh và các lĩnh vực khác. Họ đã huấn luyện AI về khoảng 240,000 cấu trúc protein Cas9 khác nhau từ nhiều loại động vật, với mục tiêu tạo ra các protein tương tự để thay thế các protein tự nhiên nhưng có hiệu quả hoặc độ chính xác cao hơn.

Kết quả ban đầu thật đáng ngạc nhiên: Các chuỗi được tạo ra, khoảng một triệu chuỗi, hoàn toàn khác với các protein Cas9 tự nhiên. Nhưng bằng cách sử dụng AlphaFold2 của DeepMind, một AI dự đoán cấu trúc protein, nhóm nghiên cứu nhận thấy các chuỗi protein được tạo ra có thể có hình dạng tương tự.

Protein Cas không thể hoạt động nếu không có sự hướng dẫn của RNA chó săn. Với tập bản đồ CRISPR-Cas, nhóm cũng đã huấn luyện AI để tạo ra hướng dẫn RNA khi được cung cấp chuỗi protein.

Kết quả là một trình chỉnh sửa gen CRISPR có cả hai thành phần—protein Cas và RNA dẫn hướng—được thiết kế bởi AI. Được đặt tên là OpenCRISPR-1, hoạt động chỉnh sửa gen của nó tương tự như các hệ thống CRISPR-Cas9 cổ điển khi được thử nghiệm trên tế bào thận người được nuôi cấy. Đáng ngạc nhiên là phiên bản do AI tạo ra đã cắt giảm khoảng 95% việc chỉnh sửa ngoài mục tiêu.

Với một vài chỉnh sửa, OpenCRISPR-1 cũng có thể thực hiện chỉnh sửa cơ sở, có thể thay đổi các chữ cái DNA đơn lẻ. So với CRISPR cổ điển, việc chỉnh sửa cơ sở có thể chính xác hơn vì nó hạn chế thiệt hại cho bộ gen. Trong tế bào thận của con người, OpenCRISPR-1 đã chuyển đổi một cách đáng tin cậy một ký tự DNA này sang ký tự DNA khác ở ba vị trí trên toàn bộ bộ gen, với tốc độ chỉnh sửa tương tự như các trình soạn thảo cơ sở hiện tại.

Nói rõ hơn, các công cụ CRISPR do AI tạo ra chỉ được thử nghiệm trong các tế bào trong đĩa. Để các phương pháp điều trị đến được phòng khám, chúng cần phải trải qua quá trình kiểm tra cẩn thận về độ an toàn và hiệu quả trên sinh vật sống, quá trình này có thể mất nhiều thời gian.

Profluent đang chia sẻ công khai OpenCRISPR-1 với các nhà nghiên cứu và nhóm thương mại nhưng vẫn giữ AI đã tạo ra công cụ này trong nội bộ. Họ viết: “Chúng tôi phát hành OpenCRISPR-1 một cách công khai để tạo điều kiện cho việc sử dụng rộng rãi và có đạo đức trên các ứng dụng nghiên cứu và thương mại”.

Là bản in trước, bài viết mô tả công việc của họ vẫn chưa được các chuyên gia bình duyệt phân tích. Các nhà khoa học cũng sẽ phải chứng minh OpenCRISPR-1 hoặc các biến thể hoạt động ở nhiều sinh vật, bao gồm thực vật, chuột và con người. Nhưng thật thú vị, các kết quả này đã mở ra một con đường mới cho AI có thể tạo ra – một thứ có thể thay đổi căn bản bản thiết kế di truyền của chúng ta.

Ảnh: Giàu có

tại chỗ_img

Tin tức mới nhất

tại chỗ_img

Trò chuyện trực tiếp với chúng tôi (chat)

Chào bạn! Làm thế nào để tôi giúp bạn?