✨CRISPR
CRISPR (; ) là một họ các trình tự DNA được tìm thấy trong bộ gen của các sinh vật nhân sơ như vi khuẩn và vi khuẩn cổ.
thumb|Sơ đồ cơ chế phòng thủ chống virus của sinh vật nhân sơ sử dụng CRISPR
Hệ CRISPR-Cas là một hệ miễn dịch ở sinh vật nhân sơ mang lại khả năng chống lại các yếu tố di truyền ngoại lai, như sự xâm nhập của plasmid và thể thực khuẩn, tạo thành một dạng miễn dịch thu được. RNA bắt cặp với trình tự của vùng đệm (spacer) trên DNA mới xâm nhập và giúp protein Cas (CRISPR-associated) nhận diện và thực hiện cắt đứt sợi DNA xâm nhập gây bệnh. Những protein Cas khác do RNA dẫn đường cắt các RNA ngoại lai xâm nhập. CRISPR được tìm thấy trong khoảng 50% các bộ gen vi khuẩn và gần 90% các bộ gene vi khuẩn cổ.
Những hệ thống này đã dẫn đến kỹ thuật chỉnh sửa gen CRISPR sử dụng gen cas9. Quá trình chỉnh sửa này có ứng dụng rộng rãi bao gồm nghiên cứu sinh học, phát triển các sản phẩm công nghệ sinh học, và chữa trị các bệnh.
Lịch sử
Chuỗi lặp lại
Sự phát hiện các trình tự DNA lặp lại xảy ra độc lập ở ba nơi khác nhau trên thế giới. Năm 1987, nhà nghiên cứu Yoshizumi Ishino và đồng nghiệp từ Đại học Osaka lần đầu tiên mô tả thứ mà sau này được gọi CRISPR. Họ vô tình nhân đôi một đoạn CRISPR trong quá trình tái bản gen "iap". Các đoạn lặp lại này được sắp xếp rất kỳ lạ. Những chuỗi lặp lại thường xếp liên tiếp nhau, không có những chuỗi khác xen giữa. và dùng tính chất này để phát triển phương pháp nhận dạng spoligotyping, vẫn được dùng đến ngày nay.
Francisco Mojica tại Đại học Alicante ở Tây Ban Nha nghiên cứu các đoạn lặp lại và chức năng của chúng trong các loài vi khuẩn cổ Haloferax và Haloarcula. Người hướng dẫn của Mojica vào lúc đó cho rằng những đoạn lặp lại có vai trò trong việc phân chia các DNA đã nhân đôi vào hai tế bào con trong quá trình phân bào, bởi plasmid và nhiễm sắc thể với những đoạn lặp giống nhau không thể cùng tồn tại trong Haloferax volcanii. Việc phiên mã những đoạn lặp gián đoạn này cũng được nghiên cứu lần đầu tiên, dẫn đến việc những đặc trưng của CRISPR. Năm 2000, Mojica khảo sát các nguồn khoa học và một trong những sinh viên tìm kiếm trong các bộ gen đã được công bố. Họ xác định được những đoạn lặp gián đoạn ở 20 loài vi sinh vật cùng thuộc một họ. Năm 2001, Mojica và Ruud Jansen trong khi đang tìm kiếm những đoạn lặp gián đoạn khác, đề xuất cái tên CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats; tạm dịch: Đoạn lặp palindrome ngắn gián đoạn thường xuyên theo cụm) nhằm tránh nhầm lẫn xuất phát từ nhiều tên gọi khác được dùng trong giới khoa học để diễn tả những đoạn DNA này. Năm 2002, Tang, et al. tìm ra bằng chứng cho thấy những vùng lặp CRISPR trong bộ gen của Archaeoglobus fulgidus được phiên mã thành phân tử RNA dài rồi được biến thành những đoạn RNA ngắn, cùng các chuỗi dài 2, 3 hoặc nhiều hơn đơn vị đệm.
Phức hệ CRISPR
Một bước tiến lớn trong việc hiểu rõ CRISPR đến từ quan sát của Jansen rằng những cụm lặp lại ở sinh vật nhân sơ này đi kèm với một tập hợp các gen tương đồng tạo thành các phức hệ CRISPR hay gen cas. Bốn gen cas (cas 1–4) được nhận diện từ đầu. Các protein Cas chứa motif cấu trúc helicase và nuclease, gợi ý về vai trò trong cấu trúc động của các locus CRISPR. Cái tên CRISPR được dùng thống nhất cho hình mẫu này. Tuy nhiên, chức năng của chúng vẫn chưa được biết đến.
[[Tập tin:SimpleCRISPR.jpg|thumb|Giản đồ một locus CRISPR. Ba thành phần chính của một vị trí CRISPR được thể hiện gồm: gen cas, một trình tự dẫn đầu, và một mảng lặp-đệm. Các hình chữ nhật xám là các đoạn lặp, còn các đoạn màu là đoạn đệm xen giữa. Sự sắp xếp ba thành phần này không phải luôn giống trong hình. Ngoài ra, một số CRISPR với trình tự tương tự nhau có thể xuất hiện trong cùng một bộ gen, nhưng chỉ một trong số đó là có các gen cas.]]
Năm 2005, ba nhóm nghiên cứu độc lập chỉ ra rằng một số đoạn đệm CRISPR xuất phát từ DNA thể thực khuẩn và DNA ngoại nhiễm sắc thể như là plasmid. Nói cách khác, các đoạn đệm (spacer) là những đoạn DNA lấy từ những virus từng cố gắng xâm nhập tế bào trước đó. Nguồn gốc của các đoạn đệm là dấu hiệu cho thấy phức hệ CRISPR/cas có thể đóng một vai trò trong hệ miễn dịch thu được ở vi khuẩn. Cả ba nghiên cứu đưa ra ý tưởng này ban đầu bị các tạp chí có danh tiếng từ chối, nhưng cũng xuất hiện trong những tạp chí khác.
Nghiên cứu đầu tiên, bởi Mojica và đồng nghiệp tại Đại học Alicante,
Các thí nghiệm của nhiều nhóm khác nhau cho thấy cơ chế cơ bản của miễn dịch CRISPR-Cas. Năm 2007, bằng chứng thực nghiệm đầu tiên cho thấy CRISPR là một hệ miễn dịch thu được được đăng tải. Năm 2008, Brouns và Van der Oost tìm ra một phức hệ các protein Cas (gọi là Cascade) trong E. coli cắt tiền RNA CRISPR trong những đoạn lặp thành những phân tử RNA trưởng thành chứa đoạn đệm gọi là RNA CRISPR (crRNA), gắn với phức hệ protein. Hơn nữa, người ta phát hiện rằng cần có Cascade, crRNA và một helicase/nuclease (Cas3) để giúp vi khuẩn miễn dịch với một virus DNA. Cùng năm đó, Marraffini và Sontheimer xác nhận rằng một trình tự CRISPR trong S. epidermidis nhắm vào DNA chứ không phải RNA để tránh giao nạp. Phát hiện này trái với những cơ chế tương tự can thiệp RNA được đề ra trước đó cho miễn dịch CRISPR-Cas, mặc dù một hệ thống CRISPR-Cas nhắm vào RNA ngoại lai được tìm thấy trong Pyrococcus furiosus. Một nghiên cứu năm 2010 cho thấy CRISPR-Cas cắt cả sợi thể thực khuẩn và DNA plasmid trong S. thermophilus.
Cas9
Các nhà nghiên cứu tập trung vào một hệ CRISPR đơn giản trong Streptococcus pyogenes dựa vào protein Cas9. Endonuclease Cas9 là một phức hệ bốn phần gồm hai phân tử crRNA nhỏ và RNA CRISPR CRISPR RNA chuyển hoạt (tracrRNA). Jennifer Doudna và Emmanuelle Charpentier thiết kế lại endonuclease Cas9 thành một hệ dễ kiểm soát hơn bằng cách hợp hai phân tử RNA lại thành một RNA dẫn đường, mà khi kết hợp với Cas9, có thể tìm và cắt DNA chỉ định bởi RNA dẫn đường. Đóng góp này có ý nghĩa quan trọng và được vinh danh bởi Giải Nobel Hóa học năm 2020. Bằng cách điều khiển chuỗi nucleotide của RNA dẫn đường, phức hệ Cas9 nhân tạo có thể được lập trình để đánh vào bất kỳ chuỗi DNA nào xâm nhập. Một nhóm khác gồm Virginijus Šikšnys và đồng nghiệp cho thấy Cas9 từ hệ CRISPR của S. thermophilus có thể được tái lập trình để nhắm vào mục tiêu tùy ý bằng cách thay đổi trình tự của crRNA. Những bước tiến này thúc đẩy các nỗ lực chỉnh sửa bộ gen bằng hệ thống CRISPR-Cas9 tùy biến. Từ đó kỹ thuật này đã được dùng cho nhiều loại sinh vật, bao gồm nấm men (Saccharomyces cerevisiae), mầm bệnh cơ hội Candida albicans, cá ngựa vằn (Danio rerio), ruồi giấm thường (Drosophila melanogaster), kiến (Harpegnathos saltator và Ooceraea biroi), muỗi (Aedes aegypti), giun tròn (Caenorhabditis elegans), thực vật, chuột, khỉ và phôi người.
CRISPR đã được chỉnh sửa để làm yếu tố phiên mã lập trình được, cho phép các nhà khoa học tập trung và kích hoạt hoặc vô hoạt các gen nhất định.
Cas12a (trước là Cpf1)
Năm 2015, nuclease Cas12a (trước gọi là Cpf1) được miêu tả trong phức hệ CRISPR/Cpf1 của vi khuẩn Francisella novicida. Tên gọi gốc của nó, từ một họ protein TIGRFAM định nghĩa năm 2012, cho thấy sự phổ biến loại CRISPR-Cas này ở chi Prevotella và Francisella. Cas12a khác với Cas9 ở một số điểm bao gồm: gây ra vết cắt 'so le' trong đoạn DNA kép thay vì vết cắt 'thẳng' như của Cas9, dựa trên một trình tự PAM giàu thymine và chỉ cần một RNA CRISPR (crRNA) để tìm thấy mục tiêu, trong khi Cas9 cần cả crRNA và một crRNA chuyển hoạt (tracrRNA).
Sự khác nhau này có thể khiến Cas12a tốt hơn Cas9 ở một số mặt. Ví dụ, các crRNA nhỏ của Cas12a phù hợp cho chỉnh sửa gen phức tạp, do số lượng crRNA sử dụng được lớn hơn snRNA của Cas9. Ngoài ra, đầu 5′ của Cas12a có thể được dùng cho việc lắp ghép DNA với độ chính xác cao hơn so với việc tái bản enzyme hạn chế thường dùng. Cuối cùng, Cas12a chẻ đôi DNA cách điểm PAM xuôi dòng 18–23 cặp base, nghĩa là không gây xáo trộn trình tự nhận diện sau khi chỉnh sửa, cho phép chẻ DNA nhiều lần. Ngược lại, Cas9 cắt 3 cặp base ngược dòng điểm PAM, dẫn đến đột biến thêm bớt làm phá hủy trình tự nhận diện, ngăn không cho cắt tiếp nữa. Về lý thuyết, những lần cắt DNA liên tiếp có thể tăng khả năng cho việc chỉnh sửa gen diễn ra như mong muốn.
Cas13 (trước là C2c2)
Năm 2016, nuclease Cas13a (trước gọi là C2c2) ở vi khuẩn Leptotrichia shahii được miêu tả. Cas13 là một endonuclease RNA do RNA dẫn đường, nghĩa là nó không nhắm vào DNA mà chỉ cắt RNA. Cas13 được dẫn đường bởi crRNA của nó tới mục tiêu ssRNA và bám vào rồi cắt mục tiêu. Một tính chất đặc trưng của Cas13 so với Cas9 là sau khi cắt, Cas13 vẫn bám vào mục tiêu rồi cắt những phân tử ssRNA khác. Tính chất này được gọi là "collateral cleavage" và đã được sử dụng để phát triển một số công nghệ chẩn đoán.
Sử dụng cho chỉnh sửa gene
Một phiên bản đơn giản của hệ CRISPR/Cas, gọi là CRISPR/Cas9, đã được áp dụng làm kỹ thuật chỉnh sửa bộ gene. Bằng cách đưa vào trong một tế bào phức hệ nuclease Cas9 với một RNA dẫn đường (gRNA) tổng hợp, có thể cắt bộ gene của tế bào tại những vị trí mong muốn, cho phép loại bỏ những gene hiện có và/hoặc thêm vào những đoạn DNA mới. Phức hệ Cas9-gRNA tương ứng với phức CAS III CRISPR-RNA trong hình vẽ minh họa bên cạnh.
thumb|phải|Minh họa cơ chế phòng thủ CRISPR chống lại virus ở sinh vật nhân sơ. đã được ban biên tập của tạp chí [[Science (tập san)|Science thuộc AAAS lựa chọn là đột phá khoa học của năm 2015. Đã nổi lên những đề cập về đạo đức trong sinh học liên quan đến sử dụng khả năng của CRISPR cho chỉnh sửa dòng mầm (germline) ở động vật và người.
Cấu trúc locus
Đoạn lặp và đoạn đệm
Một vị trí (locus) CRISPR được cấu tạo từ một trình tự dẫn đầu giàu AT, theo sau là những đoạn lặp (repeat) ngắn ngăn cách bởi các đoạn đệm (spacer) khác nhau. Đoạn lặp CRISPR thường có kích cỡ từ 28 đến 37 cặp base (bp), tuy nhiên có trường hợp chúng ít đến 23 bp và nhiều đến 55 bp. Một số có đối xứng dyad, dấu hiệu của cấu trúc bậc hai như thân-vòng ('kẹp tóc') thường thấy trong RNA, còn những loại khác thì không có cấu trúc cụ thể. Kích cỡ của các đoạn đệm trong những đoạn CRISPR khác nhau thường là 32–38 bp, dao động trong khoảng 21 đến 72 bp. Thông thường một đoạn CRISPR có ít hơn 50 đơn vị trình tự lặp-đệm.
Mặc dù hệ thống về cơ bản có vẻ đơn giản, nhưng các yếu tố khác nhau phải được phối hợp với độ chính xác cực cao để kéo cắt gene có thể hoạt động với độ chính xác như vậy. Vì lý do này, ngay cả sau 30 năm nghiên cứu, chức năng của CRISPR-Cas9 vẫn chưa được hiểu hoàn toàn.
Không giống như từ xuôi ngược, ví dụ ‘civic’ và ‘tenet’, mà có ý nghĩa, các đoạn xuôi ngược trong từ điển di truyền không được sử dụng để dịch mã thành các protein chức năng. Mặc dù vậy, chúng không phải hoàn toàn là không có ý nghĩa.
Phòng ngừa miễn dịch với danh sách ghi nhớ
Các tế bào vi khuẩn có thể sử dụng phức hệ CRISPR-Cas để bảo vệ chúng khỏi những lần xâm lăng về sau, vì CRISPR-Cas tạo cho hệ thống phòng thủ tiêm nhiễm của vi khuẩn một loại danh sách ghi nhớ: khi một thể thực khuẩn bám vào màng tế bào vi khuẩn và sau đó tiêm DNA của nó vào bên trong tế bào, phức hệ phòng thủ sẽ sao chép một đoạn ngắn những DNA ngoại lai này và gắn vào những đoạn trình tự CRISPR đã có trước đó trên DNA của vi khuẩn.
crRNA thành thục chứa một trình tự phiên mã của CRISPR và của DNA ngoại lai. Trình tự này cung cấp cho Cas9 trình tự nhận diện mà tại vị trí đó trên DNA mới xâm nhập sẽ bị cắt. crRNA bám vào tracrRNA, và chỉ cần hai phân tử này có thể cho Cas9 biết vị trí nó thực hiện cắt phân tử DNA.
Trình tự nhận diện khớp bổ sung với crRNA là chưa đủ để cho Cas9 có thể bám vào DNA sợi ngoại lai: nó cũng cần một "môtip nằm cạnh tiền vùng đệm" (‘proto-spacer adjacent motif’) hay viết tắt là PAM. Cas9 chỉ có thể bám vào sợi xoắn kép DNA nếu một trình tự PAM có ba nucleotide có chứa hai guanine và một base bất kỳ khác nằm cạnh trình tự nhận diện.
Hai sợi của DNA bị tháo xoắn và phân tử crRNA/tracrRN – hoặc RNA dẫn đường nhân tạo – có thể gắn kèm vào. Enzyme sau đó thực hiện cắt hai sợi DNA ở cùng một vị trí. Do vậy, để Cas9 có thể cắt DNA, cần phải có cả trình tự nhận diện và đoạn môtip PAM. Bởi vì bộ gene của vi khuẩn không có bất kỳ một đoạn PAM nào, nó được bảo vệ khỏi bị phá hủy bởi chính hệ miễn dịch của nó.