Tóm tắt

Lớp giáp xác, phân ngành của Arthropoda chiếm ưu thế trong môi trường nước, có tầm quan trọng lớn đối với hệ sinh thái và nghề cá. Ở đây chúng tôi báo cáo trình tự bộ gen của tôm thẻ chân trắng Litopenaeus vannamei, bao gồm ~1,66 Gb (khung N50 605,56 Kb) với 25.596 gen mã hóa protein và tỷ lệ lặp lại trình tự đơn giản cao (>23,93%). Sự mở rộng của các gen liên quan đến tầm nhìn và sự vận động có lẽ là trung tâm của sự thích nghi với sinh vật đáy. Sự lột xác thường xuyên của tôm có thể được giải thích bằng con đường tín hiệu ecdysone tăng cường thông qua mở rộng gen và chọn lọc tích cực. Là một sinh vật nuôi trồng thủy sản quan trọng, L. vannamei đã phải chịu áp lực chọn lọc cao trong quá trình lai tạo 30 năm qua và điều này đã có tác động đáng kể đến bộ gen. Giải mã bộ gen của L. vannamei không chỉ cung cấp cái nhìn sâu sắc về nền tảng di truyền của các quá trình sinh học cụ thể mà còn cung cấp thông tin có giá trị để tăng cường nuôi trồng thủy sản giáp xác.

1. Giới thiệu

Giáp xác là một nhóm động vật thủy sinh chiếm ưu thế và đa dạng, trong đó lớp giáp xác (bộ Decapoda) bao gồm các thành viên có ý nghĩa sinh thái chính trong môi trường sống biển và nước ngọt và bao gồm nhiều loài có giá trị kinh tế cao như tôm, cua, tôm hùm và tôm càng. Đặc biệt, họ tôm He (họ Penaeidae) đại diện cho nhóm quan trọng nhất trong đánh bắt và nuôi trồng thủy sản, do đó đã thu hút được nhiều sự quan tâm nghiên cứu.

Tôm He chủ yếu sống ở vùng biển nông ở vùng nhiệt đới và cận nhiệt đới. Vòng đời thường liên quan đến việc di cư giữa vùng biển xa bờ và gần bờ. Sau khi sinh sản, ấu trùng tôm phù du ở vùng biển xa bờ phát triển thành tôm post di chuyển vào vùng biển gần bờ và trở thành sinh vật đáy. Do đó, tôm phải thích nghi với các môi trường khác nhau trong vòng đời của chúng nhưng các cơ chế sinh học cơ bản hiếm khi được khám phá. Tương tự như tất cả các loài động vật chân đốt, tôm He thể hiện sự tăng trưởng không liên tục thông qua quá trình lột xác gián đoạn. Khác với hầu hết các loài côn trùng, khi mà quá trình lột xác thường xảy ra ở giai đoạn ấu trùng để phát triển và biến thái, quá trình lột xác diễn ra trong suốt vòng đời của động vật giáp xác. Ví dụ, tôm He trải qua khoảng 50 lần lột xác trong suốt cuộc đời, nhiều hơn nhiều so với các loài động vật chân đốt khác. Như vậy, tôm có thể là một mô hình lý tưởng để nghiên cứu quá trình lột xác. Tuy nhiên, các cơ chế chi tiết của quy định lột xác vẫn chưa được hiểu rõ.

Với sản lượng đánh bắt hàng năm ~1,3 triệu tấn, tôm He chiếm phần lớn sản lượng đánh bắt tôm toàn cầu. Nuôi tôm bắt đầu từ những năm 1970 và là một trong những ngành phát triển nhanh nhất trong ngành nuôi trồng thủy sản và đang mở rộng nhanh chóng. Sản lượng nuôi tôm He đạt >5 triệu tấn, trị giá trên 32 tỷ USD năm 2016. Tôm thẻ chân trắng Litopenaeus vannamei là loài tôm nuôi quan trọng nhất trên toàn thế giới, chiếm ~80% tổng sản lượng tôm He nuôi. Trong khi phạm vi bản địa là ở Đông Thái Bình Dương, L. vannamei hiện được nuôi rộng rãi ở Trung và Nam Mỹ và châu Á, đặc biệt là ở Trung Quốc, Indonesia, Thái Lan và Việt Nam, với một số dòng giống có sẵn. Những dòng này hầu hết được tạo ra thông qua các quy trình nhân giống chọn lọc truyền thống và thông tin về bộ gen sẽ cực kỳ hữu ích cho thao tác di truyền trong tương lai. Ngay từ năm 1997, trong một hội thảo quốc tế về lập bản đồ gen động vật nuôi trồng thủy sản, tôm He được xác định là 1 trong 5 sinh vật mục tiêu để xác định trình tự bộ gen, cùng với cá hồi, cá da trơn, cá rô phi và hàu. Cho đến nay, bộ gen của 4 loài sau đã được công bố trong thập kỷ qua, bất chấp nỗ lực của một số nhóm nghiên cứu lớn nhưng không có bộ gen hoàn chỉnh nào của tôm được báo cáo. Đối với các loài giáp xác khác, bộ gen chất lượng cao chỉ có ở bọ chét nước Daphnia pulex, amphipod Parhyale hawaiensis và tôm càng cẩm thạch Procambarus virginalis.

Ở đây chúng tôi trình bày một tập hợp bộ gen tham chiếu de novo chất lượng cao cho L. vannamei, với tỷ lệ lặp lại trình tự đơn giản (SSR) cực kỳ cao, đây là trở ngại lớn đối với việc sắp xếp và lắp ráp trình tự bộ gen. Một đặc điểm nổi bật của bộ gen là sự mở rộng của một loạt gen liên quan đến hệ thống thị giác, dẫn truyền tín hiệu thần kinh và vận động, dường như trang bị tốt hơn cho tôm để thích nghi với môi trường sống đáy. Bộ gen cũng làm sáng tỏ quy định về quá trình lột xác thường xuyên thông qua đường dẫn tín hiệu ecdysone tăng cường, với sự kiểm soát chính xác của hormone và các yếu tố môi trường. Hơn nữa, các phân tích bộ gen cho thấy rằng nhân giống chọn lọc đã tác động đáng kể đến bộ gen của tôm bố mẹ L. vannamei và các nguồn gen thu được từ nghiên cứu này sẽ hữu ích cho việc cải thiện gen trong nuôi tôm.

2. Vật liệu và phương pháp

2.1. Trình tự bộ gen

Cơ của một con đực trưởng thành L. vannamei (giống Kehai No.1, Hải Nam, Trung Quốc) đã được sử dụng để chiết xuất DNA và giải trình tự bộ gen. DNA bộ gen đã được chuẩn bị bằng cách sử dụng kit DNA động vật biển TIANamp (TIANGEN, Bắc Kinh, Trung Quốc). DNA đã được cắt bằng cách sử dụng thiết bị siêu âm để xây dựng dữ liệu ghép nối (PE). Các dữ liệu có kích thước phần chèn nằm trong khoảng từ 200 bp đến 20 Kb được xây dựng theo hướng dẫn được cung cấp trong bộ chuẩn bị dữ liệu Illumina. Tất cả các dữ liệu đã được giải trình tự trên nền tảng HiSeq 2000 và HiSeq 2500 (Illumina, San Diego, USA). Những lần đọc thô này sau đó đã được cắt bớt để đảm bảo chất lượng bằng Trimmomatic v.0.35 (http://www.usadellab.org/cms/index.php?page=trimmomatic). Bộ điều hợp trình tự Illumina đã bị xóa, các cơ sở chất lượng thấp từ đầu hoặc cuối của lần đọc thô đã bị cắt bớt và các lần đọc được quét bằng cửa sổ trượt 4 bp và được cắt bớt khi chất lượng trung bình trên mỗi cơ sở giảm xuống dưới 15. Các lần đọc sạch thu được từ quá trình này đã được sử dụng cho phân tích tiếp theo.

Để xây dựng dữ liệu PacBio, DNA bộ gen của L. vannamei đã được cắt thành ~20 Kb và các đoạn dưới 7 Kb được lọc bằng BluePippin. Các đoạn DNA được lọc sau đó được chuyển đổi thành dữ liệu SMRTbell độc quyền bằng cách sử dụng kit chuẩn bị mẫu DNA PacBio. Tổng cộng ~133 Gb dữ liệu được lọc chất lượng đã được lấy từ trình tự PacBio.

2.2. Ước tính kích thước bộ gen

Chúng tôi đã điều chỉnh một phương pháp có tên Jellyfish, dựa trên phân phối k-mer, để ước tính kích thước bộ gen với các lần đọc chất lượng cao từ các dữ liệu kích thước chèn ngắn (500 bp). Chúng tôi đã thu được phân phối độ sâu k-mer từ phân tích Jellyfish và có thể quan sát rõ ràng độ sâu cực đại từ dữ liệu phân phối. Để có được ước tính về kích thước bộ gen của L. vannamei, công thức sau đã được áp dụng: kích thước bộ gen = total_kmer_num/kmer_depth, trong đó total_kmer_num là tổng số k-mer từ tất cả các lần đọc và kmer_depth là độ sâu cực đại.

2.3. Bộ gen

Tất cả các lượt đọc nhỏ từ trình tự PacBio đã được lắp ráp bằng phần mềm WTDBG (https://github.com/ruanjue/wtdbg-1.2.8). Trình tự được lắp ráp sau đó được đánh bóng bằng Quiver (Phân tích SMRT v2.3.0) với các tham số mặc định. Để đảm bảo độ chính xác cao của quá trình lắp ráp bộ gen, một số vòng sửa lỗi lặp lại đã được thực hiện bằng cách sử dụng các lần đọc sạch của Illumina.

Cuối cùng, việc lắp ráp các trình tự đọc PacBio được thực hiện bằng cách sử dụng các lần đọc dài liên tục sau WTDBG. Các lần đọc kết thúc được ghép nối của Illumina (thư viện 200, 300 và 500 bp) đã được ánh xạ để đánh bóng trình tự lắp ráp từ Quiver của BWA (https://github.com/PacificBioscatics/GenomicConsensus). SNP cũng như các lần chèn và xóa nhỏ (INDEL) đã được gọi và sửa bởi SAMTools và một tập lệnh nội bộ (“SNP_correction.pl”, được gửi vào https://github.com/jianbone/L_vannamei_genome). Cuối cùng, chúng tôi đã tạo khung và thực hiện lấp đầy khoảng trống bằng SSPACE 3.0 với các giá trị tham số là “-x 1 -m 50 -o 10 -z 200 -p 1” bằng cách sử dụng dữ liệu giải trình tự được ghép nối meta (dữ liệu Illumina 5, 10 và 20 Kb).

2.4. Đánh giá chất lượng lắp ráp bộ gen

Để đánh giá chất lượng của bộ gen, chúng tôi đã ánh xạ các lần đọc một phần từ thư viện kích thước chèn ngắn trở lại khung bằng Bowtie2 với các tham số sau: –rdg 3,1 –rfg 3,1 –gbar 2 57. Tổng cộng 93% số lần đọc có thể được ánh xạ trở lại cụm hiện tại. Để đánh giá mức độ hoàn chỉnh của quá trình lắp ráp bộ gen ở các vùng di truyền, chúng tôi đã sử dụng các gen cốt lõi được bảo tồn bằng cách chạy phần mềm CEGMA trên quá trình lắp ráp bộ gen L. vannamei.

2.5. Lặp lại chú thích

Cả RepeatModeler và RepeatMasker đều được sử dụng để thực hiện nhận dạng mới và mặt nạ lặp lại. Để đảm bảo tính toàn vẹn của gen trong phân tích tiếp theo, độ phức tạp thấp hoặc lặp lại đơn giản không bị che khuất trong phân tích này, vì một số trong số chúng có thể được tìm thấy trong gen.

2.6. Trình tự và phân tích phiên mã

Các mẫu L. vannamei ở các giai đoạn phát triển khác nhau, giai đoạn lột xác và các mô trưởng thành khác nhau đã được thu thập tại Phòng thí nghiệm sinh học biển thực nghiệm trọng điểm CAS ở Thanh Đảo. Tổng RNA được phân lập và tinh chế từ tất cả các mẫu bằng thuốc thử chiết TRIzol (Thermo Fisher Khoa học, Hoa Kỳ), theo hướng dẫn của nhà sản xuất. Chất lượng và nồng độ RNA được đánh giá bằng cách sử dụng điện di trên gel agarose 1% và nồng độ RNA được đo bằng máy đo quang phổ Nanodrop 2000 (Thermo Fisher Khoa học, Hoa Kỳ). Tổng số RNA của cùng một mô được gộp lại để xây dựng các dữ liệu trình tự Illumina, sau đó các trình tự đầu cuối được ghép nối được tạo ra bằng cách sử dụng nền tảng Illumina HiSeq 2000 và HiSeq 2500. Các lần đọc sạch được lắp ráp bằng Trinity (v2.6.5, https://github.com/trinityrnaseq/trinityrnaseq/releases) để lấy bản ghi với min_kmer_cov được đặt thành 2 và tất cả các tham số khác được đặt thành mặc định. Gói TopHat v1.2.1 được sử dụng để ánh xạ các lần đọc phiên mã tới bộ gen L. vannamei. Cufflinks v2.2.1 (http://cole-trapnell-lab.github.io/cufflinks/) đã được sử dụng để tính toán FPKM dự kiến ​​(Số mảnh trên mỗi Kilobase của bản ghi trên một triệu mảnh được ánh xạ) làm giá trị biểu thức cho mỗi bản ghi.

2.7. Dự đoán và chú thích gen

Xác định vùng mã hóa protein và dự đoán gen được thực hiện thông qua sự kết hợp của dự đoán dựa trên tương đồng, dự đoán de novo và phương pháp dự đoán dựa trên phiên mã. Protein từ một số loài, bao gồm D. pulex, P. hawaiensis, Drosophila melanogaster, Anopheles gambiae, Locust migratoriaBombyx mori, đã được tải xuống từ NCBI. Trình tự protein được lập bản đồ dựa trên L. vannamei với Exonerate phiên bản 2.2.0 (http://www.ebi.ac.uk/~guy/exonerate/). Các blast hits được sử dụng để dự đoán cấu trúc gen của các vùng gen tương ứng. Phần mềm dự đoán de novo, Augustus v2.5.5, được sử dụng để dự đoán các vùng mã hóa trong bộ gen được che dấu lặp lại. Dữ liệu RNA-Seq được ánh xạ dựa trên tổ hợp bằng cách sử dụng Tophat v2.1.1. Cufflinks v2.2.1 sau đó được sử dụng để chuyển đổi bản phiên mã từ kết quả của Tophat sang mô hình gen. Tất cả các mô hình gen thu được từ ba phương pháp này đã được EvidenceModeler (EVM) tích hợp vào một bộ gen không dư thừa.

Các chú thích chức năng của bộ gen thu được đã được thực hiện bằng BLASTP với giá trị E là 1e−5 so với cơ sở dữ liệu NCBI-NR, SwissProt và cơ sở dữ liệu KEGG. Các miền protein được chú thích bằng cách ánh xạ tới cơ sở dữ liệu InterPro và Pfam bằng InterProScan và HMMER. Các con đường mà các gen có thể tham gia được bắt nguồn từ việc lập bản đồ gen đối với cơ sở dữ liệu KEGG. Các thuật ngữ Gene Onology (GO) được trích xuất từ ​​các kết quả InterProscan hoặc Pfam tương ứng.

2.8. Dự đoán RNA không mã hóa

Các gen ARN không mã hóa đã được dự đoán cho bộ gen được che dấu lặp lại bằng cách sắp xếp dựa trên trình tự và cấu trúc với cơ sở dữ liệu ARN không mã hóa Rfam (http://xfam.org/), với ngưỡng giá trị E là 1e −02 bằng Infernal (http://eddylab.org/infernal/). Cụ thể, tiêu chí biểu hiện đã được áp dụng để nhận dạng miRNA và dữ liệu giải trình tự RNA nhỏ của L. vannamei đã được tải xuống từ cơ sở dữ liệu SRA của NCBI (SRX2648655, SRX2648646 và SRX682234). Trình tự bộ điều hợp và mồi đã được cắt bớt và trình tự chất lượng thấp đã bị xóa. Các lần đọc sRNA sạch được so sánh với cơ sở dữ liệu Rfam (http://xfam.org/) để loại trừ các RNA không mã hóa ngoài miRNA. Các lần đọc sRNA còn lại được xác định bằng miRNA bằng cách ánh xạ tới các cấu trúc tiền miRNA được dự đoán trong bộ gen của L. vannamei bằng cách sử dụng miRDeep2 và miReap (http://sourceforge.net/projects/mireap/). Các miRNA được bảo tồn được xác định bằng cách căn chỉnh BLAST thành các chuỗi miRNA trưởng thành được gửi trong miRBase (http://mirbase.org/), yêu cầu căn chỉnh ≥15 nt bao phủ vùng hạt miRNA (vị trí 2−8 nt) và sự không khớp tổng thể ≤2.

2.9. Phân tích họ gen

Phân tích họ gen được thực hiện bằng OrthoMCL. Các gen mã hóa protein của L.vannamei và chín loài động vật chân đốt khác (tải xuống từ NCBI: www.ncbi.nlm.nih.gov), bao gồm Strigamia maritima, Ixodes scapularis, Tetranychus urticae, P. hawaiensis, D. pulex, Acyrthosiphon pisum, L. migratoria, B. mori,D. melanogaster, được liên kết với nhau bằng chương trình BLASTP. Thông tin tương tự từ sự sắp xếp trình tự theo cặp đã được sử dụng làm tham số khoảng cách để phân cụm họ gen. Các gen đặc trưng cho loài (những gen không có điểm tương đồng ở các loài khác) được sử dụng trong phân tích này. Gen đặc hiệu là một nhóm gen được xác định từ các gen đặc trưng cho loài không có gen tương đồng với bất kỳ gen nào từ cơ sở dữ liệu NCBI Nr. Tuy nhiên, những gen đặc hiệu này được hỗ trợ bởi dữ liệu phiên mã.

2.10. Xây dựng cây phát sinh loài

Cây phát sinh loài được xây dựng bằng cách sử dụng các gen tương đồng một bản sao từ D. pulex, P. hawaiensis, D. melanogaster, A. gambiae, L. migratoria, B. mori, Tribolium castaneum, Apis mellifera , Zootermopsis nevadensis, P. humanus, A. pisum, I. scapularis, T. urticae S. maritima, với phần mềm RAxML dựa trên phương pháp xác suất tối đa. Tóm lại, các gen tương đồng từ bộ gen của các loài này được nhóm lại với nhau bằng phần mềm OrthoMCL. Sau đó, mỗi cụm trong số này được lọc để thu được tổng cộng 88 chỉnh hình một bản sao bằng cách sử dụng tập lệnh Python nội bộ của chúng tôi (find_multiple_snp.py). MUSCLE (http://www.drive5.com/muscle) đã được sử dụng để căn chỉnh trình tự, ở cài đặt mặc định. Các vị trí có khoảng trống và dữ liệu bị thiếu đã được cắt bớt bằng cách sử dụng tập lệnh Python nội bộ (allfasta2snp.py). Bộ dữ liệu cuối cùng chứa 19.161 axit amin và được sử dụng để xây dựng cây phát sinh gen với RAxML 66 theo mô hình dựa trên ma trận JTT. Các cây ban đầu cho tìm kiếm kinh nghiệm được thu thập tự động bằng cách áp dụng các thuật toán BioNJ và neighbor-joining cho một ma trận khoảng cách theo cặp được ước tính bằng mô hình JTT. Cây tốt nhất có khả năng ghi log là −3308,02 và được sử dụng làm cây đầu vào để ước tính thời gian phân kỳ bằng các phương pháp tiếp cận đồng hồ phân tử thoải mái Bayes được triển khai trong MCMCTREE từ gói PAML. CODEML từ gói PAML đã được triển khai để ước tính tỷ lệ thay thế trung tính mỗi năm giữa các loài. MCMCTREE sau đó đã được sử dụng để tính toán vectơ gradient (g) và ma trận Hessian (H). Hiệu chỉnh hóa thạch đã được sử dụng làm tiền đề cho ước tính thời gian phân kỳ. Phân phối Cauchy được sử dụng với các tham số mặc định “p = 0,1, c  = 1”. MCMCTREE đang chạy hai lần, mỗi lần trong 1.000.000 thế hệ với tần số mẫu là 50 và giai đoạn đốt cháy là 50.000 lần lặp. Tracer (http://beast.bio.ed.ac.uk/) đã được sử dụng để đánh giá sự tập hợp của chuỗi và kích thước mẫu hiệu quả đầy đủ của tất cả các tham số. Cây hiệu chỉnh thời gian kết quả được hiển thị bằng cách sử dụng MEGA7.

2.11. Lựa chọn tích cực

Để đánh giá sự đóng góp của chọn lọc tự nhiên vào các chỉnh hình một bản sao trong bộ gen của L. vannamei, các tỷ lệ (ω) của sự thay thế không đồng nghĩa trên mỗi vị trí không đồng nghĩa (dN) so với sự thay thế đồng nghĩa trên mỗi vị trí đồng nghĩa (dS) đã được tính toán bằng cách sử dụng gói phần mềm PAML v4.48a68. Các tương đồng được căn chỉnh bằng MUSCLE. Mô hình chi nhánh được sử dụng để phát hiện lựa chọn tích cực dọc theo nhánh phía trước. Các thử nghiệm tỷ lệ khả năng xảy ra đã được áp dụng để kiểm tra sự khác biệt đáng kể giữa các mô hình thay thế và mô hình không.

2.12. Quy định tổng hợp ecdysone qua trung gian MIH

Để kiểm tra mức độ cholesterol và quang kỳ điều chỉnh quá trình lột xác thông qua MIH như thế nào, chúng tôi đã tiến hành thí nghiệm RNAi gen SREBP, RNAi gen MIH, RNAi gen opsin, tiêm Lipitor và tiêm cholesterol, sử dụng dsEGFP RNAi và tiêm dung dịch muối đệm cồn/phốt phát (PBS) như nghiệm thức đối chứng âm tính. Thí nghiệm sử dụng tôm khỏe mạnh có chiều dài thân 9,55 ± 0,25 cm và trọng lượng cơ thể 11,20 ± 1,36 g được nuôi thuần dưỡng trong bể sợi thủy tinh có sục khí nước biển tuần hoàn 2 ngày trước khi thí nghiệm.

Để tổng hợp dsRNA cho thí nghiệm RNAi, các mẫu DNA được khuếch đại từ mẫu cDNA của mắt. Cặp mồi dsEGFP-F và dsEGFP-R (Bảng bổ sung 25), được sử dụng để khuếch đại đoạn DNA 289 bp của gen EGFP từ plasmid pEGFP-N1. dsRNA của SREBP chứa một đoạn 754 bp nằm ở đầu 3′ của vùng mã hóa và dsRNA của MIH1036-6 chứa một đoạn 377 bp bao phủ toàn bộ vùng mã hóa, được khuếch đại bằng phương pháp tương tự với các đoạn mồi trong Bảng bổ sung 25. dsRNA của gen opsin LW (LW-1) được khuếch đại bằng cách sử dụng hai cặp mồi được thiết kế bằng cách sử dụng các vùng được bảo tồn của gen (Bảng bổ trợ 26). Sản phẩm PCR (~500 bp) được tạo ra bằng cách sử dụng neo khởi động T7 được gắn vào hai đoạn mồi được sử dụng để khuếch đại sản phẩm. Sản phẩm PCR được tinh sạch bằng Gel Extraction Kit (OMEGA, Nhật Bản). dsRNA được tổng hợp với kit phiên mã năng suất cao TranscriptAid T7 (Thermo Fisher Khoa học, Hoa Kỳ), theo hướng dẫn của nhà sản xuất.

Chúng tôi đã tối ưu hóa liều làm im lặng hiệu quả của từng dsRNA bằng cách tiêm ba liều lượng khác nhau, cụ thể là 1, 2 và 4 μg, của dsMIH1036-6 hoặc dsSREBP hoặc dsLW-1 hoặc dsEGFP (dưới dạng đối chứng) vào tôm khỏe mạnh ở giai đoạn giữa chu kì lột xác (C). 5 con đã được thử nghiệm cho từng liều lượng của dsMIH1036-6 và dsSREBP, trong khi mỗi liều lượng của dsLW-1 được thử nghiệm trên 3 cá thể. Vào 48 giờ sau khi tiêm dsRNA, các cuống mắt của tôm trong mỗi nhóm được thu thập để chiết xuất RNA. Mức độ biểu hiện của từng gen được xác định bởi qPCR. Các đoạn mồi được sử dụng cho qPCR được liệt kê trong Bảng bổ sung 25 và 26. Đoạn mồi 18S-qF và 18S-qR được sử dụng để phát hiện sự biểu hiện của gen tham chiếu nội bộ 18S rRNA. Tính đặc hiệu của sản phẩm qPCR được xác thực bằng phân tích đường cong nóng chảy được thực hiện ở cuối mỗi phản ứng qPCR. Liều vô hiệu hóa tối ưu đã được sử dụng trong các thí nghiệm tiếp theo.

Để kiểm tra tác động của SREBP đối với biểu hiện MIH, 20 cá thể ở giai đoạn postmolt (P) được chia thành hai nhóm. Trong nhóm thử nghiệm, mỗi con được tiêm 1 µg dsSREBP, trong khi các con trong nhóm đối chứng được tiêm 1 µg dsEGFP. Để kiểm tra ảnh hưởng của mức cholesterol cao đối với biểu hiện MIH, 20 cá thể ở giai đoạn postmolt (P) được chia thành hai nhóm. Mỗi cá thể trong nhóm thử nghiệm được tiêm 400 μg cholesterol hòa tan trong cồn 100%. Những con trong nhóm đối chứng cũng được tiêm cùng một lượng rượu như vậy. Đối với cả hai thí nghiệm, cuống mắt của tất cả tôm trong mỗi nhóm được thu thập sau 48 giờ sau khi tiêm và RNA tổng số được chiết xuất từ ​​các mẫu khác nhau bằng thuốc thử RNAiso Plus (TaKaRa, Nhật Bản). Mức độ biểu hiện của ba gen MIH được ước tính bằng qPCR, như được mô tả ở trên.

Để kiểm tra tác động của opsin đối với biểu hiện MIH, tôm ở cùng giai đoạn lột xác (D0-D1) được chia thành sáu nhóm: ba nhóm dsLW-1 (n =20) và ba nhóm tiêm dsEGFP (n  = 20) làm đối chứng. Nồng độ của dsRNA là 1 µg cho tất cả các nhóm. Chúng tôi đã kiểm tra sự lột xác 3 lần/ngày sau RNAi (lúc 08:00, 14:00 và 20:00). Sau khi vô hiệu hóa trong 48, 72 và 96 giờ, 3 con tôm từ mỗi nhóm đã được chọn để xác định sự biểu hiện của MIH và ba gen opsin LW bằng phân tích qPCR.

Trong thí nghiệm opsin RNAi đã nói ở trên, chúng tôi đã kiểm tra sự xuất hiện của quá trình lột xác 3 lần/ ngày (lúc 08:00, 14:00 và 20:00). Vào 9 ngày sau khi vô hiệu hóa, chúng tôi đã tiêm mũi thứ hai để đảm bảo tác dụng của việc vô hiệu hóa. Việc quan sát kéo dài trong 18 ngày.

Kiểm tra ảnh hưởng của vô hiệu hóa MIH khi lột xác, 20 cá thể ở giai đoạn giữa chu kì lột xác (C) được chia thành hai nhóm. Mỗi cá thể trong nhóm thử nghiệm được tiêm 4 μg MIH1036-6 dsRNA và mỗi cá thể trong nhóm đối chứng được tiêm 4 μg EGFP dsRNA. Đuôi của tất cả các cá thể trong các nhóm khác nhau được mổ xẻ để quan sát giai đoạn lột xác dưới kính hiển vi vào 48 giờ sau khi tiêm dsRNA. Để kiểm tra tác động của mức cholesterol thấp đối với quá trình lột xác, 20 cá thể ở giai đoạn tiền thay lông sớm (D0–D2) được chia thành hai nhóm. Mỗi cá thể trong nhóm thử nghiệm được tiêm 5 μg atorvastatin canxi (Lipitor) được hòa tan trước trong 20 μl PBS (với 2,50% DMSO) và mỗi con tôm trong nhóm đối chứng được tiêm 20 μl PBS (với 2,50% DMSO).

2.13. Xác định lại thứ tự và SNP

Tổng cộng có 22 cá thể tôm được chọn để sắp xếp lại bộ gen. Những cá thể này bao gồm tám cá thể hoang dã được thu thập từ Baja California Sur, Mexico, 6 cá thể nuôi được chọn cho bốn thế hệ ở Ecuador và 8 cá thể từ bốn dòng nhân giống thương mại ở Trung Quốc, Hoa Kỳ và Thái Lan (Bảng bổ sung 20), tất cả đều đã được  xử lý chọn lọc nhân giống trên 20 thế hệ. Các lần đọc thô được ánh xạ tới bộ gen tham chiếu bằng BWA v0.7.12. Các lần lặp lại PCR của từng mẫu đã được loại bỏ bằng Picard Mark Duplicates. Các lần đọc xung quanh INDEL từ căn chỉnh BWA đã được sắp xếp lại bằng cách sử dụng tùy chọn IndelRealiger trong Bộ công cụ phân tích bộ gen (GATK). HaplotypeCaller của Bộ công cụ phân tích bộ gen GATK đã được sử dụng để xây dựng tệp gọi biến thể chung (gVCF) cho mọi cá thể. Các tệp gVCF riêng lẻ được kết hợp bởi chức năng GenotypeGVCF để tạo thành một tệp gọi biến thể duy nhất, bao gồm tất cả các vị trí. Quá trình lọc nghiêm ngặt các liên kết SNP được thực hiện bằng cách sử dụng các nguyên tắc do Viện Broad đưa ra bằng cách sử dụng các tùy chọn: “FS > 60.0 || MQ < 40,0 || QĐ < 2,0 || SOR > 3.0”. SNP có tần số alen nhỏ (MAF) dưới 5% đã bị loại bỏ. Tỉ lệ thiếu kiểu gen của quần thể là 10%.

2.14. Xác định các gen ứng cử viên trong chọn giống

Cây phát sinh gen của 22 cá thể được xây dựng bằng cách sử dụng SNP được lọc bởi phần mềm SPhylo (tham số: -l 0,6, -m 0,05). Để xác định các vùng gen bị ảnh hưởng đáng kể bởi quá trình nhân giống nhân tạo, chúng tôi đã tính toán sự đa dạng nucleotide theo cặp (πhoang dã / πnhân giống) và chỉ số phân kỳ (FST) giữa quần thể hoang dã và quần thể nuôi cấy bằng cách sử dụng phương pháp sliding-window (chuỗi 100 Kb với gia số 20 Kb) sử dụng VCFtools (http://vcftools.sourceforge.net/). Các vùng gen có 1% giá trị cấp xếp hạng cao nhất cho phần trăm thực nghiệm được phát hiện bởi cả hai phương pháp được xác định là quét chọn lọc tiềm năng. Việc làm giàu gen GO và KEGG từ các lần quét chọn lọc đã được thực hiện bằng KOBAS (http://kobas.cbi.pku.edu.cn/).

2.15. Mã sẵn có

Bạn có thể xem và tải xuống miễn phí các tập lệnh Perl và Python được liên kết tại kho lưu trữ github: https://github.com/jianbone/L_vannamei_genome. Các phần mềm được sử dụng để phân tích dữ liệu bao gồm: Trimmomatic v.0.35, BluePippin v6.31, Jellyfish-0.3, wtdbg-1.2.8, SMRT Analysis v2.3.0, BWA v0.7.12, SSPACE 3.0, Bowtie 2.3.4.3, CEGMA v3, RepeatModeler Open-1.0, RepeatMasker 4.0.5, Trinity v2.6.5, TopHat v1.2.1, Cufflinks v2.2.1, Exonerate v2.2.0, Augustus v2.5.5, Tophat v2.1.1, EvidenceModeler (EVM) r03062010, InterProScan 5, HMMER -3.0a1, miRDeep2, OrthoMCL v1.4, RAxML Workbench 1.0, MUSCLE 3.8.31, PAML v4.48a, MEGA7, Bộ công cụ phân tích bộ gen (GATK) 3.6, SNPeff LGPLv3, VCFtools 1.0.0.0, KOBAS 3.0.

Theo Xiaojun Zhang, Jianbo Yuan, Yamin Sun, Shihao Li, Yi Gao, Yang Yu, Chengzhang Liu, Quanchao Wang, Xinjia Lv, Xiaoxi Zhang, Ka Yan Ma, Xiaobo Wang, Wenchao Lin, Long Wang, Xueli Zhu, Chengsong Zhang, Jiquan Zhang, Songjun Jin, Kuijie Yu, Jie Kong, Peng Xu, Jack Chen, Hongbin Zhang, Patrick Sorgeloos, …Jianhai Xiang

Nguồn: https://www.nature.com/articles/s41467-018-08197-4

Biên dịch: Nguyễn Thị Quyên – Tôm Giống Gia Hóa Bình Minh

TÔM GIỐNG GIA HÓA- CHÌA KHÓA THÀNH CÔNG 

Xem thêm:

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

You cannot copy content of this page