Trong nghiên cứu này khảo sát pan-genome của chủng Edwardsiella để tìm sự khác biệt về hệ gene, tái định danh loài ở mức độ phát sinh bộ gene (phylogenomics). Kết quả phân tích pan-genome cho thấy, giống Edwardsiella được phân tách thành các kiểu loài trong quần thể và có thể giúp định danh lại loài với độ chính xác cao. Mời các bạn cùng tham khảo!
PHÂN TÍCH PAN-GENOME CỦA CÁC CHỦNG VI KHUẨN EDWARDSIELLA HƢỚNG TỚI PHÁT TRIỂN CÁC PHƢƠNG PHÁP KIỂM SOÁT BỆNH THỦY SẢN Nguyễn Thành Luân1,*, Phạm Thị Hải Hà2,** Viện Khoa học Ứng dụng HUTECH, Đại học Công nghệ Tp Hồ Chí Minh Khoa Cơng nghệ Sinh học Công nghệ Môi trường, Đại học Nguyễn Tất Thành Email: *nt.luan@hutech.edu.vn **pthha@ntt.edu.vn TÓM TẮT Các bệnh thủy sản gậy gia tăng mức chủng vi khuẩn gây bệnh đặt thách thức lớn cho việc phát triển biện pháp kiểm soát sinh học bền vững biện pháp sử dụng kháng sinh thích hợp chiến lược sản xuất vaccine Dựa vào tiến cơng nghệ giải trình tự gene vi khuẩn mở cách mạng hóa việc phân tích pan-genome vi khuẩn gây bệnh ảnh hưởng đến việc quản lý dịch bệnh trang trại nuôi trồng thủy sản Trong nghiên cứu này, khảo sát pan-genome chủng Edwardsiella để tìm khác biệt hệ gene, tái định danh loài mức độ phát sinh gene (phylogenomics) Kết phân tích pan-genome cho thấy, giống Edwardsiella phân tách thành kiểu loài quần thể giúp định danh lại lồi với độ xác cao Chúng tơi xác nhận E tarda EIB202, FL6_60, ET-1 thuộc nhóm E piscicida Dựa vào phân tích sâu hàm lượng/chức gene khác biệt hệ gene Edwardsiella, thơng tin gene có tính phân biệt cao sử dụng thực pan-PCR định danh phân tử chủng gây bệnh từ mẫu lâm sàng Ngoài ra, phương pháp phân tích pangenome dùng để khám phá gene chia sẻ để tìm hiểu khả thích nghi dùng phát triển loại vaccine tiềm nhằm cải thiện hiệu ngăn chặn dịch bệnh thủy sản thực kết hợp với phân tích pan-genome Từ khóa: Edwarsiella; phylogenomics; pan-genome; định danh phân tử; vaccine ĐẶT VẦN ĐỀ Sự gia tăng nhanh chóng nhiều trình tự gen tác nhân vi sinh gây bệnh thủy sinh cho phép xây dựng nhanh quy trình kiểm sốt lây nhiễm, hướng tiềm để nghiên cứu cải thiện hiệu loại vaccine trồng thủy sản ngăn chặn dịch bệnh thực phân tích gene Edwardsiellosis biết đến bệnh truyền nhiễm mãn tính, gây chết hàng loạt nhiều lồi cá có giá trị kinh tế cao [4] Ba lồi gây bệnh bao gồm E hoshinae, E ictaluri E tarda mô tả tốt mối liên hệ với vật chủ khác nhau, bao gồm chim bò sát, cá trê kênh nuôi cá rô phi nuôi [1] Ngồi ra, ổ sinh thái bao gồm hồ, sông, nước biển ruột động vật thủy sinh khỏe mạnh [2, 3] Một mầm bệnh gây dịch bệnh truyền nhiễm cho loài cá ni tồn cầu E piscicida, chủng trước xác định nhầm E tarda [3, 4] chúng có chung nhiều đặc điểm kiểu hình [5, 6] Sự phân loại E tarda dựa kết phân tích phát sinh lồi từ gene cho thấy chúng 1049 nhóm khác biệt mặt di truyền [3, 4] phân tích phát sinh loài từ gene bao gồm gene trung tâm pan-genomics Trong nghiên cứu này, pan-genome Edwardsiella từ nguồn khác phân tích so sánh để chứng minh việc pan-genome ông cụ cần thiết để phân loại loài thuộc chi Edwardsiella Ngoài ra, phương pháp dùng để khám phá gene chia sẻ loài để hiểu khả thích nghi tính đặc thù lồi, dung để phát triển phương pháp phát nhanh loài gây bệnh VẬT LIỆU VÀ PHƢƠNG PHÁP 2.1 Chọn lọc liệu Trong nghiên cứu này, tổng cộng có 15 gene hồn chỉnh chủng Edwardsiella phân lập từ hệ sinh thái khác thu thập từ ngân hàng gene vi khuẩn NCBI (ftp://ftp.ncbi.nih.gov/genomes/) Việc chọn gene hoàn chỉnh để so sánh giúp hạn chế ảnh hưởng tới kết 2.2 Định danh phân tích phát sinh lồi Sự phát sinh lồi dựa tồn thơng tin gene (phylogenomic) chủng Edwardsiella thiết lập dựa phân tích giá trị nucleotide trung bình (ANI) phần mềm JSpecies v1.2.1 [7] hiển thị dạng đồ nhiệt phần mềm Gene-e (http://www.broadinstitute.org/cancer/software/GENE-E/) 2.3 Phân tích pan-genome Pan-genome 15 chủng Edwardsiella phân tích phần mềm EDGAR v2.2 [8] Các nhóm gene, bao gồm số lượng gene thuộc core gene, accessory gene, singleton gene, trích xuất theo thông số mặc định Các chức gene, nhóm gene pan-genome phân loại dựa vào sở liệu NCBI Clusters of Orthologous Group (COG), thực phân tích PSI-BLAST tích hợp sẵn máy chủ phân tích WebMGA với thơng số mặc định [9] Để tìm khác biệt việc sử dụng gene làm thị phân tích mẫu lâm sàn, accessory gene phân tích lại phần mềm Gene-E KẾT QUẢ VÀ THẢO LUẬN 3.1 Các thành phần Pan-genome Edwarsiella Trong thành phần pan-genome 15 chủng Edwardsiella có 6733 gen mã hóa protein, 29,07% số (1957) gene trung tâm (core gene) 70,93% lại gene phân tán (assessor gene) gen đơn lẻ (singleton gene) chi Edwardsiella Theo Tettelin et al [10], cơng thức Heap's Law sử dụng để xác định hệ pan-genome mở hay đóng Nó biểu diễn cơng thức sau: n = k * N-α Trong phân tích này, hệ số α 0,301 (giữa 1), tương ứng với mơ hình pan-genome mở [11] Điều có nghĩa việc bổ sung gene chủng Edwarsiella tiếp tục giúp phát gene cho lồi này, cho thấy Edwardsiella spp thích nghi với nhiều điều kiện mơi trường khác 1050 3.2 Mối quan hệ phát sinh loài Kết phân tích phát sinh lồi từ liệu core gene pan-genome cho thấy chủng E tarda EIB202, FL6_60 ET-1 thuộc lồi E piscicida (Hình 1) Kết cho thấy cách sử dụng core gene pan-genome, phát loài chủng Edwardsiella phân biệt rõ ràng Phù hợp với nghiên cứu trước [3, 5], phân tích cho thấy chủng E tarda xác định lại E piscicida loài chi Edwardsiella phân biệt rõ ràng (Hình 1) Hai chủng Edwardsiella sp lại (strain EA181011 LADL05_105) có giá trị ANIs (Average nucleotide identity) tương ứng 99,65 99,58 (dữ liệu không hiển thị) phân cụm tốt với chủng E anguillarum_ET080813 (Hình 2) Do đó, hai chủng Edwardsiella sp EA181011 Edwardsiella sp LADL05_105 có định danh thuộc lồi E anguillarum dựa sở hai phân tích ANI phân tích dispensable (assessory gene singleton gene) (Hình 2) 3.3 Phân tích đa hình assessory gene Cụ thể, tính đa hình assessory gene chọn lọc từ pan-genome Edwardsiella cung cấp thông tin có giá trị biện pháp kiểm sốt bệnh Edwardsiellosis Ví dụ, phân tích diện/vắng mặt gene (Hình 2) dấu hiệu cho việc nhận diện phân tử sử dụng để thiết kế các markers để xác định xác lồi chi Edwardsiella, đặc biệt sử dụng để phân biệt loài với E tarda [12, 13] 24, 25] Trong nghiên cứu sâu hơn, kết hợp kiểu hình, kiểu huyết với kháng huyết quan sát hàm lượng gene khác biệt phân tích mở rộng KEGG / COG, VFDB, ARG tài nguyên phần mềm RAST giúp khám phá hiểu biết sinh học tiến hóa việc phát sinh bệnh học (pathogenesis) tìm các loại thuốc đặc hiệu phòng chống điều trị bệnh Edwardsiellosis Đặc biệt, tin pan-PCR, phương pháp PCR dùng định danh phân tử sử dụng phổ biến, dựa gene mục tiêu chọn lọc từ assessory gene (Hình 2), cơng cụ thường quy phịng thí nghiệm phân biệt tất chủng Edwardsiella từ mẫu bệnh lâm sàng Hình Sự phân cấp chủng Edwardsiella phân lập từ hệ sinh thái khác Cả hai nhóm phân lồi (hình bên phải) dựa chia sẻ gene chủng phát sinh lồi (hình bên trái) dựa core gene 15 chủng khảo sát Thanh thị chủng hai phân loài nhằm làm bật mức độ tương đồng hai phương pháp 1051 Hình Tính đa hình assessory gene chọn lọc từ pan-genome Edwardsiella Sự diện/vắng mặt 2578 gene xác định tương ứng hiển thị màu đỏ/đen 3.4 Ứng dụng pan-genome kiểm sốt bệnh Edwarsiellosis Số lượng trình tự gene vi khuẩn phân lập từ môi trường nước gửi sở liệu NCBI tăng theo cấp số nhân Dữ liệu cung cấp tiềm lớn cho việc kiểm tra tổng hợp dịch tễ bệnh tương tác mầm bệnh vật chủ Dễ thấy rằng, pan-genome công cụ hiệu mở rộng để phân tích vi sinh vật thủy sinh hiểu đặc tính phân tử giúp chúng thích nghi với vật chủ mơi trường khác Ví dụ E tarda phân lập từ cá bệnh chia thành nhóm nước nhóm biển/di cư [14] Mặt khác, chuyển tái tổ hợp tương đồng gene phát phân tích phylogenomic network Về mặt gene độc lực, thích chức cho gene sở liệu VFDB, COG KEGG ARG phân tích lại dựa thành phần hệ pan-genome Việc mơ tả q trình gây bệnh chủng gây bệnh cho cá quan trọng độc lực khả gây bệnh mầm bệnh vi khuẩn thủy sinh đa yếu tố (multifactors), khác lồi chủng (ví dụ, trường hợp loài Vibrio Aeromonas [15-17]) Những độc lực khả gây bệnh liên quan đến nội địa hóa protein tế bào bao gồm thành phần hóa học protein vỏ nang, polysacaride bề mặt, Flagella, độc tố hệ thống tiết [17, 18] 1052 Hình Chức nhóm gene phần khác pan-genme chi Edwardsiella Bản đồ nhiệt xanh (Blue bar): thể phân bố lớp (class) chức nhóm gene core gene loài Bản đồ nhiệt đỏ (Red bar): thể phân bố lớp (class) chức nhóm gene singleton core gene (unique core) lồi Do đó, phân tích xi dịng (downstream analysis) giúp tìm dấu hiệu chủng gây bệnh động truyền nhiễm, cung cấp hiểu biết sâu sắc việc so sánh gene kháng khuẩn, gene độc lực chủng vi khuẩn, tương tác lẫn vi khuẩn-vật chủ Các phân tích cho phép phát triển phương pháp kiểm soát chống lại bệnh truyền nhiễm thủy hải sản, chẳng hạn biện pháp thay thế/giảm kháng sinh kháng khuẩn lợi khuẩn dược chất tự nhiên, hướng tới tương lai bền vững cho nuôi trồng thủy sản [19] Trong nghiên cứu này, sử dụng core gene singleton gene (unique core) loài để khảo sát chức nhóm gene thấy E tardar có tỉ lệ khác biệt so với lồi cịn lại (Hình 3) Kết cho thấy pan-genome sử dụng cơng cụ mạnh mẽ để phân biệt khác gene chức lồi chi Edwardsiella Cơng cụ so sánh pan-genome cho phép chọn lọc gene mục tiêu, ví dụ gen liên quan q trình tổng hợp protein bề mặt tế bào (SEPs), bao gồm protein màng (outer membrane), protein ngoại bào (extracellular) Các gene SEPs xem ứng viên vaccine tiềm mơ hình động vật (được gọi Reversed Vaccinology) [4, 20] Trong nuôi trồng thủy sản, SEPs từ mầm bệnh bao gồm số yếu tố độc lực quan trọng đóng vai trị phát sinh bệnh học vi khuẩn phản ứng miễn dịch vật chủ Ví dụ, biểu gene esa1 từ E tarda, kháng nguyên bề mặt giống D15, mơ hình cá bơn Nhật Bản tạo biểu phổ rộng gene liên quan đến khả miễn dịch tự nhiên đặc hiệu, tăng tỉ lệ sống sót cá khả sản xuất kháng thể huyết đặc hiệu [21, 21] Vì vậy, gia tăng nhanh chóng số lượng genome vi khuẩn gây bệnh thủy sản cho phép xây dựng quy trình phản ứng nhanh kiểm sốt dịch bệnh, 1053 xu hướng tiềm để nghiên cứu cải thiện hiệu loại vaccine đa giá nhằm ngăn chặn dịch bệnh có xu hướng biến đổi liên tục nuôi trồng thủy sản KẾT LUẬN VÀ ĐỀ NGHỊ Công cụ so sánh pan-genome giúp định danh lại loài vi khuẩn Edwarsiella, cụ thể chủng E tarda EIB202, FL6_60, ET-1 thuộc lồi E piscicida Chúng tơi đề xuất có chỉnh sửa định danh bổ sung hệ thống NCBI đề liệu sử dụng cho nghiên cứu Dựa vào phân tích chi tiết thành phần/chức gene hệ gene Edwardsiella, cung cấp thông tin gene sử dung thiết kế quy trình định danh phân tử loài Edwarsiella mẫu lâm sàng Ngoài ra, phương pháp phân tích pan-genome dùng để khám phá gene chia sẻ để tìm hiểu khả thích nghi phát triển loại vaccine tiềm nhằm cải thiện hiệu ngăn chặn dịch bệnh thực phân tích pan-genome TÀI LIỆU THAM KHẢO [1] Griffin, M.J et al Edwardsiella spp In: Woo, P.T.K Cipriano, R.C (Eds.) CAB International, Boston (2017) pp 190–210 [2] Shafiei, S Viljamaa-Dirks, S Sundell, K Heinikainen, S Abayneh, T Wiklund, T Aquaculture 454 (2016) 19–26 [3] Buján, N Mohammed, H Balboa, S Romalde, et al Systematic and Applied Microbiology, 41 (2018) 30–37 doi: 10.1016/j.syapm.2017.09.004 [4] T Abayneh, D.J Colquhoun, H Sørum Vet Microbiol 158 (2012) 367–375 [5] S Shao, Q Lai, Q Liu, H Wu, J Xiao, Z et al Syst Appl Microbiol 38 (2015) 36–47 [6] N Castro, A.E Toranzo, A Bastardo, J.L Barja, B Magariños Dis Aquatic Org 95 (2011) 253– 258 [7] M Richter, R Rosselló–Móra Proc Natl Acad Sci U.S.A 106 (2009) pp 19126–31 [8] Blom, J., Kreis, S., Spänig, Juhre, T., et al Nucleic Acids Res 44 (2016) pp 22–28 [9] S Wu, Z Zhu, L Fu, B Niu, W Li BMC Genomics 12 (2011) pp 444 [10] H Tettelin, D Riley, C Cattuto, D Medini Curr Opin Microbiol 11 (2008) pp 472–477 [11] Chaplin, A.V Efimov, B.A Smeianov, V.V et al PLoS One 10(8), (2015) pp e0135658 [12] Buján, N Mohammed, H Balboa, S et al Systematic and Applied Microbiology, 41 (2018) 30–37 doi: 10.1016/j.syapm.2017.09.004 [13] Fogelson, S.B Petty, B.D Reichley, S.R et al J Vet Diagn Invest 28 (2016) 338–344 [14] J Shao, Q Guo, R Hu, Z Gu Aquac Res.; 49 (2018) 197–204 doi:10.1111/are.13448 [15] F Awan, Y Dong, J Liu, N Wang, M.H Mushtaq, C Lu, Y Liu BMC Genomics 19(1) (2018) 712 [16] P Busschaert, I Frans, S Crauwels, B Zhu, K Willems, P Bossier, C Michiels, K Verstrepen, B Lievens, and H Rediers J Fish Dis 38 (2015) 795-807 doi:10.1111/jfd.12290 [17] J.M Tomás, The main Aeromonas pathogenic factors, ISRN Microbiol 2012 (2012) 256261 1054 [18] L Zeng, D Wang, N Hu, Q Zhu, K Chen, K Dong, Y Zhang, Y Yao, X Guo, Y.F Chang, Y Zhu Frontiers in microbiology (2017) 396 [19] Kim, T.L Nguyen, D.H Kim John Wiley & Sons Ltd, Hoboken, (2017) pp 109–145 [20] D Maione, I Margarit, C.D Rinaudo, V Masignani, M Mora, M Scarselli, et al Science 309 (2005) 148–150 doi: 10.1126/science.1109869 [21] Y Sun, C Liu, L Sun Fish Shellfish Immunol 30 (2011) 273-279 [22] Y Sun, C Liu, L Sun Vaccine 38 (2010) 6603-6608 1055 ... tác lẫn vi khuẩn- vật chủ Các phân tích cho phép phát triển phương pháp kiểm soát chống lại bệnh truyền nhiễm thủy hải sản, chẳng hạn biện pháp thay thế/giảm kháng sinh kháng khuẩn lợi khuẩn dược... ARG phân tích lại dựa thành phần hệ pan-genome Vi? ??c mô tả trình gây bệnh chủng gây bệnh cho cá quan trọng độc lực khả gây bệnh mầm bệnh vi khuẩn thủy sinh đa yếu tố (multifactors), khác lồi chủng. .. nghiệm phân biệt tất chủng Edwardsiella từ mẫu bệnh lâm sàng Hình Sự phân cấp chủng Edwardsiella phân lập từ hệ sinh thái khác Cả hai nhóm phân lồi (hình bên phải) dựa chia sẻ gene chủng phát sinh