TỔNG QUAN
Tổng quan về bệnh đái tháo đường
Theo Bộ Y tế Việt Nam năm 2017, Đái tháo đường (ĐTĐ) được định nghĩa là
Bệnh rối loạn chuyển hóa không đồng nhất đặc trưng bởi tăng glucose huyết do khiếm khuyết trong tiết insulin hoặc tác động của insulin Tình trạng tăng glucose mạn tính kéo dài dẫn đến rối loạn chuyển hóa carbohydrate, protide và lipide, gây tổn thương cho nhiều cơ quan, đặc biệt là tim, mạch máu, thận, mắt và hệ thần kinh.
Theo Liên đoàn Đái tháo đường Thế giới (IDF), năm 2015 có 415 triệu người từ 20-79 tuổi mắc ĐTĐ, và dự đoán đến năm 2040 con số này sẽ tăng lên 642 triệu, tương đương 1 trong 10 người Bệnh ĐTĐ tuýp 2 đang gia tăng ở trẻ em do chế độ ăn uống không khoa học và thiếu vận động, trở thành vấn đề sức khỏe cộng đồng nghiêm trọng ĐTĐ gây ra nhiều biến chứng nguy hiểm như bệnh tim mạch, đục thủy tinh thể, suy thận và cắt cụt chi.
Năm 2012, tỷ lệ mắc bệnh tiểu đường (ĐTĐ) ở người trưởng thành tại Việt Nam đạt 5.42%, trong khi đó có đến 63.6% trường hợp ĐTĐ chưa được chẩn đoán trong cộng đồng Điều này được xác nhận qua kết quả điều tra STEPwise về các yếu tố nguy cơ của bệnh không lây nhiễm do Bộ Y tế thực hiện.
Y tế thực hiện năm 2015 ở nhóm từ 18-69 tuổi cho thấy tỷ lệ ĐTĐ toàn quốc là 4,1%, tiền ĐTĐ là 3,6% [1]
1.1.2 Phân loại a) Đái tháo đường tuýp 1 (do phá hủy tế bào beta tụy, dẫn đến thiếu insulin tuyệt đối) [1] Đái tháo đường tuýp 1 chiếm 5 - 10% của tất cả các trường hợp đái tháo đường do tế bào beta bị tàn phá nên bệnh nhân không còn hoặc còn rất ít insulin Trong đó, 95% là do cơ chế tự miễn (tuýp 1A), 5% vô căn (tuýp 1B) Bệnh nhân bị giảm lượng insulin, tăng glucagon trong máu, nếu không điều trị sẽ bị nhiễm toan ceton Bệnh ĐTĐ tuýp 1 có thể xảy ra ở mọi lứa tuổi nhưng chủ yếu xuất hiện từ sớm (trẻ em, thiếu niên) Bệnh nhân cần bổ sung insulin để ổn định đường huyết Người lớn
Bệnh ĐTĐ tự miễn diễn tiến chậm (LADA) có thể xuất hiện ở độ tuổi 2, khi bệnh nhân vẫn sản xuất đủ insulin và chưa gặp phải tình trạng nhiễm toan ceton Giai đoạn đầu, bệnh có thể được điều trị bằng thuốc viên, nhưng theo thời gian, tình trạng thiếu insulin sẽ trở nên nghiêm trọng hơn.
Dấu ấn di truyền của bệnh tiểu đường tuýp 1 cho thấy rằng nếu mẹ mắc bệnh, nguy cơ con bị bệnh là 3%, trong khi nếu cha mắc bệnh, nguy cơ này tăng lên 6% Đặc biệt, tỷ lệ hai trẻ sinh đôi cùng trứng mắc bệnh tiểu đường tuýp 1 có thể đạt từ 25% đến 50%.
Yếu tố môi trường liên quan đến đái tháo đường tuýp 1 bao gồm rubella bẩm sinh, virus quai bị, thuốc diệt chuột Vacor và hydrogen cyanide có trong rễ cây sắn Đái tháo đường tuýp 2, do sự suy giảm chức năng của tế bào β tuyến tụy trên nền tảng đề kháng insulin, trước đây được gọi là đái tháo đường của người lớn tuổi hay đái tháo đường không phụ thuộc insulin Đây là dạng phổ biến nhất của bệnh đái tháo đường, chiếm 90-95% tổng số trường hợp và là trọng tâm chính trong nghiên cứu về bệnh tiểu đường.
Kháng insulin và sự suy giảm tế bào β đảo tụy là nguyên nhân chính gây ra bệnh tiểu đường tuýp 2 Nhiều bệnh nhân không cần bổ sung insulin trong giai đoạn đầu hoặc suốt cuộc đời, do không có sự phá hủy tế bào β và không có kháng thể tự miễn trong máu Trong giai đoạn đầu, tế bào β bù trừ bằng cách tăng tiết insulin, nhưng nếu tình trạng kháng insulin kéo dài, khả năng tiết insulin sẽ giảm, dẫn đến sự xuất hiện của bệnh tiểu đường tuýp 2 lâm sàng Mặc dù kháng insulin có thể cải thiện qua việc giảm cân hoặc sử dụng một số loại thuốc, nhưng nó không bao giờ trở lại mức bình thường hoàn toàn.
Tăng đường huyết, với mức đường huyết lúc đói ≥ 7,0 mmol/L hoặc mức đường huyết ngẫu nhiên ≥ 11,1 mmol/L, là dấu hiệu bất thường của bệnh tiểu đường Việc đo mức đường huyết là cần thiết để sàng lọc, chẩn đoán và theo dõi bệnh tiểu đường Có bốn loại xét nghiệm để kiểm tra mức đường huyết: (1) đường huyết lúc đói; (2) xét nghiệm dung nạp glucose đường uống; (3) xét nghiệm glucose ngẫu nhiên; và (4) HbA1c, hay còn gọi là xét nghiệm hemoglobin glycated.
Hầu hết bệnh nhân mắc bệnh tiểu đường tuýp 2 thường có triệu chứng béo phì, thừa cân, hoặc béo phì vùng bụng với vòng eo lớn Nồng độ đường huyết cao kéo dài có thể gây tổn hại cho nhiều hệ thống cơ quan, dẫn đến các biến chứng nghiêm trọng Điều này góp phần làm gia tăng tỷ lệ mắc bệnh và tử vong liên quan đến bệnh tiểu đường.
Tăng đường huyết mãn tính gây tổn thương mạch máu và thần kinh, thúc đẩy bệnh tim mạch (CVD) và dẫn đến các vấn đề nghiêm trọng như mất thị lực và suy thận Bệnh võng mạc do tiểu đường là nguyên nhân hàng đầu gây mù có thể phòng ngừa, trong khi bệnh thận do tiểu đường là nguyên nhân chính gây bệnh thận Vì vậy, kiểm soát mức đường huyết hợp lý là mục tiêu quan trọng trong điều trị bệnh tiểu đường, nhằm giảm thiểu sự phát triển của các biến chứng mãn tính.
Nguy cơ mắc bệnh tiểu đường tuýp 2 tăng lên theo độ tuổi, béo phì và lối sống ít vận động Bệnh tiểu đường tuýp 2 cũng thường gặp ở phụ nữ có tiền sử tiểu đường thai kỳ, những người bị tăng huyết áp, rối loạn lipid máu, và ở các nhóm sắc tộc nhạy cảm như người Mỹ da đen, người Mỹ bản địa, người Mỹ gốc La tinh, người Mỹ gốc Á, dân châu Mỹ La tinh, người gốc Nam Á, cùng với một số đảo ở khu vực Thái Bình Dương.
Yếu tố di truyền đóng vai trò quan trọng trong bệnh tiểu đường tuýp 2, với tỷ lệ mắc bệnh lên tới 90% ở những người sinh đôi cùng trứng Hầu hết bệnh nhân tiểu đường tuýp 2 có người thân cũng mắc bệnh, cho thấy sự ảnh hưởng của nhiều gen Nếu phát hiện một gen cụ thể liên quan đến tăng glucose huyết, bệnh nhân sẽ được phân loại vào thể bệnh chuyên biệt của tiểu đường.
Bệnh tiểu đường tuýp 2 là kết quả của sự tương tác giữa yếu tố di truyền và các yếu tố môi trường có thể thay đổi, như béo phì, chế độ ăn uống kém và lối sống ít vận động Ngoài ra, đái tháo đường thai kỳ, được chẩn đoán trong ba tháng giữa hoặc cuối của thai kỳ mà không có dấu hiệu của đái tháo đường tuýp 1 hay tuýp 2 trước đó, cũng là một dạng bệnh lý cần được chú ý.
Đái tháo đường thai kỳ là tình trạng rối loạn đường huyết được chẩn đoán trong 3 tháng giữa hoặc cuối của thai kỳ, không có dấu hiệu của đái tháo đường tuýp 1 hay tuýp 2 trước đó Sau khi sinh, hầu hết các trường hợp glucose máu sẽ trở về mức bình thường, chỉ một số ít phụ nữ có nguy cơ phát triển thành đái tháo đường tuýp 2.
Mô hình in silico trong nghiên cứu phát triển thuốc mới
Phát triển thuốc mới là một quy trình phức tạp và tốn kém, với chi phí lên tới hàng tỷ đô la cho mỗi loại thuốc Tỷ lệ thành công trong việc đưa thuốc ra thị trường rất thấp, điều này đặt ra nhiều thách thức cho các nhà nghiên cứu và công ty dược phẩm.
Tỷ lệ thành công từ một hợp chất dẫn đường ban đầu đến khi thương mại hóa rất thấp, chỉ dưới 2% các hợp chất mới có thể trở thành thuốc Theo nghiên cứu năm 2016 của DiMasi và cộng sự từ Trung tâm nghiên cứu và phát triển thuốc, Đại học Tufts Hoa Kỳ, trung bình mỗi dự án cần hơn 2,5 tỷ đô la và mất từ 10 đến 15 năm để đưa một loại thuốc ra thị trường, nếu dự án đó thành công.
Quá trình nghiên cứu và phát triển thuốc bao gồm nhiều bước quan trọng như xác định bệnh và đích tác dụng của thuốc, thiết lập quy trình thử nghiệm, tìm kiếm hợp chất dẫn đường, và xây dựng mối quan hệ giữa hợp chất và tác dụng Tiếp theo, cần xác định pharmacophore, tối ưu hóa dược lực học và dược động học, thực hiện sàng lọc in vitro và nghiên cứu in vivo để đánh giá hiệu quả điều trị và an toàn Cuối cùng, các nghiên cứu tiền lâm sàng về độc tính, bào chế, phát triển sản xuất, đăng ký pháp lý và thử nghiệm lâm sàng là những bước không thể thiếu trong quy trình này.
Hình 1.1 Quá trình nghiên cứu phát triển thuốc
Trong nghiên cứu hiện nay, thiết kế thuốc hiệu quả nhất được thực hiện thông qua kỹ thuật thiết kế thuốc hỗ trợ bởi máy tính Máy tính được ứng dụng trong nhiều giai đoạn, từ việc tìm kiếm hợp chất hóa học có tác dụng sinh học đến tối ưu hóa cấu trúc nhằm tăng hoạt tính sinh học, giảm độc tính và cải thiện các đặc tính dược động học của thuốc Các phương pháp này được gọi là "in silico", nhằm phân biệt với các phương pháp truyền thống khác.
Các phương pháp in silico, bao gồm vivo, in situ và in vitro, mang lại nhiều lợi thế so với các phương pháp thực nghiệm truyền thống Chúng giúp thiết kế các phân tử thuốc mới hiệu quả hơn, giải thích bản chất phân tử của các tương tác thuốc và rút ngắn thời gian thực hiện.
Các mô hình toán học cho phép dự đoán hoạt tính sinh học và cơ chế tác dụng, cũng như cơ chế gây độc của các hợp chất, giúp tiết kiệm thời gian và chi phí trong phát triển thuốc mới Phương pháp in silico đã đóng góp quan trọng trong việc phát hiện các hợp chất mới có hoạt tính sinh học, ngay cả trước khi chúng được tổng hợp hoặc phân lập thông qua quá trình sàng lọc ảo.
Đại cương về QSAR
Các mô hình liên quan định lượng cấu trúc và tác dụng (Quantitative
QSAR (Quantitative Structure-Activity Relationships) là một kỹ thuật dự đoán hoạt động và tính chất của các phân tử chưa biết bằng cách phân tích mối liên hệ giữa cấu trúc phân tử và các đặc tính đo được của chúng Nguyên lý cơ bản của QSAR là mỗi phân tử mang trong mình các yếu tố quyết định đặc tính sinh học, vật lý và hóa lý Các hợp chất có cấu trúc tương tự thường thể hiện hoạt tính tương đồng Những đặc điểm hóa học này có thể được xác định qua lý thuyết hoặc thực nghiệm, chẳng hạn như các tính chất lý hóa như nhiệt độ bay hơi và khối lượng mol Do đó, bất kỳ yếu tố nào chứa thông tin hóa học quan trọng đều có thể được sử dụng làm biến dự báo hoặc tham số mô tả trong phân tích QSAR.
Các đặc tính lý hóa như nhiệt độ nóng chảy, thời gian bán hủy và sức căng bề mặt cung cấp thông tin quan trọng để giải thích các phản ứng liên quan đến hợp chất Mô hình QSAR (Quantitative Structure-Activity Relationship) có khả năng biểu diễn mối tương quan định lượng giữa cấu trúc phân tử và hoạt tính sinh học của chúng thông qua các hàm số.
Y là một biến thể hiện đáp ứng sinh học hoặc hóa học, thường được xác định qua các thí nghiệm Nó được biểu thị bằng các giá trị quan trọng như nồng độ ức chế 50% (IC 50), nồng độ phần trăm ức chế (I%) và nồng độ 50% tác dụng tối đa (EC 50).
Các biến X1, X2,…Xn là các tham số phân tử (molecular descriptor, TSPT) dùng để mô tả cấu trúc phân tử hợp chất Để xây dựng hàm f(x), cần áp dụng các kỹ thuật thống kê hoặc học máy Một số phương pháp phổ biến trong mô hình QSAR bao gồm hồi quy đa biến tuyến tính, bình phương tối thiểu từng phần và phân tích thành phần chính Học máy, một lĩnh vực của trí tuệ nhân tạo, cho phép các hệ thống tự động học từ dữ liệu để giải quyết vấn đề cụ thể Trong thiết kế mô hình QSAR, các phương pháp học máy như mạng nơron nhân tạo và cây quyết định thường được sử dụng Các bước xây dựng mô hình QSAR bao gồm nhiều giai đoạn khác nhau.
1) Xây dựng cơ sở dữ liệu (CSDL);
2) Tính toán TSPT đặc trưng cho cấu trúc bằng sử dụng các phần mềm giúp biểu diễn và tính toán;
3) Xây dựng mô hình QSAR: Sử dụng các phương pháp xác suất thống kê và các kỹ thuật của trí tuệ nhân tạo để xây dựng mối liên hệ giữa các tham số phân tử (TSPT) và các giá trị đại lượng biểu diễn hoạt tính;
5) Giải thích các kết quả và sử dụng mô hình trong quá trình sàng lọc ảo (nếu có thể)
Xây dựng cơ sở dữ liệu (CSDL) là quá trình tổ chức các hợp chất hóa học có hoạt tính sinh học đã được xác minh in vitro Để giảm thiểu sai số trong mô hình, CSDL thường được làm sạch dựa trên sự tương đồng về cấu trúc và các giao thức (protocol) Các giá trị sinh học trong CSDL được hiệu chỉnh để đảm bảo tính đại diện và ý nghĩa thống kê.
Tính toán các tham số mô tả phân tử là quá trình chuyển đổi thông tin cấu trúc hóa học thành dạng số, giúp máy tính có khả năng “hiểu” cấu trúc này thông qua các phương pháp toán học và lôgic.
Thiết kế tập huấn luyện và tập kiểm tra: CSDL được chia thành tập huấn luyện
(TS-Training set) chiếm khoảng 70-80 %, được sử dụng để xây dựng mô hình và
12 tập kiểm tra (PS-Prediction set) để đánh giá khả năng dự đoán của các mô hình đã xây dựng được
Xây dựng mô hình QSAR là quá trình kết hợp các phương pháp xác suất thống kê và trí tuệ nhân tạo để thiết lập mối quan hệ giữa các tham số phân tử và hoạt tính Đánh giá mô hình là bước quan trọng, đảm bảo tính khả thi của mô hình thông qua độ khớp và độ ổn định khi đánh giá nội bộ trên tập dữ liệu huấn luyện, cũng như khả năng dự đoán chính xác trên tập dữ liệu kiểm tra.
Để đánh giá mô hình QSAR, các kỹ thuật thống kê phổ biến bao gồm đánh giá nội, đánh giá chéo, đánh giá ngẫu nhiên Y, và đánh giá ngoại Quy trình này thường liên quan đến việc chia tệp dữ liệu thành các hợp chất để huấn luyện hoặc kiểm tra mô hình, cũng như áp dụng mô hình trên tập dữ liệu ngoại để xác thực tính chính xác.
Kỹ thuật Protein docking
Docking phân tử là một phương pháp hiện đại để sàng lọc các chất ức chế enzyme và chất chủ vận thụ thể trong nghiên cứu bệnh tiểu đường Phần mềm chuyên dụng sử dụng mô hình phân tử ba chiều và độ phân giải cao của protein mục tiêu để dự đoán các phối tử mới có khả năng liên kết và điều chỉnh hoạt động của nó Cấu trúc khuôn mẫu được tạo ra thông qua mô hình tương đồng hoặc tinh thể học Trong quá trình docking phân tử, mục tiêu phân tử hoạt động theo nhiều hướng khác nhau, cho phép phần mềm sàng lọc cơ sở dữ liệu hỗn hợp một cách hiệu quả Các chức năng chấm điểm tích hợp dự đoán hoạt động sinh học dựa trên tương tác giữa phối tử và protein mục tiêu, xem xét các yếu tố như hình dạng phối tử, khả năng tương thích tĩnh điện, hiệu ứng hòa tan, năng lượng liên kết, cũng như entanpy và entropy, tất cả đều là yếu tố quyết định cho sự tương tác phối tử - thụ thể thành công.
Docking là một bài toán tối ưu nhằm xác định vị trí và cấu hình lý tưởng cho cơ chất khi gắn kết với protein Mục tiêu chính của quá trình này là tìm ra cấu hình có năng lượng tự do thấp nhất, tương ứng với cấu hình bền nhất sau khi liên kết giữa phối tử và protein được hình thành Để đạt được cấu hình tối ưu, cần liên kết cấu hình không gian với các chỉ số đánh giá khả năng gắn kết của cơ chất lên protein và áp dụng các thuật toán tìm kiếm thích hợp.
Quá trình docking bao gồm ba bước chính:
Chuẩn bị cấu tử: Cấu trúc các cấu tử có thể lấy từ các thư viện sẵn có như
PubChem và Zinc có thể được vẽ bằng phần mềm ChemDraw và Chemsketch Sau khi tạo ra cấu trúc 3D, bạn cần sử dụng phần mềm MOE để xử lý cấu trúc theo các bước như chỉnh sửa điện tích, tối giản hóa năng lượng, gắn trường lực cho phân tử và xây dựng file dbpqt.
Để chuẩn bị protein, chúng ta thường sử dụng các cấu trúc 3D có sẵn từ ngân hàng dữ liệu protein (protein data bank) Nếu không có cấu trúc sẵn, phương pháp mô phỏng tương đồng (Homology modeling) có thể được áp dụng để xây dựng cấu trúc 3D Phương pháp này cơ bản là sắp xếp chuỗi amino acid của protein thu được từ quá trình giải mã gen lên khung cấu trúc bậc 3 của protein có độ phân giải cao, mặc dù thiếu thông tin về toàn bộ amino acid.
Sau khi xác định cấu trúc 3D, cần sử dụng phần mềm để chuẩn bị protein cho mô phỏng docking Các bước chuẩn bị bao gồm loại bỏ nước và các thành phần không cần thiết, thêm hydro, gắn trường lực, phân tích các vùng có khả năng tương tác và xây dựng file dbqpt.
Mô phỏng docking là quá trình quan trọng trong nghiên cứu tương tác protein và phối tử Trước khi bắt đầu, cần sử dụng phần mềm để xác định các túi tương tác trên protein, thường nằm ở trung tâm hoạt động của nó, nhằm đánh giá khả năng liên kết của phối tử Khi tiến hành docking, phần mềm sẽ tự động tìm kiếm cấu hình tối ưu của phối tử, tương ứng với năng lượng toàn hệ thấp nhất Kết quả này sẽ được phân tích bằng các phần mềm chuyên dụng như MOE và Discovery Studio để hiểu rõ hơn về các tương tác xảy ra.
NGUYÊN LIỆU, THIẾT BỊ, NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
Nguyên liệu
2.1.1 Dữ liệu các chất có hoạt tính dùng để xây dựng mô hình QSAR
Gồm 110 hợp chất có hoạt tính ức chế SGLT2 được thu thập trực tiếp từ nghiên cứu của Chunlei Tang và cộng sự [54] (Phụ lục 1)
Hoạt tính in vitro được biểu thị bằng nồng độ ức chế 50% (IC50) chất chủ vận
Cấu trúc hóa học và hoạt tính của 88 hợp chất liên quan đến PPARγ đã được thu thập từ nghiên cứu của Al-Najjar và cộng sự [64] (Phụ lục 2).
Cấu trúc khung của các hợp chất được trình bày trong Hình 2.1 Hoạt tính in vitro được thể hiện qua nồng độ chất thử có khả năng ức chế 50% lượng chất chủ vận được đánh dấu huỳnh quang trong trạng thái kích thích PPARγ.
Các thành phần dữ liệu đều chia thành tập huấn luyện và tập kiểm tra: Trong đó tập kiểm tra chiếm 20% được chọn một cách ngẫu nhiên
Hình 2.1 Cấu trúc khung các chất chủ vận PPARγ trong cơ sở dữ liệu
2.1.2 Dữ liệu các chất có hoạt tính dùng để xây dựng mô hình phân biệt
CSDL chứa 82 hợp chất đã được xác định cấu trúc và tác dụng, cùng với thông tin liên quan, được tổng hợp từ các nghiên cứu trong nước và quốc tế Những hợp chất này cho thấy hiệu quả điều trị bệnh tiểu đường trên các mô hình động vật (Phụ lục 3).
2.1.3 Cơ sở dữ liệu dùng để sàng lọc hoạt tính
Cơ sở dữ liệu ChemBl đã tổng hợp các hợp chất tự nhiên được phân lập và xác định cấu trúc trong các nghiên cứu trước đây.
Thư viện dữ liệu hóa học sử dụng trong nghiên cứu bao gồm 758 hợp chất thiên nhiên với các thông tin liên quan
2.1.4 Cấu trúc tinh thể của các protein dùng trong nghiên cứu Docking
Cấu trúc 3D của protein được tải về từ ngân hàng dữ liệu protein (Protein Data Bank) và được xử lý kỹ lưỡng trước khi áp dụng trong quá trình sàng lọc.
Hình 2.2 Cấu trúc 3D của thụ thể kích hoạt peroxisome proliferator-γ
Hình 2.3 Cấu trúc 3D của Protein đồng vận chuyển Natri - glucose 2
Thiết bị, phần mềm
Thiết bị : Sử dụng các phần mềm trên máy tính Asus Vivobook S14 – Hệ điều hành
Phần mềm: Danh sách các phần mềm sử dụng bao gồm:
- Phần mềm lưu trữ, hiệu chỉnh số liệu: Microsoft Excel 2010
- Phần mềm xây dựng cấu trúc hóa học: ChemDraw Professional bản 16.0
- Phần mềm tính toán tham số phân tử: Dragon 6.0
- Phần mềm xây dựng và tối ưu hóa mô hình QSAR: Statistica 12.0.5, và QSAR - MobyDigs
- Phần mềm mô phỏng Docking: gói ICM Pro bản 3.8-6 (Molsoft L.L.C.), phần mềm Autodock vina 1.1.2
- Phần mềm phân tích và biểu diễn tương tác: MGLtools 1.5.7, MOE bản 2009.10
The article discusses software tools for studying the physicochemical properties and pharmacokinetics and toxicity (ADMET) of substances Key tools include Volsurf version 1.0.4, Toxtree version 3.1.0, and online resources such as AdmetSAR version 2.0 and SwissADME, which aid in assessing absorption, distribution, metabolism, excretion, and toxicity profiles.
Nội dung nghiên cứu
1 Xây dựng thư viện dữ liệu các hợp chất và tính toán các tham số phân tử
2 Xây dựng mô hình QSAR của các hợp chất có tác dụng ức chế SGLT2 và mô hình QSAR của các hợp chất có tác dụng hoạt hóa PPARγ
3 Xây dựng mô hình QSAR thể hiện mối tương quan giữa cấu trúc và tác dụng in vivo
4 Tiến hành sàng lọc tìm kiếm các hợp chất tự nhiên có hoạt tính sinh học đồng thời trên cả hai đích SGLT2 và PPARγ
5 Nghiên cứu Docking để đánh giá mức độ tương tác với trung tâm hoạt động trên đích tác dụng của các chất đã sàng lọc
6 Kiểm tra các chất đã sàng lọc trên mô hình QSAR thể hiện mối tương quan giữa cấu trúc và tác dụng in vivo để tìm kiếm được các hợp chất tự nhiên ở Việt
Nam có khả năng cao có tác dụng điều trị bệnh ĐTĐ tuýp 2 trên mô hình in vivo.
Phương pháp nghiên cứu
Nghiên cứu này áp dụng phương pháp sàng lọc ảo thông qua hệ thống phễu lọc, được thiết kế dựa trên tác dụng sinh học của các hợp chất đối với từng đích phân tử, bao gồm nhiều bước khác nhau.
- Xây dựng mô hình QSAR dự đoán hoạt tính trên các đích ĐTĐ tuýp 2 đã chọn
- Sàng lọc in silico các hợp chất thiên nhiên hướng tác dụng trên đích ĐTĐ tuýp 2: PPARγ và SGLT2
- Mô phỏng protein docking để đánh giá khả năng liên kết trong không gian của các cấu tử với đích tác dụng
Kiểm tra các chất đã được sàng lọc trên mô hình QSAR giúp phân biệt rõ ràng giữa các chất có hoạt tính in vivo và những chất không có hoạt tính in vivo.
Quá trình nghiên cứu đề tài tìm kiếm hợp chất thiên nhiên có tác dụng điều trị ĐTĐ tuýp 2, tập trung vào các đích PPARγ và SGLT2, được thực hiện thông qua mô hình in silico và in vivo.
2.4.1 Xây dựng mô hình QSAR dự đoán hoạt tính trên các đích ĐTĐ tuýp 2 đã chọn
Quy trình này tương tự cho các đích khác nhau, bao gồm:
1) Cơ chế ức chế SGLT2 ;
2) Cơ chế kích hoạt PPARγ ;
3) Có tác dụng trên các mô hình in vivo
Các bước tiến hành như sau:
- Bước 1 Thu thập dữ liệu độc tính tế bào
Trong bước này, các cơ sở dữ liệu (CSDL) được thu thập từ các công bố thực nghiệm và xử lý để phân loại thành nhóm có và không có hoạt tính (biến Y) nhằm xây dựng mô hình QSAR Để giảm thiểu sai số cho mô hình, cơ sở dữ liệu thường được làm sạch dựa trên sự tương đồng về cấu trúc và protocol.
Sử dụng phần mềm Chemdraw Professional 16.0 để vẽ lại các công thức 2D và 3D
- Bước 2 Tính toán tham số phân tử đặc trưng cho cấu trúc các chất trong cơ sở dữ liệu:
Số lượng tham số phân tử mà phần mềm tính toán càng nhiều thì càng mô tả chính xác cấu trúc của hợp chất [2]
Bảng 2.1 Các phần mềm tính tham số phân tử thông dụng
Loại tham số tính đƣợc Số lƣợng tham số
1 ADAPT Tham số cấu trúc hình học, hình học tô pô, tham số điện tử, tham số lí hoá
Tham số điện tử, tham số hàm lượng tử, tham số hình học tô pô
3 MOE Tham số hình học topo, tính chất vật lý
4 Dragon Tham số cấu tạo cơ bản, tham số cấu trúc hình học và hình học tô pô
Để xác định dãy tham số phân tử cho các hợp chất trong cơ sở dữ liệu, cần tổng hợp các hợp chất dưới dạng công thức SMILES Sau đó, phần mềm Dragon 6.0 sẽ được sử dụng để tính toán các tham số phân tử, cho phép tính toán lên đến 5270 tham số khác nhau.
- Bước 3 Xây dựng mô hình QSAR trên từng đích phân tử với dạng tổng quát :
Xi là các TSPT được lựa chọn vào mô hình;
Yi là giá trị IC50 của các hợp chất, trong khi ai là các hệ số tương ứng của từng TSPT Các giá trị này được tính toán thông qua phần mềm MobyDigs, sử dụng các phương pháp xác suất thống kê và kỹ thuật trí tuệ nhân tạo để thiết lập mối liên hệ giữa các tham số phân tử và hoạt tính của chúng.
CSDL được chia thành hai phần: tập huấn luyện (TrS) chiếm 80% và tập kiểm tra (TS) TrS được sử dụng để huấn luyện mô hình, giúp phát hiện mối quan hệ có khả năng dự đoán, trong khi TS bao gồm các phân tử chưa được mô hình tiếp xúc, cho phép đánh giá khả năng ngoại suy Mô hình được xây dựng bằng phương pháp hồi quy tuyến tính đa biến (MLR) thông qua thuật giải di truyền trên phần mềm Mobydigs.
- Bước 4 Đánh giá các mô hình xây dựng được
Các mô hình đã xây dựng được đánh giá dựa trên các tiêu chí [67], bao gồm:
1 Có đích cụ thể: Đích là những giá trị thực nghiệm về hoạt tính sinh học thu được tư cơ sở dữ liệu Nếu toàn bộ CSDL đều sử dụng một protocol để xác định giá trị của đích, thì mô hình xây dựng được có độ tin cậy cao, có thể dùng để dự đoán hoạt tính các hợp chất mới (nếu thực nghiệm dùng theo quy trình này) Còn nếu CSDL sử dụng nhiều protocol khác nhau thì mô hình sẽ không có độ tin cậy cao [2]
Các thuật toán được sử dụng trong việc xây dựng mô hình cần được mô tả một cách rõ ràng và có khả năng áp dụng cho việc phát triển các mô hình khác Khi đánh giá thuật toán, cần xem xét các yếu tố quan trọng để đảm bảo tính hiệu quả và khả năng ứng dụng của chúng.
Dữ liệu về cấu trúc, hoạt tính sinh học đầy đủ, rõ ràng
Thuật toán tính toán các tham số phân tử rõ ràng
Mô tả về tập huấn luyện và tập quan sát, cách xác định giá trị ngoại lai (outlier)
Mô tả thuật toán xây dựng mô hình
Mô tả các thông số thống kê đánh giá mô hình
3 Miền cấu trúc ứng dụng xác định [2]
Miền cấu trúc ứng dụng là không gian được xác định bởi các hợp chất trong tập huấn luyện dùng để xây dựng mô hình Nếu các hợp chất trong tập huấn luyện có cấu trúc ngoài miền này, độ chính xác của mô hình sẽ bị ảnh hưởng Tương tự, các hợp chất trong tập dự đoán có cấu trúc nằm ngoài miền cấu trúc ứng dụng cũng sẽ dẫn đến kết quả dự đoán không chính xác.
4 Có thước đo phù hợp để đánh giá độ chính xác, độ bền vững, khả năng dự đoán Các thông số được đánh giá gồm: R 2 , Q 2 , Q 2 ext
Độ khớp hay độ tuyến tính được đánh giá thông qua giá hệ số xác định R 2 ,
Hệ số xác định R² càng cao cho thấy mức độ khớp tuyến tính của mô hình với các giá trị thực nghiệm càng tốt Khi R² lớn hơn 0,6, mô hình mới được coi là có ý nghĩa Công thức tính R² được áp dụng để đánh giá hiệu quả của mô hình.
Trong đó n là số các quan sát của tập huấn luyện; yi,
^ y, lần lượt là giá trị thực tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; y là giá trị thực tế trung bình của biến phụ thuộc
Độ ổn định của mô hình được đánh giá qua hệ số tương quan chéo Q², được tính bằng phương pháp tham số chéo (cross validation leave one out) Phương pháp này loại bỏ từng quan sát ra khỏi tập huấn luyện, giữ nguyên các biến đã chọn và tính toán lại các thông số của mô hình Một giá trị Q² gần 1 cho thấy tính tổng quát hóa cao và độ ổn định của mô hình tốt Thông thường, yêu cầu để mô hình được coi là bền vững là Q² phải lớn hơn 0,5 Công thức tính hệ số tương quan chéo được áp dụng để xác định độ ổn định này.
Trong đó n là số các quan sát tập huấn luyện; yi, là giá trị thực tế của quan sát thứ i;
/i y i giá trị dự đoán của biến phụ thuộc ở quan sát thứ i sử dụng mô hình đã loại biến i; y là giá trị thực tế trung bình của biến phụ thuộc
Khả năng dự đoán ngoại
Khả năng dự đoán của mô hình được đánh giá qua giá trị Q² ext, với Q² ext càng lớn cho thấy độ tuyến tính của tập kiểm tra cao, từ đó chứng minh khả năng dự đoán của mô hình cũng tốt hơn.
Trong đó n là số các quan sát tấp kiểm tra; yi,
^ y, lần lượt là giá trị thực tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; y là giá trị thực tế trung bình của biến phụ thuộc
5 Giải thích cơ chế tác dụng nếu có thể
Mô hình cần được giải thích rõ ràng về vai trò của các biến để định hướng thiết kế hợp chất mới Tuy nhiên, việc giải thích các biến này thường gặp khó khăn do cơ chế phức tạp, đòi hỏi kiến thức chuyên sâu về hóa lượng tử Thêm vào đó, nhiều biến vẫn thiếu tài liệu tham khảo, dẫn đến việc thiếu cơ sở để đưa ra giải thích đầy đủ.
- Bước 5 Diễn giải và áp dụng mô hình xây dựng được
Các tham số phân tử được phân tích để xác định các yếu tố cấu trúc quan trọng ảnh hưởng đến hoạt tính sinh học Sau khi thực hiện đánh giá và giải thích, mô hình được sử dụng để thể hiện mối quan hệ giữa cấu trúc của các hợp chất và hoạt tính của chúng.
2.4.2 Sàng lọc in silico các hợp chất thiên nhiên hướng tác dụng trên đích ĐTĐ tuýp 2: PPARγ và SGLT2
KẾT QUẢ VÀ BÀN LUẬN
Kết quả nghiên cứu
3.1.1 Kết quả xây dựng hai mô hình QSAR trên phần mềm MobyDigs cho phép tìm kiếm các hợp chất có tác dụng sinh học trên từng đích phân tử là PPARγ và SGLT2 hướng điều trị ĐTĐ tuýp 2
Cài đặt các thông số với mỗi mô hình:
- Y : là giá trị IC50 (nM)
- Các tham số phân tử còn lại là X
- Mô hình QSAR trên đích PPARγ xây dựng được gồm 8 biến như sau: log (1+Y) = 12.61522 - 8.30244 * SM1_Dz + 0.01569 * ATSC7s +
- Mô hình QSAR trên đích SGLT2 xây dựng được gồm 8 biến như sau: log (1+Y) = -3.20292 + 2.2232 * Eig09_EA(bo) - 2.98868 * Eig14_AEA(ed)
3.1.2 Kết quả sàng lọc đƣợc một số hợp chất thiên nhiên có tác dụng điều trị tiểu đường tuýp 2 sử dụng hai mô hình QSAR đã xây dựng
Sau khi sàng lọc 758 hợp chất qua hai mô hình QSAR đã xây dựng ta thu được
21 hợp chất cùng cho tác dụng sinh học tốt trên hai đích phân tử PPARγ và SGLT2
Bảng 3.1 Các hợp chất có tác dựng đồng thời trên 2 đích phân tử là PPARγ và
(S) -2- (4- Hydroxy-3- (3- metylbut-2-en-1- yl) phenyl) chroman-7-ol
3.1.3 Kết quả kiểm tra tác dụng của các hợp chất đã sàng lọc qua mô hình in vivo
Qua kiểm tra 21 hợp chất tự nhiên, 4 hợp chất tiềm năng đã được xác định có hoạt tính in vivo, bao gồm: 7-Hydroxyflavanone, 4',5-Dihydroxyflavone và 7-Hydroxyflavone.
Bảng 3.2 Các hợp chất được dự đoán là có hoạt tính in vivo
Tên hợp chất Score-PPAR Score-
Bàn luận
3.2.1 Đánh giá kết quả xây dựng hai mô hình QSAR trên phần mềm MobyDigs cho phép tìm kiếm các hợp chất có tác dụng sinh học trên từng đích phân tử là PPARγ và SGLT2 hướng điều trị ĐTĐ tuýp 2
Tiêu chí đầu tiên yêu cầu toàn bộ cơ sở dữ liệu sử dụng nồng độ ức chế 50% (IC50) làm mục tiêu chính, và tất cả các thí nghiệm cần được thực hiện dưới cùng một điều kiện trên phần mềm MobyDigs.
Tiêu chí 2: Các phương pháp xây dựng mô hình nghiên cứu đã được trình bày trong phần 2.4 Nhờ vào tính rõ ràng và chính xác của các phương pháp, các mô hình này có thể được áp dụng lặp lại để phát hiện những hợp chất mới có tác dụng sinh học trên hai mục tiêu PPARγ và SGLT2.
Tiêu chí 3 : Xác định miền ứng dụng của mô hình:
Các hợp chất được sử dụng trong quá trình tập huấn luyện và kiểm tra đều thuộc miền ứng dụng của mô hình, cho thấy mô hình có khả năng dự đoán chính xác.
Tiêu chí 4 : Kết quả các đánh giá về độ chính xác, độ bền vững và khả năng đánh giá ngoại của mô hình
Hình 3.1 Khả năng kích thích thực tế so với số liệu tính toán của tập dữ liệu các chất kích hoạt PPARγ
(Ghi chú: màu xanh là phần của tập huấn luyện, màu đỏ là phần của tập kiểm tra)
Hình 3.2 Khả năng ức chế thực tế so với số liệu tính toán của tập dữ liệu các chất ức chế SGLT2
(Ghi chú: màu xanh là phần của tập huấn luyện, màu đỏ là phần của tập kiểm tra)
Bảng 3.3 Kết quả đánh giá nội và đánh ngoại mô hình QSAR
Mô hình đạt R² khoảng 1,0, cho thấy độ chính xác cao, trong khi Q² lớn hơn 0,5 chứng tỏ tính ổn định tốt Hơn nữa, khả năng dự đoán ngoại tại mức trên 0,6 cho thấy mô hình có khả năng dự đoán hoạt tính hiệu quả.
Như vậy mô hình thoả mãn các tiêu chí đánh giá nội và ngoại về độ chính xác, độ ổn định và khả năng dự đoán tốt
Cả hai mô hình đều có:
- R 2 > 0.6: mô hình có độ chính xác cao
- Q 2 > 0.5: thể hiện mô hình bền vững có khả năng dự đoán các thí nghiệm trong tương lai tốt
- Q 2 ext > 0.6 cho thấy mô hình có khả năng dự đoán ngoại tốt
Mô hình này đáp ứng đầy đủ các tiêu chí đánh giá cả nội và ngoại, bao gồm độ chính xác, độ ổn định và khả năng dự đoán hiệu quả, cho phép ứng dụng trong việc dự đoán hoạt tính sinh học của các hợp chất được thiết kế.
Tiêu chí 5 : Giải thích cơ chế của mô hình Ý nghĩa của các tham số phân tử trong 2 mô hình QSAR thể hiện ở Bảng 3.4 và
Bảng 3.4: Bảng ý nghĩa các của các tham số phân tử trong mô hình QSAR trên đích PPARγ
SM1_Dz(Z) Mô men phổ của bậc 1 từ ma trận
Barysz có trọng số bằng số nguyên tử
Mô tả dựa trên ma trận 2D
ATSC7s Trung tâm tự tương quan Broto-
Moreau của độ trễ 7 trọng số theo trạng thái I
Mô tả dựa trên ma trận 2D
GATS7s Tương quan tự động của độ trễ 7 trọng số theo trạng thái I
Mô tả dựa trên ma trận 2D
SpMax3_Bh(p) Giá trị lớn nhất n 3 của ma trận
Burden có trọng số phân cực
Eig11_EA(dm) Giá trị riêng n 11 từ giá trị cạnh kề trọng số kể từ thời điểm lưỡng cực
T(N F) Tổng khoảng cách tôpô giữa N F Cặp nguyên tử
B07[N-F] Sự hiện diện / vắng mặt của N - F ở khoảng cách tôpô 7
F08[O-F] Tần số O - F ở khoảng cách tôpô 8 Cặp nguyên tử
Bảng 3.5: Bảng ý nghĩa các của các tham số phân tử trong mô hình QSAR trên đích SGLT2
Eig09_EA(bo) Giá trị riêng n 9 từ giá trị cạnh kề trọng số theo thứ tự từ trài sang
Eig14_AEA(ed) giá trị riêng n 14 từ thời điểm tăng cường trọng số theo mức độ cạnh
C-015 = CH2 Các mảnh trung tâm nguyên tử
NaaaC Số nguyên tử loại aaaC Chỉ số nhà nước điện tử
B08[O-O] Sự hiện diện / vắng mặt của O - O ở khoảng cách tôpô 8
B10[N-S] Sự hiện diện / vắng mặt của N - S ở khoảng cách tôpô 10
F03[C-N] Tần số C - N ở khoảng cách tôpô 3 Cặp nguyên tử
2D F03[C-O] Tần số C - O ở khoảng cách tôpô 3 Cặp nguyên tử
Cả hai mô hình QSAR đều sử dụng 8 biến, chủ yếu là các tham số phân tử 2D, cho thấy tầm quan trọng của thông tin cấu trúc 2D trong việc quyết định hoạt tính sinh học của các cấu tử đối với PPARγ và SGLT2.
Các tham số có hệ số dương cho thấy khả năng tăng cường ức chế trên đích SGLT2, trong khi giảm khả năng ức chế trên đích PPARγ Chẳng hạn, B10[N-S] có thể nhận giá trị 1 hoặc 0 tùy thuộc vào sự hiện diện của khoảng cách giữa hai nguyên tử Nitơ và lưu huỳnh là 10 liên kết (C-C) Hệ số B10[N-S] mang dấu ( ), vì vậy nếu giá trị này bằng 0, hoạt tính ức chế trên SGLT2 sẽ tăng lên.
Mô hình này đáp ứng các tiêu chí đánh giá của OECD, cho phép ứng dụng vào việc dự đoán hoạt tính sinh học của các hợp chất được thiết kế.
3.2.2 Về các hợp chất đã sàng lọc theo hai mô hình QSAR đã xây dựng
Sau khi sàng lọc 758 hợp chất qua hai mô hình QSAR, chúng tôi đã xác định được 21 hợp chất có tác dụng sinh học tốt trên hai đích phân tử SGLT2 và PPARγ Các hợp chất này được kiểm tra khả năng tương thích với đích phân tử thông qua phương pháp Docking Kết quả từ bảng 3.6 chỉ ra giá trị Score tốt nhất của 21 hợp chất, trong đó giá trị Score càng nhỏ cho thấy khả năng liên kết với đích phân tử càng cao, tỷ lệ thuận với mức năng lượng.
Bảng 3.6 Giá trị Score của các hợp chất trong Docking trên 2 đích phân tử
STT Tên hợp chất Score_PPARγ Score_SGLT2
8 (S) -2- (4-Hydroxy-3- (3- metylbut-2-en-1-yl) phenyl) chroman-7-ol
3.2.3 Đánh giá lại tác dụng của các hợp chất đã sàng lọc qua mô hình máy tính in vivo
Kết quả từ phân tích Docking cho thấy 7-Hydroxyflavanone có khả năng liên kết mạnh mẽ với protein PPARγ, trong khi 4', 5-Dihydroxyflavone thể hiện khả năng gắn kết tốt nhất với mục tiêu SGLT2.
Bảng 3.7 Kết quả Docking của 4 hợp chất đã sàng lọc được trên đích PPARγ
Bảng 3.8 Kết quả Docking của 4 hợp chất đã sàng lọc được trên đích SGLT2
Một số thông tin về các hợp chất trong các tài liệu y văn:
Bảng 3.9 Một số thông tin về các hợp chất thu được sau quá trình sàng lọc
Tên hợp chất Dược liệu chứa hợp chất
Các hoạt tính đã được nghiên cứu TLTK
Zuccagnia puncata Cav (Fabace ae) Điều trị nhiễm trùng đường hô hấp mới
Spatholobus Suberectus Ức chế proteasome 20S [49]
4 ', 5-Dihydroxyflavone là chất ức chế men đậu nành LOX-1 và men α-Glucosidase, với Ki là 102,6 M đối với LOX-1 đậu nành và IC50 là 66 μM đối với men α- glucosidase
7-Hydroxyflavone là chất ức chế mạnh CYP1A1 với giá trị Ki là 0,015 M và thể hiện tính chọn lọc cao hơn gấp 6 lần đối với
CYP1A1 và CYP1A2 có những đặc tính đáng chú ý như chống oxy hóa, chống viêm và chống tăng sinh, cho thấy tiềm năng của chúng trong việc bảo vệ bệnh nhân nhiễm EV71 mạn tính 7-Hydroxyflavone có khả năng bảo vệ tế bào thận khỏi độc tính liên quan đến NIC thông qua các con đường ERK/Nrf2/HO-1, đồng thời cũng có tác dụng ức chế viêm do LPS gây ra.
38 gây ra thông qua việc làm giảm sản xuất NO, PGE2, TNF-α và IL-
Dihydrodaidzein Glycine max Dihydrodaidzein là một chất chuyển hóa estrogen hoạt động của daidzein
Dihydrodaidzein có liên quan đến nguy cơ mắc bệnh tiểu đường thấp hơn ở người và có tác dụng giãn mạch trên vòng động mạch chủ chuột ở nồng độ 1 μg/ml Nó cũng kích thích sự tăng trưởng phụ thuộc vào thụ thể estrogen của các tế bào ung thư vú MCF-7 ở nồng độ micromol Dihydrodaidzein được hình thành từ quá trình chuyển hóa daidzein trong đại tràng và có khả năng chuyển hóa thành các hợp chất hoạt tính sinh học khác nhau, bao gồm solol.
Từ các thông tin trên cho thấy, các nghiên cứu về khả năng điều trị ĐTĐ của
Bốn hợp chất này hiện vẫn chưa được nghiên cứu nhiều, trong đó chỉ có Dihydrodaidzein đã có một số tài liệu tham khảo Đặc biệt, tác dụng của chúng đối với hai mục tiêu SGLT2 và PPARγ vẫn chưa được khám phá Hơn nữa, các dược liệu chứa những hợp chất này khá phổ biến, cho thấy tiềm năng phát triển nguồn dược liệu lớn Đây là một kết quả mới mà luận văn này có thể tiếp tục phát triển.