Mối quan hệ định lượng cấu trúc-tác dụng QSAR và khả năng thẩm thấu qua da Mô hình QSAR thống kê sự liên hệ giữa hoạt tính sinh học của một loạt các hợp chất với tính chất hóa lý và hoặc
T Ổ NG QUAN
Thi ế t b ị Franz
1.1.1 Vai trò c ủ a thi ế t b ị Franz trong thí nghi ệm đo khả năng thẩ m th ấ u qua da
Thử nghiệm đo lường sự giải phóng thuốc là yếu tố quan trọng trong phát triển sản phẩm thuốc, cần xác định kỹ thuật phù hợp với dạng liều lượng và đường phân phối Trong 50 năm qua, thử nghiệm độ tan của thuốc đã được áp dụng cho các dạng thuốc rắn Gần đây, đối với sản phẩm thuốc bán rắn, thử nghiệm giải phóng thuốc in vitro (IVRT) đã trở thành phương pháp đánh giá tính giải phóng của thuốc Tỷ lệ giải phóng in vitro có thể phản ánh hiệu quả của nhiều thông số vật lý và hóa học, như độ hòa tan, kích thước hạt và đặc tính lưu biến của dạng liều.
Phương pháp IVRT phổ biến nhất sử dụng thiết kế buồng mở, điển hình là hệ thống khuếch tán Franz Phương pháp này có khả năng áp dụng với nhiều loại màng như màng tổng hợp, cấu trúc mô và mẫu sinh học, bao gồm cả da người.
Hình 1.1 Thiết bị Franz và chi tiết các bộ phận
Thiết bị Franz là những công cụ chuyên dụng được cấu tạo từ hai phần chính bằng thủy tinh borosilicate Phần trên, thường được gọi là nắp thiết bị hoặc buồng cấp, đóng vai trò quan trọng trong quá trình hoạt động Trong khi đó, phần dưới, hay còn gọi là buồng thụ thể, là nơi tiếp nhận và xử lý các mẫu vật.
Hình 1.2 Cấu tạo gồm hai phần chính của thiết bị Franz
Buồng trên, hay còn gọi là buồng cấp, được kết nối với buồng dưới (buồng thụ thể) thông qua một khớp Màng ngăn nằm giữa khớp, có chức năng thẩm thấu hoặc vận chuyển chất, và được giữ cố định bằng một chiếc kẹp.
Các thiết bị có vỏ bọc được kết nối với nguồn nước để kiểm soát nhiệt độ hiệu quả, trong khi các thiết bị không có vỏ có thể được đặt trong máy sấy khô hoặc bồn nước Mặc dù thiết bị có vỏ bọc có giá thành cao hơn, nhưng chúng được ưa chuộng hơn nhờ khả năng kiểm soát nhiệt độ dễ dàng.
Trong các thí nghiệm in vitro, thiết bị Franz thường kết hợp với máy khuấy V-Series Tuy nhiên, nếu chỉ sử dụng một thiết bị Franz đơn lẻ, người dùng vẫn có thể thay thế bằng máy khuấy thí nghiệm thông thường.
Tay lấy mẫu và ống dẫn của thiết bị Franz tiêu chuẩn được sản xuất từ ống có đường kính ngoài 6mm và độ dày thành 1,0mm Đường kính bên trong của ống đạt khoảng 4mm, theo dung sai mà nhà sản xuất quy định Các xi lanh có kích thước tương tự như kim tiêm, đảm bảo tính chính xác trong quá trình sử dụng.
1.1.3 Cách ho ạt độ ng c ủ a thi ế t b ị Franz
Các sản phẩm thử nghiệm được đặt trong buồng cấp, với màng ngăn tách biệt buồng chứa mẫu thử nghiệm và buồng thụ thể chứa đầy chất trung gian Phosphate Buffered Saline (PBS) thường là lựa chọn đầu tiên cho chất trung gian, mặc dù có thể không khả thi trong một số trường hợp Sự thẩm thấu của thuốc bán rắn qua màng được theo dõi bằng cách lấy mẫu từ buồng thụ thể theo thời gian và phân tích bằng HPLC Mỗi lần lấy mẫu, chất trung gian sẽ được bù vào, và mẫu được lấy từ buồng dưới theo các khoảng thời gian đều đặn Thử nghiệm nhằm xác định lượng thẩm thấu qua màng tại mỗi thời điểm, với buồng được duy trì ở nhiệt độ 37°C Khả năng thấm của từng chất có thể thay đổi đáng kể thông qua phân tích thiết bị Franz, từ 10 đến 50 lần Kết quả từ thiết bị Franz không nhất thiết dự đoán hiệu quả của cấu trúc, mà có thể xác định liệu cấu trúc đó có tác nhân hoạt động qua da hay không.
Tính th ấ m qua da
1.2.1 Khó khăn khi nghiên c ứ u kh ả năng th ẩ m th ấ u qua da
Lớp sừng là rào cản chính đối với khả năng thẩm thấu qua da, với sự xâm nhập của hợp chất phụ thuộc vào cấu trúc hóa học của nó Nhiều yếu tố khác cũng ảnh hưởng đến sự thẩm thấu qua da, bao gồm cách sử dụng hoặc tiếp xúc với các hợp chất trên bề mặt da, các phương pháp thay đổi tính chất rào cản của lớp sừng, quy trình diễn ra trong mô, và các yếu tố sinh học Lớp sừng, nằm ở bề mặt ngoài của da, bao gồm 10 đến 25 lớp tế bào chết chứa keratin, được bao quanh bởi một hệ thống ngoại bào giàu lipid.
Lớp sừng trên da có độ dày từ 7–16 µm ở hầu hết các vùng cơ thể, nhưng dày hơn từ 400–600 µm ở lòng bàn tay và bàn chân Lớp này chứa khoảng 40% protein, trong đó 80% là keratin Thành phần và lượng lipid trong lớp sừng thay đổi tùy theo từng khu vực trên cơ thể, điều này có thể ảnh hưởng đáng kể đến tính thấm qua da.
Nhiều nỗ lực đã được thực hiện để phát triển các phương pháp tiếp cận thực nghiệm đo lường sự hấp thu qua da Hầu hết dữ liệu hiện nay được thu thập từ các thí nghiệm in vitro, trong khi dữ liệu in vivo chủ yếu đến từ các xét nghiệm sinh học Tỷ lệ chuyển hóa qua da của các loại thuốc thường được nghiên cứu nhiều hơn thông qua các thí nghiệm in vitro, vì phương pháp này đơn giản hơn so với các phép đo lâm sàng.
Mức độ thẩm thấu có thể được đo bằng ba phương pháp chính: đầu tiên là sự chuyển hóa thuốc trong động vật hoặc người thử nghiệm; thứ hai là việc sử dụng da được cắt bỏ từ người hoặc động vật; và cuối cùng là áp dụng mô hình màng tổng hợp trong các thí nghiệm in vitro.
Da người có nguồn gốc từ nhiều nguồn khác nhau, bao gồm phẫu thuật thẩm mỹ và phẫu thuật cắt bớt, đã được sử dụng trong các thí nghiệm in vitro Da từ các loài động vật như lợn, chuột, rắn, và thỏ được lựa chọn làm thay thế cho da người Trong số đó, da lợn và chuột thường được sử dụng phổ biến nhất do có nhiều điểm tương đồng với da người Mặc dù da động vật cho thấy khả năng thẩm thấu hóa chất tốt trong nghiên cứu, nhưng nó vẫn thiếu sự phức tạp của lớp sừng ở da người.
1.2.2 Các phương pháp đánh giá khả năng thẩ m th ấ u c ủ a các ch ấ t hóa h ọ c qua da
Các phương pháp ex vivo và in vitro để kiểm tra tính thẩm thấu của da đã được thiết lập và công bố rộng rãi, được ứng dụng trong nhiều lĩnh vực nghiên cứu Da người từ các nguồn khác nhau, bao gồm phẫu thuật thẩm mỹ và phẫu thuật cắt bỏ, đã được sử dụng để đánh giá khả năng thẩm thấu qua da theo phương pháp ex vivo Ngoài ra, việc sử dụng da từ các loài động vật khác nhau cũng là một thành phần phổ biến trong các nghiên cứu thẩm thấu qua da trong thí nghiệm in vitro.
Da lợn, chuột, khỉ, rắn và một số loài khác được coi là những lựa chọn thay thế phù hợp cho da người Trong số đó, da lợn và chuột được sử dụng phổ biến nhất do có các rào cản tương tự, giúp thẩm thấu các phân tử gần giống với da người.
Mặc dù da động vật có khả năng cung cấp các đặc tính rào cản và thẩm thấu tương tự như da người, nhưng chúng không thể hoàn toàn thay thế tính chất phức tạp của da người, đặc biệt là đặc tính rào cản của lớp sừng Do đó, nhiều nhà nghiên cứu đã nỗ lực phát triển da nhân tạo với đặc điểm tương đương nhằm giảm thiểu những vấn đề này.
Một số loại da nhân tạo đã được áp dụng thành công trong cấy ghép da và điều trị phẫu thuật bỏng Da nhân tạo sở hữu các vùng ưa nước và kỵ nước, từ đó
Các mô hình tương đương với da người (LSEs) được sử dụng để đánh giá khả năng thẩm thấu qua da, bao gồm các màng da như biểu bì tái tạo từ nuôi cấy mô, đóng vai trò thay thế cho mô động vật Những mô này thường yếu hơn và có ít rào cản hơn so với da người do hàm lượng Ceramide 1 và 3 thấp hơn Mặc dù một số nghiên cứu cho thấy chúng có thể cung cấp đặc điểm thẩm thấu tương tự, nhưng trong nhiều trường hợp, chúng lại vượt quá ước lượng thấm qua da.
Khi không có da người hoặc động vật, màng tổng hợp như polydimethylsiloxan (PDMS) và cellulose axetat thường được sử dụng trong các thí nghiệm sàng lọc quy mô lớn Màng PDMS có đặc tính rào cản tương tự lớp sừng, trong khi cellulose axetat mô phỏng tính thẩm thấu của tế bào nhờ cấu trúc xốp giống như các đường nước trong da Tuy nhiên, các màng này thường làm tăng khả năng thẩm thấu của chất, dẫn đến việc sử dụng chúng bị hạn chế.
Bảy yếu tố rào cản xác định khả năng thẩm thấu qua da rất quan trọng Để đánh giá mối quan hệ giữa các phương pháp khác nhau, khả năng thẩm thấu tương đối của các màng cho cùng một hợp chất sẽ được so sánh Thực tế, dữ liệu so sánh cho mục đích này còn hạn chế Để giải quyết vấn đề này, mối quan hệ định lượng giữa cấu trúc và tác dụng có thể được sử dụng Các mối quan hệ định lượng cấu trúc-tác dụng (QSARs) cung cấp thông tin về khả năng thẩm thấu qua da của nhiều hóa chất ngoại sinh dựa trên các thông số hóa lý đã biết Tuy nhiên, cần lưu ý rằng có một số phản đối liên quan đến những hạn chế trong việc phát triển mô hình thống kê, điều này cần được cân nhắc kỹ lưỡng.
1.2.3 M ố i quan h ệ định lượ ng c ấ u trúc-tác d ụ ng (QSAR) và kh ả năng th ẩ m th ấ u qua da
Mô hình QSAR phân tích mối liên hệ giữa hoạt tính sinh học và các tính chất hóa lý hoặc cấu trúc của hợp chất Điều này cho phép xây dựng các mô hình dự đoán nhằm ước tính hoạt động sinh học của các chất Trong hơn một thế kỷ qua, nghiên cứu trong lĩnh vực này chủ yếu tập trung vào việc tối ưu hóa hoạt động thuốc và dự đoán độc tính Luận văn này hướng đến việc nghiên cứu khả năng thẩm thấu qua da của các chất.
Khả năng thẩm thấu của một hợp chất qua da được xác định thông qua nhiều phương pháp, trong đó định luật Fick đóng vai trò quan trọng, liên quan đến lưu lượng và hệ số thấm của chất.
Kp: Hệ số thẩm thấu
∆C m : Chênh lệch nồng độ giữa 2 bên của màng t: Độ dày của màng
1.2.4 Quá trình phát tri ể n c ủ a QSAR trong nghiên c ứ u tính th ấ m qua da
Trong hơn ba mươi năm qua, nhiều nghiên cứu đã được thực hiện để tìm hiểu tính thấm của các hợp chất qua da và mối liên hệ với các tính chất hóa lý của chúng Tuy nhiên, các mô hình dự báo định lượng (QSPR) thường không được áp dụng trong các nghiên cứu trước đây, mà chủ yếu dựa vào phân tích các chuỗi phân tử tương đồng Thông thường, chỉ có một số lượng nhỏ hợp chất được đánh giá, và nhiều nghiên cứu chỉ ra mối quan hệ tuyến tính giữa khả năng kỵ nước và độ thẩm thấu qua da, cho thấy rằng tính kỵ nước cao có thể làm tăng cường độ thẩm thấu Một số nghiên cứu khác lại chỉ ra mối quan hệ parabol giữa độ thẩm thấu và tính kỵ nước, đặc biệt với các hợp chất có tính kỵ nước cao Những phát hiện này cho thấy khả năng áp dụng các mô hình QSAR cho độ thẩm thấu qua da, với mỗi mô hình được thiết lập cho một nhóm hóa chất cụ thể hoặc một loạt hợp chất.
Tập dữ liệu Flynn (1990) và các phân tích QSAR sau đó:
T ổ ng quan v ề m ố i quan h ệ định lượ ng c ấ u trúc-tác d ụ ng c ủ a h ợ p ch ấ t (QSAR)
B ả ng 1.2 Các nghiên cứu về khảnăng thẩm thấu qua da của các hợp chất được công bố sau 1990
Tên tác giả Số chất R 2 Mô hình
Potts và Guy 93 0,67 Tuyến tính
Pugh và Hadgraft 24 0,935 Tuyến tính
Lien và Gao 22 0,96 Tuyến tính
Potts và Guy 37 0,94 Tuyến tính
Hostynek and Magee 20 0,80 Tuyến tính
Roy và cộng sự 60 0,64 Tuyến tính
Abraham và cộng sự 53 0,96 Tuyến tính
Gute và cộng sự 60 0,67 Tuyến tính
Minghetti và cộng sự 14 0,749 Tuyến tính
Dearden và cộng sự 91 0,83 Tuyến tính
Poulin và Krishnan 47 0,95 Mô hình dựa trên K p
Ghafourian và Fooladi 39 0,94 Tuyến tính
Gonzalez và Helguera 38 0,92 Tuyến tính
Pannier và cộng sự 37 0,97 Lôgic mờ
Pannier và cộng sự 54 0,95 Lôgic mờ
Degim và cộng sự 38 0,997 ANN
Moody và MacPherson 65 0,89 Tuyến tính
Majumdar và cộng sự 62 0,934 Tuyến tính
1.3 Tổng quan về mối quan hệ định lƣợng cấu trúc-tác dụng của hợp chất (QSAR)
1.3.1 Khái ni ệ m và nguyên lý chung c ủ a QSAR
QSAR là một hàm số thể hiện mối quan hệ định lượng giữa cấu trúc phân tử và hoạt tính sinh học hoặc hóa học của các hợp chất.
Y = f1(x1) + f2(x2) + + fn(xn) là công thức mô tả mối quan hệ giữa biến đáp ứng sinh học hoặc hóa học Y, thường được biểu thị bằng giá trị log Kp, trong đó Kp là hệ số thẩm thấu qua da Các biến x1, x2,… xn là các tham số phân tử (molecular descriptors) dùng để mô tả cấu trúc của hợp chất Hiện nay, đã có hàng ngàn tham số phân tử (TSPT) được áp dụng trong nghiên cứu xây dựng mô hình QSAR, được thu thập qua thực nghiệm hoặc tính toán lý thuyết bằng các phần mềm chuyên dụng như Dapt, Dragon, Padell, MOE và Hyperchem.
Từ năm 1868, Crum-Brown và Fraser đã đưa ra nhận định tác dụng sinh học là hàm số của cấu trúc hóa học:
f (C) Đến năm 1893, Richet đã rằng sự khác nhau về tác dụng sinh học là do sự thay đổi về tính chất hóa học hay lý hóa [33]:
f (C) Đây là hai tư tưởng nền tảng để thiết lập các mô hình QSAR sau này
Năm 1900, Meyer và Overton tìm ra mối quan hệ tuyến tính giữa mức độ thân dầu và hoạt tính của thuốc gây mê [29]
Và đến năm 1935, phương trình Hammett ra đời, được coi là phương trình đầu tiên biểu diễn mối quan hệđịnh lượng hoạt tính-cấu trúc [29]:
Với K, Ko là hằng số acid, là hằng số Hammett (thông sốhóa lý đặc trưng cho khả năng hút hoặc đấy điện tử của nhóm thế)
Từ những năm 1960, Corwin Herman Hansch đã bắt đầu nghiên cứu mô hình QSAR, một phương pháp hồi quy đa biến nhằm thể hiện mối quan hệ giữa hoạt tính sinh học và các thông số hóa lý Mô hình QSAR Hansch đã đóng góp quan trọng trong việc hiểu và dự đoán hoạt tính của các hợp chất hóa học.
Từ đó đến nay, số lượng nghiên cứu về xây dựng các mô hình QSAR đã tăng đột biến, với sự đa dạng trong các phương pháp xây dựng và ứng dụng mô hình này.
1.3.2 Xây d ựng và đánh giá mô hình QSAR
Mô hình QSAR được xây dựng và đánh giá gồm 5 bước như sau:
Bước 1: Chuẩn bịcơ sở dữ liệu
Cơ sở dữ liệu (CSDL) cho các mô hình QSAR bao gồm hoạt tính, độc tính và đặc tính dược động học của các hợp chất được công bố trong nghiên cứu khoa học, tạo thành một dữ liệu toàn cầu CSDL cho một mô hình QSAR cụ thể thường chứa cấu trúc phân tử của các chất và hoạt tính của chúng, chủ yếu là hoạt tính thu được qua thực nghiệm in vitro.
CSDL ban đầu được chia thành hai phần: tập huấn luyện và tập kiểm nghiệm Tập huấn luyện, chiếm 80-90% CSDL, được sử dụng để xây dựng mô hình QSAR, trong khi tập kiểm nghiệm được dùng để đánh giá hiệu quả của mô hình.
Bước 2: Tính toán tham số phân tử
Cấu trúc phân tử của hợp chất có thể được tạo ra bằng phần mềm như Chemdraw hoặc các công cụ tích hợp trong phần mềm QSAR chuyên dụng Từ những cấu trúc này, các tham số phân tử (TSPT) mô tả thông tin cấu trúc 1D, 2D và 3D của hợp chất sẽ được tính toán thông qua phần mềm máy tính.
Hiện nay, một số phần mềm phổ biến để tính toán các Tham số mô tả tính chất (TSPT) bao gồm Dragon, Padell, MOE và Hyperchem Sự phát triển của phương pháp QSAR đã dẫn đến việc tính toán ngày càng nhiều nhóm TSPT, giúp mô tả chi tiết và chính xác hơn cấu trúc của các hợp chất Phiên bản cập nhật Dragon 7.0 (2017) có khả năng tính toán lên đến 5270 TSPT.
Các TSPT có thểđược phân loại thành 3 nhóm như sau:
Tham số phân tử 1D bao gồm các thông số như khối lượng phân tử, số nhóm thế và số nguyên tử carbon, có thể thu được từ công thức tổng quát của hợp chất Ngoài ra, các tham số này cũng có thể được tính toán từ sự tổng hợp các nguyên tử thành phần, như chỉ số khúc xạ và độ phân cực Trong số đó, hệ số phân bố n-octal/nước là một tham số quan trọng, thường được sử dụng để đánh giá sinh khả dụng và khả năng thấm qua màng tế bào của hợp chất.
Tham số phân tử 2D là những tham số quan trọng giúp mô tả hình dạng và trật tự liên kết của các nguyên tử trong cấu trúc của hợp chất Các tham số này bao gồm số liên kết -, số vòng thơm và số liên kết H, cung cấp thông tin chi tiết về cấu trúc hóa học của hợp chất.
Tham số phân tử 3D là những chỉ số quan trọng mô tả cấu trúc không gian của hợp chất, được xác định thông qua hệ trục tọa độ của các nguyên tử thành phần Các tham số này bao gồm mô men lưỡng cực, diện tích bề mặt cực và thể tích van der Waals, đóng vai trò quan trọng trong việc hiểu rõ tính chất và hành vi của các phân tử.
Để xây dựng mô hình QSAR hiệu quả và đáng tin cậy, bước đầu tiên là xử lý dữ liệu ban đầu Quá trình này bao gồm việc loại bỏ các giá trị ngoại lai, chuẩn hóa đơn vị và chuyển đổi hàm thức như logarit hóa, mũ hóa hoặc nghịch đảo Những bước này giúp loại bỏ các yếu tố gây nhiễu, từ đó cải thiện độ chính xác của mô hình.
Bước 4: Xây dựng mô hình QSAR
Ngày nay, có nhiều phương pháp xây dựng mô hình QSAR được phát triển và ứng dụng rộng rãi Tuy nhiên, không có phương pháp nào được xác định là hiệu quả nhất cho tất cả các trường hợp Một phương pháp có thể phù hợp cho một mô hình QSAR cụ thể nhưng lại không đạt hiệu quả tương tự khi áp dụng cho các mô hình khác.
15 khác vì mỗi CSDL, mỗi mối quan hệ cấu trúc-hoạt tính sẽ có sự phụ thuộc khác nhau giữa biến TSPT và biến đáp ứng [15]
NGUYÊN LI ỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨ U
Cơ sở d ữ li ệ u
Cơ sở dữ liệu (CSDL): gồm 93 hợp chất lựa chọn từ dữ liệu trên các bài báo đãđược công bố [6, 9, 12, 16, 27, 30]
B ả ng 2.1 Giá trị log K p các hợp chất xây dựng mô hình QSAR
Phần mềm sử dụng
- Phần mềm vẽ cấu trúc hóa học: Marvin Sketch 17.27, ChemDraw Pro 8.0
- Phần mềm tính toán TSPT: Dragon 6.0
- Phần mềm xây dựng mô hình QSAR: MobyDigs Professional 1.1
- Phần mềm xử lý số liệu: SPSS 22.0, Excel 2010.
Phương pháp nghiên cứu
2.2.1 Tính toán tham số mô tả phân tử
Tham số mô tả phân tử là kết quả của quá trình chuyển đổi thông tin trong cấu trúc hóa học thành số đặc trưng cho phân tử Để tính toán, các cấu trúc trong CSDL được chuyển đổi thành hệ thống đơn giản hóa với đầu vào là dòng SMILES, sử dụng phần mềm ChemDraw Pro 8.0 Dựa trên mã code, 3764 mô tả phân tử thuộc họ 0D, 1D và 2D đã được tính toán bằng phần mềm Dragon phiên bản 6.0.
Tham số mô tả phân tử là các giá trị được tính toán thông qua quá trình toán học và lôgic, nhằm chuyển đổi thông tin được mã hóa trong cấu trúc hóa học Trong nghiên cứu này, các tham số này được tính toán bằng phần mềm Dragon.
Dragon là phần mềm nghiên cứu hóa tin và thiết kế thuốc, được phát triển bởi công ty Talete của Italia vào năm 1993, và hiện nay tính toán hơn 5000 TSPT khác nhau Các mô tả phân tử được phân loại theo chiều thông tin cấu trúc: (i) Tham số 0D mô tả thành phần cấu tạo, như số lượng nguyên tử C, N; (ii) Tham số 1D mô tả cấu trúc dưới dạng chuỗi, bao gồm vân tay cấu trúc và số lượng các mảnh cấu trúc; (iii) Tham số 2D mô tả cấu trúc hình học topo, xác định thứ tự và vị trí của nguyên tố trong phân tử, thường dựa trên lý thuyết graph; và (iv) Tham số 3D mô tả đặc điểm cấu trúc của phân tử trong không gian.
20 các phương pháp lý thuyết như MoRSE, GETAWAY, tính toán lượng tử, mô tả bề mặt hoặc thể tích phân tử
Trong nghiên cứu này, chúng tôi lựa chọn sử dụng tham số phân tử 2D để mô tả cấu trúc các hợp chất Việc áp dụng mô tả phân tử 2D mang lại lợi ích so với mô tả 3D, bởi vì nó không yêu cầu thông tin về cấu trúc 3D của phân tử Hơn nữa, mô tả 2D có tính ổn định cao hơn, do các hợp chất được mô tả dưới dạng 3D thường có độ linh động về cấu trúc.
2.2.2 Phân chia t ậ p hu ấ n luy ệ n / T ậ p ki ể m tra
Sau khi thực hiện tính toán mô tả phân tử, 93 chất trong cơ sở dữ liệu đã được chia ngẫu nhiên thành hai tập: tập huấn luyện (Tr - training set) và tập kiểm tra (Te - test set).
Tập huấn luyện gồm 77 chất, chiếm 83,8% cơ sở dữ liệu, được sử dụng để xây dựng mô hình và phát hiện mối quan hệ có khả năng dự đoán Trong khi đó, tập kiểm tra bao gồm các phân tử chưa từng được mô hình tiếp xúc, nhằm đánh giá độ mạnh và khả năng ngoại suy của các mô hình đã được xây dựng.
2.2.3 Xây d ự ng mô hình QSAR
Việc xây dựng các mô hình QSAR cho các nhóm chất và đích tác dụng khác nhau thường trải qua năm bước cơ bản, được tóm tắt trong hình 2.1 [40].
Hình 2.1 Các bước xây dựng mô hình QSAR
Tập huấn luyện bao gồm 83,8% hợp chất từ cơ sở dữ liệu được chọn ngẫu nhiên để phát triển mô hình QSAR, trong khi các hợp chất còn lại được phân loại vào tập kiểm nghiệm nhằm đánh giá hiệu quả của mô hình Các mô hình này được xây dựng dựa trên các phương pháp phân tích chuyên sâu.
Chuẩn bị cơ sở dữ liệu
Tính toán tham số phân tử
Xây dựng mô hình QSAR Đánh giá mô hình QSAR
Bài viết trình bày 21 phương pháp hồi quy đa biến tuyến tính (MLR) sử dụng phần mềm SPSS 22.0, kết hợp với việc lựa chọn TSPT thông qua thuật toán di truyền (Genetic algorithm) với phần mềm MobyDigs Professional 1.1 Cuối cùng, các mô hình được đánh giá để xác định mô hình tốt nhất.
Sử dụng phần mềm MobyDigs Professional 1.1 để lựa chọn tham số phân tử thông qua phương pháp thuật giải di truyền Tiếp theo, xây dựng mô hình QSAR trên tập huấn luyện bằng phương pháp hồi quy tuyến tính đa biến (MLR) với phần mềm SPSS 22.0 nhằm xác định mối tương quan giữa hoạt tính ức chế và các tham số mô tả phân tử từ Dragon.
Khi lựa chọn TSPT phù hợp, không cần đưa tất cả các biến vào mô hình, vì việc thêm biến độc lập chỉ có lợi khi chúng có mối liên hệ mạnh với biến phụ thuộc Mô hình tối ưu là mô hình có Q² cao nhất Để chọn các biến tối ưu, có thể sử dụng thuật giải di truyền thông qua phần mềm MobyDigs Professional 1.1.
Thuật giải di truyền áp dụng cơ chế chọn lọc tiến hóa tự nhiên, trong đó mỗi thế hệ tạo ra một tập hợp sinh vật mới bằng cách kết hợp những yếu tố phù hợp nhất với môi trường từ thế hệ trước, cùng với các đột biến ngẫu nhiên ở thế hệ mới Để thực hiện điều này, thuật toán sẽ mã hóa tất cả các tham số của cấu trúc ban đầu vào một nhiễm sắc thể, được biểu diễn dưới dạng một vector.
Từ nhiễm sắc thể ban đầu, một quần thể được tạo ngẫu nhiên và đánh giá Các nhiễm sắc thể thích nghi nhất, với hàm mục tiêu Q2 cao nhất, được chọn làm khung cho quần thể tiếp theo Quy trình này giúp tăng Q2 của toàn bộ nhiễm sắc thể bằng cách truyền các đặc tính cấu trúc thuận lợi giữa các quần thể Sau nhiều chu kỳ tìm kiếm và đánh giá, cuối cùng ta sẽ tìm ra một nhiễm sắc thể (mô hình) có giá trị Q2 cao nhất.
Các bước thực hiện thuật giải di truyền:
Khởi tạo quần thể ban đầu bằng cách sử dụng file.mdd, trong đó lưu trữ dữ liệu về tên và mô tả phân tử được tính toán qua phần mềm Dragon 6.0, cùng với giá trị log K p của các hợp chất trong tập huấn luyện.
(2): Xác định hàm mục tiêu (fitness) cho mỗi cá thể trong quần thể Hàm mục tiêu trong nghiên cứu này là giá trị Q 2
Tạo ra quần thể mới thông qua lai ghép chéo các cá thể hiện có và áp dụng quy trình chọn lọc, đồng thời kích thích các đột biến trong quần thể mới với xác suất nhất định Quá trình này được thực hiện bằng cách cài đặt giải thuật di truyền.
(4): Các cá thể trong quần thể mới được sinh ra thay thế cho các cá thể trong quần thể cũ.
(5): Nếu điều kiện dừng, giải thuật dừng lại và trả về cá thể tốt nhất cùng với giá trị hàm mục tiêu của nó
K Ế T QU Ả VÀ BÀN LU Ậ N
K ế t qu ả
3.1.1 Mô hình toán h ọc thu đượ c
Mô hình QSAR là một công cụ quan trọng trong việc xác định mối liên hệ định lượng giữa cấu trúc và hoạt tính của các hợp chất hóa học Được biểu diễn dưới dạng phương trình toán học, QSAR ứng dụng các TSPT, kỹ thuật thống kê và trí tuệ nhân tạo để xây dựng mô hình Giả thuyết cơ bản của QSAR là cấu trúc phân tử chứa các đặc điểm liên quan đến tính chất hóa học, vật lý và sinh học Nhờ vào mô hình QSAR, hoạt tính sinh học của các phân tử mới hoặc chưa được kiểm nghiệm có thể được suy ra từ cấu trúc của các hợp chất tương tự đã được kiểm nghiệm.
Phương pháp QSAR (Quantitative Structure-Activity Relationship) xây dựng các mô hình toán học để dự đoán hoạt tính của hợp chất dựa trên cấu trúc hóa học của chúng Kỹ thuật này cho phép dự đoán kết quả trước khi tiến hành thử nghiệm trong phòng thí nghiệm, cung cấp thông tin quan trọng về khả năng của các hợp chất Nhờ đó, QSAR giúp xác định các yếu tố liên quan, từ đó thiết lập thứ tự ưu tiên cho các chất mới trong quá trình thử nghiệm.
Các mô hình QSAR được phát triển dựa trên 93 hợp chất có trong cơ sở dữ liệu Cấu trúc hóa học của các hợp chất này được trình bày trong phụ lục, cùng với giá trị log Kp của 93 hợp chất.
CSDL trình bày tại bảng 2.1 cho thấy phần mềm Dragon 6.0 đã tính toán 3764 TSPT cho mỗi phân tử Sau khi loại bỏ các TSPT gây nhiễu, còn lại 1152 TSPT được kiểm tra mối quan hệ phi tuyến với biến đáp ứng log Kp Sử dụng chức năng lựa chọn ngẫu nhiên của phần mềm SPSS 22.0, 77 hợp chất được chọn vào tập huấn luyện, trong khi 16 hợp chất còn lại được chọn vào tập kiểm nghiệm Các mô hình QSAR được xây dựng trên tập huấn luyện bằng các phương pháp MLR và GA, cho kết quả đáng chú ý.
Kết quả mô hình MLR xây dựng được như sau:
Log K p = -2.49869 - 3.18926 x nR07 - 0.06478 x CATS2D_04_LL - 0.97246 x B03[O-O] + 1.25602 x B06[N-O] - 0.19308 x F02[C-N] + 0.50869 x MLOGP Đơn vị Kp: cm/h
Thông số thống kê của 10 mô hình tốt nhất được tóm tắt trong bảng 3.1
B ả ng 3.1 Thông số thống kê của các mô hình QSAR log K p
Ký hiệu mô hình R 2 Q 2 Q 2 ext
Cả 10 mô hình đều đạt yêu cầu thống kê với các chỉ số R², Q² và Q² ext Trong số đó, mô hình M2 nổi bật với độ chính xác và độ bền vững cao, thể hiện qua các giá trị R², Q² và Q² ext cao nhất, cho thấy khả năng đánh giá ngoại đáng tin cậy.
Thông số mô hình M2 tốt nhất:
Mô hình đạt R² = 0,84, cho thấy độ chính xác cao vượt mức yêu cầu tối thiểu 0,6 Q² = 0,79 chứng tỏ mô hình có độ ổn định tốt và khả năng dự đoán nội hiệu quả Ngoài ra, khả năng dự đoán ngoại đạt 73,56%, khẳng định mô hình có khả năng dự đoán hoạt tính tốt.
Như vậy mô hình thoả mãn các tiêu chí đánh giá nội và ngoại về độ chính xác, độổn định và khảnăng dự đoán tốt
3 1.3 Đánh giá mô hình theo 5 tiêu chí củ a OECD
Tiêu chí 1: Có đích cụ thể
Tiêu chí này nhằm đảm bảo rằng mô hình QSAR được xây dựng để dự đoán giá trị log Kp cho một tác dụng và hoạt tính cụ thể trong điều kiện nhất định Các mô hình này được áp dụng để dự đoán khả năng thẩm thấu qua da của các chất dựa trên cấu trúc phân tử, với giá trị Kp được đo bằng đơn vị cm/h.
Tiêu chí 2: Thuật toán rõ ràng
Tiêu chí này đảm bảo rằng mô hình QSAR được xây dựng dựa trên một thuật toán cụ thể, từ đó tính lặp lại của mô hình sẽ phụ thuộc vào điều kiện này.
Một số mô hình thương mại hóa không công bố thuật toán sử dụng, điều này có thể tạo ra rào cản pháp lý khi kết quả không thể được công bố độc lập Đánh giá các TSPT được tính toán bởi phần mềm Dragon 6.0 đã được liệt kê và định nghĩa đầy đủ Các mô hình này được xây dựng dựa trên thuật toán MLR, một thuật toán thống kê thường quy phổ biến trong xây dựng các mô hình QSAR.
Để đạt được khả năng dự đoán chính xác trong sàng lọc ảo, việc xác định miền cấu trúc ứng dụng của mô hình QSAR là rất quan trọng Miền ứng dụng này bao gồm khoảng không gian cấu trúc mà mô hình đã được xây dựng Chỉ những dự đoán liên quan đến các hợp chất có cấu trúc nằm trong miền này mới được coi là đáng tin cậy.
Miền ứng dụng được xác định dựa trên mối quan hệ giữa phần dư chuẩn và giá trị đòn bẩy (h) cho từng hợp chất Biểu đồ (Hình 3.1) minh họa mối liên hệ này, trong đó chỉ số h phản ánh ảnh hưởng của chất đến không gian cấu trúc của biến Giá trị giới hạn h*, được tính theo công thức h* = 3p/N (với p là số biến độc lập và N là số lượng quan sát), là ngưỡng quan trọng để tham chiếu các dự đoán của mô hình QSAR cho hợp chất trong Tr và Te Miền ứng dụng được xác định bởi khung vuông ± 3 phần dư chuẩn đối và h* bằng 0.6.
Standerized residuals (Te) Standerized residuals (Tr)
Stan d er iz e d R es idua ls
Mô hình QSAR được áp dụng để đánh giá các chất, cho thấy rằng sau khi tính toán tập huấn luyện, tất cả 77 hợp chất đều nằm trong miền ứng dụng Đối với tập kiểm tra, toàn bộ 16 hợp chất cũng nằm trong miền này.
27 nằm trong miền ứng dụng, do đó có thể thấy các dự đoán của mô hình đối với tập kiểm tra là hoàn toàn đáng tin cậy
Tiêu chí 4: Để đánh giá độ chính xác, độ bền vững và khả năng dự đoán của mô hình QSAR, cần có các thước đo phù hợp như R², Q², khả năng dự đoán nội và ngoại Các giá trị này được các nhà nghiên cứu QSAR khuyến nghị sử dụng để đảm bảo chất lượng mô hình Kết quả cho thấy các mô hình đã xây dựng không chỉ đạt yêu cầu thống kê với R² = 0.8438 và Q² = 0.7894, mà còn có độ chính xác cao trong dự đoán nội và ngoại với Q² ext = 0.7356.
Tiêu chí 5: Giải thích cơ chế tác dụng nếu có thể, là một tiêu chí không bắt buộc trong nghiên cứu QSAR Các nhà nghiên cứu QSAR nhận thấy rằng không phải lúc nào mô hình cũng cung cấp cơ chế tác dụng rõ ràng, nhưng điều này không làm giảm khả năng ứng dụng của mô hình Tiêu chí này chỉ nhằm đảm bảo rằng nếu mô hình có thể chỉ ra cơ chế tác dụng cụ thể, thì cần phải công bố cùng với mô hình đó Mục tiêu của nghiên cứu này là xây dựng các mô hình QSAR để dự đoán khả năng thẩm thấu qua da dựa trên cấu trúc phân tử, không nhằm phân tích cơ chế tác dụng.
Bàn lu ậ n
QSAR là một kỹ thuật hiện đại được áp dụng rộng rãi trong các lĩnh vực như dược phẩm, y học và hóa học Kỹ thuật này kết hợp các thông tin về cấu trúc phân tử, phương pháp thống kê và trí tuệ nhân tạo để phát triển các mô hình dự đoán Các mô hình này thường được xây dựng thông qua phương pháp hồi quy đa biến tuyến tính, giúp cải thiện độ chính xác trong việc phân tích và dự đoán các đặc tính của hợp chất hóa học.
Phương pháp giải thuật di truyền được áp dụng để chọn 28 tham số phân tử, giúp tối ưu hóa mô hình và tìm ra biểu thức tốt nhất cho mối quan hệ giữa biến đáp ứng và các tham số này.
Mô hình QSAR gặp một số hạn chế, bao gồm việc thu thập cơ sở dữ liệu từ nhiều bài báo khác nhau, dẫn đến khả năng sai số trong quá trình xây dựng mô hình Việc giải thích các biến TSPT cũng gặp khó khăn do cơ chế phức tạp, yêu cầu kiến thức chuyên sâu về hóa lượng tử Hơn nữa, tài liệu tham khảo hiện tại còn hạn chế, chưa đủ để cung cấp cơ sở giải thích đầy đủ.
Phương pháp này gặp nhược điểm khi chỉ khai thác mối tương quan tuyến tính giữa cấu trúc hóa học và tác dụng sinh học của các hợp chất, trong khi thực tế mối tương quan có thể phi tuyến tính Một số nghiên cứu đã chỉ ra rằng việc khai thác mối tương quan phi tuyến tính về tính thấm qua da mang lại kết quả tích cực.
Tại Việt Nam, lần đầu tiên các mô hình QSAR dự đoán khả năng thẩm thấu qua da dựa trên cấu trúc phân tử đã được xây dựng và đánh giá Những nghiên cứu này không chỉ đảm bảo tính chính xác và bền vững mà còn đáp ứng các tiêu chí do Tổ chức Hợp tác và Phát triển Kinh tế thế giới (OECD) đề ra cho việc đánh giá mô hình QSAR.
Mô hình log K p thu được sau quá trình tính toán:
Log Kp = -2.49869 - 3.18926 x nR07 - 0.06478 x CATS2D_04_LL - 0.97246 x B03[O-O] + 1.25602 x B06[N-O] - 0.19308 x F02[C-N] + 0.50869 x MLOGP
Mô hình QSAR sử dụng 6 biến, tất cả đều là các tham số phân tử 2D, giúp biểu diễn cấu trúc của các phân tử dựa trên kích thước, độ phân nhánh và hình dạng tổng thể Các tham số này bao gồm nR07, CATS2D_04_LL, B03[O-O], B06[N-O], F02[C-N] và MLOGP.
nR07: Số vòng 7 cacbon có trong hợp chất
CATS2D_04_LL: CATS2D Lipophilic-Lipophilic tại khoảng cách tôpô
B03[O-O]: Sự hiện diện / vắng mặt của liên kết O-O tại khoảng cách tôpô 3
B06[N-O]: Sự hiện diện / vắng mặt của liên kết N-O tại khoảng cách tôpô 6
F02[C-N]: Tần số C - N ở khoảng cách tôpô 2
MLOGP: Hệ số phân chia octanol –nước Moriguchi
Các dấu (+) trong TSPT B06[N-O] và MLOGP cho thấy sự hiện diện của nhiều liên kết N-O, cùng với hệ số phân chia octanol-nước Moriguchi, có thể tăng khả năng thẩm thấu qua da của hợp chất Tuy nhiên, hệ số trung bình của TSPT MLOGP (0.50869) không phải là yếu tố quyết định ảnh hưởng đến log Kp và kết quả của mô hình.
Các dấu (-) ở các TSPT nR07, CATS2D_04_LL, B03[O-O], và F02[C-N] cho thấy rằng biến gắn với tham số âm ảnh hưởng ngược chiều tới giá trị log Kp Số liên kết N-C với hệ số nhỏ (-0.19308) có tác động ít nhất lên tính thấm, trong khi hợp chất có vòng chứa 7 carbon lại có hệ số rất cao.
Hệ số phân bố dầu nước Log (3.18926) có ảnh hưởng mạnh mẽ đến tính thấm của các hợp chất Điều này một phần do khả năng phân cực của các vòng thơm, với mật độ electron cao dễ gây phân cực trong phân tử Bản chất không phân cực của màng phospholipid da khiến cho các hợp chất này khó thẩm thấu qua màng.
K p lại là một chỉ số của khả năng thân dầu, một hợp chất có tính thân dầu sẽ dễ dàng thấm qua màng
3.2.3 So sánh v ớ i các mô hình khác trên th ế gi ớ i
Mô hình nghiên cứu được xây dựng theo các nguyên tắc của OECD đạt R² = 0.84 và Q² = 0.79, cho thấy khả năng dự đoán ngoại đạt 73,56% Điều này chứng tỏ mô hình đáp ứng đầy đủ các tiêu chí về độ chính xác, độ ổn định và khả năng dự đoán hiệu quả.
Mô hình nghiên cứu này sở hữu một lượng hợp chất lớn trong cơ sở dữ liệu, vượt trội hơn so với nhiều mô hình đã được công bố trước đây, như thể hiện trong bảng 1.2 Điều này chứng tỏ tính khái quát và khả năng dự đoán của mô hình đối với nhiều hợp chất khác nhau Với tỷ lệ dự đoán ngoại đạt 73,56%, mô hình có tiềm năng ứng dụng trong phát triển thuốc điều trị qua da, điều trị tại chỗ và các sản phẩm hóa mỹ phẩm.
KẾT LUẬN VÀ KIẾN NGHỊ
Từ những kết quả nghiên cứu đã trình bày trên đây chúng tôi rút ra các kết luận sau:
Nghiên cứu đã phát triển một mô hình toán học hiệu quả để biểu diễn mối quan hệ định lượng giữa cấu trúc hóa học và khả năng thẩm thấu qua da, dựa trên phân tích 93 hợp chất từ cơ sở dữ liệu.
Mô hình đạt R² = 0.84 và Q² = 0.79, với khả năng dự đoán ngoại đạt 73,56%, cho thấy tính chính xác, ổn định và khả năng dự đoán cao Mô hình này hoàn toàn tuân thủ các nguyên tắc của OECD và có tính ứng dụng cao.
So với các mô hình khác trên thế giới, lượng dữ liệu của mô hình này rất lớn, vượt trội hơn hầu hết các nghiên cứu trước đây Điều này giúp mô hình có tính ứng dụng và khái quát cao hơn.