1. Trang chủ
  2. » Luận Văn - Báo Cáo

Sàng lọc in silico các chất chủ vận thụ thể dopamin d2

137 6 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 137
Dung lượng 4,55 MB

Cấu trúc

  • MỤC LỤC

  • DANH MỤC KÍ HIỆU, CHỮ VIẾT TẮT

  • DANH MỤC BẢNG

  • DANH MỤC HÌNH VẼ

  • ĐẶT VẤN ĐỀ

  • Chương 1. TỔNG QUAN TÀI LIỆU

    • 1.1 Bệnh liên quan đến chất chủ vận dopamin

      • 1.1.1 Bệnh Parkinson

      • 1.1.2 Tăng prolactin máu

      • 1.1.3 Bệnh Alzheimer

    • 1.2 Thụ thể dopamin

    • 1.3 Thụ thể dopamin 2

      • 1.3.1 Cấu tạo

      • 1.3.2 Các acid amin quan trọng

    • 1.4 Dopamin

    • 1.5 Định lượng hoạt tính sinh học

      • 1.5.1 Thu nhận beta-arrestin (β-arrestin tango)

      • 1.5.2 Gắn kết [35S]GTP(S

    • 1.6 Thiết kế thuốc với sự trợ giúp của máy tính

      • 1.6.1 Pharmacophore

      • 1.6.2 QSAR

      • 1.6.3 Docking

      • 1.6.4 ADME

      • 1.6.5 Sàng lọc ảo

      • 1.6.6 Mô phỏng động học phân tử

    • 1.7 Các nghiên cứu đã thực hiện

  • Chương 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU

    • 2.1 Đối tượng nghiên cứu

      • 2.1.1 Cấu trúc tinh thể

      • 2.1.2 Thuốc chủ vận

    • 2.2 Công cụ nghiên cứu

    • 2.3 Mô hình 3D-pharmacophore

      • 2.3.1 Cách tiến hành

      • 2.3.2 Đánh giá mô hình

    • 2.4 Mô hình QSAR

      • 2.4.1 Mô hình toán QSAR PLS

      • 2.4.2 Cách tiến hành QSAR PLS

      • 2.4.3 Đánh giá mô hình QSAR PLS

      • 2.4.4 Mô hình toán BQSAR

      • 2.4.5 Cách tiến hành BQSAR

    • 2.5 Mô hình docking phân tử

      • 2.5.1 Cách tiến hành

      • 2.5.2 Đánh giá mô hình

    • 2.6 Mô hình ADME

    • 2.7 Sàng lọc ảo

    • 2.8 Mô phỏng động học phân tử

      • 2.8.1 Cách tiến hành

      • 2.8.2 Đánh giá mô hình

        • 2.8.2.1 RMSD

        • 2.8.2.2 RMSF

        • 2.8.2.3 Phần trăm liên kết hydro

  • Chương 3. KẾT QUẢ VÀ BÀN LUẬN

    • 3.1 Thu thập và xử lý dữ liệu

    • 3.2 Mô hình QSAR PLS

    • 3.3 Mô hình QSAR nhị phân

    • 3.4 Mô hình docking

    • 3.5 Mô hình 3D pharmacophore

      • 3.5.1 Phối tử chủ vận

      • 3.5.2 Phức hợp với phối tử đối vận

      • 3.5.3 Phối tử đối vận

      • 3.5.4 Đánh giá các mô hình

    • 3.6 Mô hình ADME

    • 3.7 Sàng lọc ảo

    • 3.8 Mô phỏng động học phân tử

      • 3.8.1 Mô hình protein D2RN

      • 3.8.2 Phần trăm liên kết hydro

      • 3.8.3 ZINC09442049

      • 3.8.4 ZINC05857468

      • 3.8.5 TCM30487

      • 3.8.6 DB07889

      • 3.8.7 DB06152

    • 3.9 Bàn luận

      • 3.9.1 Mô hình QSAR

      • 3.9.2 Mô hình 3D pharmacophore

      • 3.9.3 Mô hình docking và sàng lọc ảo

      • 3.9.4 Mô phỏng động học phân tử

  • Chương 4. KẾT LUẬN VÀ KIẾN NGHỊ

  • TÀI LIỆU THAM KHẢO

  • PHỤ LỤC

Nội dung

ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU

Đối tượng nghiên cứu

The Protein Data Bank (PDB) contains four X-ray crystal structure complexes of the human dopamine receptor 2 Among them, 5AER represents the structure of the NCS1 (Neuronal Calcium Sensor-1) complex in Rattus norvegicus (brown rat) and the dopamine receptor 2 in Homo sapiens.

Cấu trúc 6CM4 đại diện cho thụ thể dopamin 2 kết hợp với thuốc chống loạn thần không điển hình risperidon, trong khi 6VMS là phức hợp giữa protein G và thụ thể dopamin 2 Ngoài ra, 6LUQ thể hiện phức hợp giữa haloperidol và thụ thể dopamin 2 Thông tin chi tiết về các cấu trúc tinh thể này có thể được tham khảo trong Bảng 2.1.

Bảng 2.1 Các cấu trúc tinh thể liên quan thụ thể dopamin 2

Tinh thể Độ phân giải (Å)

Thành phần Độ dài thụ thể

6CM4 2,87 Chimera của thụ thể dopamin 2 và endolysin, risperidon, acid oleic, dihydroxyether

The article discusses various proteins and their roles, including the 6VMS 3.80 dopamine receptor 2 and endolysin, as well as guanine nucleotide-binding proteins such as the α1 subunit of Gi, β1 subunit of Gi/Gs/Gt, and γ2 subunit of Gi/Gs/Go Additionally, it mentions scFv16 and bromoergocryptine, highlighting their significance in biochemical processes.

6LUQ 3,10 Chimera của thụ thể dopamin 2 và endolysin, haloperidol, acid oleic

5AER 2,19 thụ thể dopamin 2, NC1, Ca, K 430-443 2/2015

Sáu thuốc chủ vận thụ thể dopamin 2 đã được đưa ra thị trường với cấu trúc được trình bày như trong Hình 2.1

Hình 2.1 Công thức các thuốc chủ vận thụ thể dopamin 2.

Công cụ nghiên cứu

VGA GP107 [GeForce GTX 1050 Ti]

Windows 10 Pro 64 bit, Ubuntu 18.04 LTS

Các phần mềm sử dụng trong luận văn được trình bày ở Bảng 2.2

Bảng 2.2 Các phần mềm được sử dụng trong luận văn

Phần mềm - phiên bản Hãng/tổ chức Ứng dụng

ChemDraw 18.1 PerkinElmer Vẽ cấu trúc hóa học

Inte: Ligand GmbH Mô hình pharmacophore

Mô hình 2D QSAR, Chuẩn bị protein Sybyl 2.0.0.11273 Tripos- certera Chuẩn bị ligand

Rapidminer GmbH Mô hình 2D QSAR

Weka 3.8 Đại học Waikato Mô hình 2D QSAR

Microsoft Excel 2019 Microsoft Mô hình 2D QSAR

LeadIT 2.1.8 BioSolveIT GmbH Mô hình docking

Minh họa phức hợp protein và phối tử Maestro Version 11.8.012

Schrӧdinger Mô hình ADME

Gromacs version 2020.2 Đại học Uppsala, Đại học

Stockholm, Viện công nghệ hoàng gia Thụy Điển

Mô phỏng động học phân tử

Xmgrace 5.1.25 Nhóm phát triển Grace Vẽ biểu đồ

Mô hình 3D-pharmacophore

2.3.1 Cách tiến hành Để tạo mô hình từ phối tử, tại tab Ligand-Based của phần mềm LigandScout, chọn Ligand-Set/Add Molecules/To Training-Set, nhập tập xây dựng vào phần mềm Sau đó, chọn Ligand-Set/Create Pharmacophore, cài đặt các tùy chọn như sau:

- Pharmacophore type: Shared feature pharmacophore

- Max number of results phamacophore: 200

- Conformer Generation Settings: Apply BEST Setting

- Các thông số khác để mặc định

Kết quả sẽ cho ra 200 mô hình pharmacophore, nhưng do có nhiều mô hình trùng lặp, chỉ những mô hình khác nhau sẽ được chọn Để tạo mô hình từ phức hợp, người dùng cần chọn phối tử mong muốn và nhấn Ctrl F9.

Việc đánh giá các mô hình đã xây dựng là cần thiết để chọn ra mô hình tối ưu nhất, có khả năng dự đoán chính xác nhất trên tập fit (tập hoạt tính) và non-fit (tập không hoạt tính và tập decoy).

TP: những chất có hoạt tính thật và thỏa mãn mô hình pharmacophore, là số hit sàng lọc được trong tập fit

FN: những chất có hoạt tính thật và không thỏa mô hình pharmacophore

FP: những chất không hoạt tính thật và thỏa mô hình pharmacophore, là số hit sàng lọc được trong tập non fit

TN: những chất không hoạt tính thật và không thỏa mô hình pharmacophore [52]

Số lượng chất trong tập fit chính là TP+FN, tập not fit là TN+FP

Mô hình nhị phân tập trung vào các thông số quan trọng, trong đó Se (độ nhạy) là chỉ số đo lường tỷ lệ các hợp chất có hoạt tính thực sự được lựa chọn trong quá trình sàng lọc.

Sp: độ đặc hiệu, là số đo tỷ lệ các chất thực sự không hoạt tính bị loại bỏ chính xác trong sàng lọc [11]

Acc: Độ đúng, mô tả tỷ lệ phần trăm của các phân tử được phân loại chính xác bởi quy trình sàng lọc [11]

𝑇𝑃 + 𝐹𝑃 + 𝐹𝑁 + 𝑇𝑁 Ya: Hiệu suất hoạt tính, biểu thị mối liên quan giữa số chất có hoạt tính thực sự và tổng số hit [11]

Điểm GH kết hợp độ nhạy, độ đặc hiệu và hiệu suất hoạt tính, là một chỉ số quan trọng để đánh giá sự phân biệt giữa các mô hình pharmacophore Chỉ số này xem xét cả tỷ lệ chất có hoạt tính thực sự và tỷ lệ chất không hoạt tính thực sự, trong đó số lượng chất có hoạt tính thường được trọng số cao hơn so với chất không hoạt tính trong tổng số hit.

Mô hình QSAR

2.4.1 Mô hình toán QSAR PLS

PLS (Partial Least Squares) là một mô hình hồi quy nhằm phân tích mối quan hệ giữa các biến độc lập và biến phụ thuộc Mỗi phân tử được mô tả bằng một vectơ n số thực, trong đó xi là vectơ các thông số của phân tử i Kết quả thí nghiệm cho mỗi phân tử, ký hiệu là yi, có thể là các chỉ số như hoạt tính sinh học hoặc logP Mỗi phân tử cũng có trọng số quan trọng w_i, là một số thực không âm, thể hiện xác suất tương đối mà phân tử đó sẽ xảy ra Mặc dù thường các trọng số này bằng nhau (bằng 1), nhưng trong một số ứng dụng, trọng số không đều có thể được áp dụng Tổng của tất cả các trọng số được ký hiệu là W.

Mô hình tuyến tính cho biến y có dạng a0 + a T x, trong đó a0 là một hằng số và a là một vectơ n Các tham số a0 và a được tối ưu hóa để giảm thiểu hàm trung bình bình phương lỗi (MSE).

Bằng cách phân biệt MSE với các tham số, có thể chỉ ra rằng các tham số cần phải thỏa mãn các phương trình được gọi là phương trình chuẩn.

Xây dựng ma trận trọng số VA = (v1, v2, , vA) với vi là các vectơ cột có độ dài n và A, trong đó A là mức độ phù hợp của PLS, là một số nguyên nhỏ hơn hoặc bằng n Các cột của VA được thu được thông qua việc trực giao hóa các Gram-Schmidt từ vectơ được tạo bởi chuỗi Krylov (b, Sb, S^2b, , S^(A-1)b).

2.4.2 Cách tiến hành QSAR PLS

Các chất chủ vận có cấu trúc hóa học được biểu diễn dưới dạng 2D và giá trị EC50 được chuyển đổi sang pEC50, sau đó được đưa vào cơ sở dữ liệu và tối thiểu hóa năng lượng Tiếp theo, các thông số mô tả được tạo ra và loại bỏ theo các tiêu chí như: i) thông số có hơn 20% giá trị bằng 0; ii) thông số trùng nhau hơn 50%; iii) thông số có tương quan lớn hơn 0,4 Các thông số mô tả được chuẩn hóa từ 0 đến 1 để giảm thiểu sự tương quan và ảnh hưởng đến giá trị hoạt tính sinh học Phương trình QSAR được xây dựng bằng thuật toán PLS, loại nhiễu qua PCA và Z-score Dữ liệu được chia thành hai tập: tập xây dựng (80%) và tập kiểm tra (20%), thực hiện qua phân chia ngẫu nhiên và đa dạng Cuối cùng, mô hình QSAR được đánh giá bằng hệ số tương quan (R²), RMSE, và các phương pháp đánh giá khách quan như bỏ-một-ra (LOO) và đánh giá ngoại.

Quy trình thực hiện mô hình này được trình bày như trong Hình 2.2

Chuẩn bị cơ sở dữ liệu cấu trúc 2D, pEC50, tối thiểu hóa năng lượng, tính thông số mô tả trong MOE

Lựa chọn, chuẩn hóa thông số mô tả

Chia và đánh giá tập dữ liệu

Chia tập train và test, đánh giá nội, ngoại Đánh giá mô hình

Xây dựng phương trình sơ bộ

Hình 2.2 Quy trình xây dựng mô hình 2D-QSAR

2.4.3 Đánh giá mô hình QSAR PLS

Phương pháp đánh giá là yếu tố quan trọng để xác định tính dự đoán của mô hình trên dữ liệu không rõ và đánh giá độ phức tạp của phương trình Việc sử dụng dữ liệu từ mô hình đã tạo ra (phương pháp nội) hoặc một bộ dữ liệu riêng biệt (phương pháp ngoại) có thể hỗ trợ trong việc đánh giá mô hình QSAR Trong số các phương pháp, phương pháp ngoại được coi là tốt nhất để đánh giá mô hình.

Viêc đánh giá mô hình được minh họa như trong Hình 2.3 Đánh giá mô hình QSAR (MLP và PLS) Đánh giá nội (tập train) Đánh giá ngoại (tập test)

Hình 2.3 Những bước khác nhau của đánh giá mô hình QSAR [77] Đánh giá nội

Giá trị bình phương hệ số tương quan được tính toán sẵn trong MOE với công thức như sau:

𝑛 𝑉𝑎𝑟(𝑦 𝑒𝑖 ) Trong MOE, giá trị RMSE được tính toán theo công thức sau:

𝑛 Bình phương hệ số tương quan đánh giá chéo được tính theo công thức [45]:

Ngoài ra, người ta còn xem xét |R 2 - Q 2 | vì có liên quan đến hiện tượng quá khớp

Trong nghiên cứu này, n đại diện cho số lượng chất trong tập huấn luyện, ye là giá trị pEC50 thu được từ thực nghiệm, yc là giá trị pEC50 được tính toán từ phương trình, và yv là giá trị pEC50 tính toán từ các phương pháp đánh giá nội bộ như LOO, LNO và ngẫu nhiên y.

𝑦̅ là giá trị trung bình pEC50 thực nghiệm, 𝑒

2.4.4 Mô hình toán BQSAR Đặt (yi, Li) là kết quả m của thí nghiệm trên mục tiêu chung trong đó yi là 0 hoặc 1 (có thể là không hoạt tính hoặc hoạt tính) và Li là một phân tử Lưu ý là dữ liệu hoạt tính liên tục có thể được thực hiện nhị phân bằng cách sử dụng tiêu chí ngưỡng Có một ánh xạ, D, từ các phân tử đến các vectơ n thực tương ứng với tính toán của một bộ n thông số mô tả phân tử; cho xi = D (Li) Y biểu thị một biến ngẫu nhiên có giá trị 0 hoặc 1 và X = (X1,…,Xn) biểu thị một biến ngẫu nhiên trên vectơ n (một phân tử ngẫu nhiên) [9]

Phương pháp cơ bản để xác định xác suất một phân tử L mới có hoạt tính là sử dụng phân phối có điều kiện Pr (Y | X) Cụ thể, xác suất này được biểu diễn là Pr (Y = 1 | X = D (L)) Để làm rõ hơn, chúng ta cũng cần xem xét xác suất trước Pr (Y = 1) và định nghĩa hàm f(x, y) = Pr (X = x | Y = y) Nhờ vào Định lý Bayes, chúng ta có thể viết lại công thức này một cách chính xác hơn.

𝑓(𝑥, 1)𝑎 + 𝑓(𝑥, 0)(1 − 𝑎) và khi sắp xếp lại chúng ta có [9]:

Chúng ta có thể mô hình hóa từng phân phối fj (x, y) cho y trong tập hợp [0,1] và j trong tập hợp [1,n] Đối với mỗi thông số mô tả, cần ước tính hai phân phối: một cho các phân tử hoạt tính trong tập huấn luyện và một cho các phân tử không hoạt tính Như vậy, chúng ta tiến tới việc dự toán.

Các xem xét trên đề xuất quy trình tính toán sau [9]:

1 Đối với mỗi phân tử trong tập dữ liệu thực nghiệm, hãy tính di = D (Li)

2 Thực hiện phân tích thành phần chính để tạo ra ma trận Q và vectơ u sao cho ma trận hiệp phương sai của tập hợp xi = Q (di-u) là ma trận đơn vị

3 Ước tính các tham số của mô hình xác suất, p, từ tập hợp (yi, xi)

4 Xác suất để một phân tử L mới hoạt tính được ước tính là p(Q(D(L) -u))

Mô hình BQSAR xử lý dữ liệu để thu được các thông số mô tả tương tự như QSAR PLS, được xây dựng trong phần mềm MOE với chất đối chiếu là dopamin Trong MOE, các phối tử được lưu trữ trong file *.mdb và phân loại thành hai nhóm: hoạt tính (1) và không hoạt tính (0) Sử dụng công cụ QSAR Model với phương pháp nhị phân, các thông số mô tả được xử lý để dự đoán hoạt tính của hợp chất, với giá trị từ 0 đến 1, thể hiện xác suất thuộc về tập con hoạt tính Các hợp chất có giá trị dự đoán trên 0,5 được coi là có hoạt tính Mô hình sau đó được đánh giá chéo, đánh giá bỏ-một-ra và y ngẫu nhiên, với các chỉ số như độ đúng, độ nhạy, độ đặc hiệu và điểm GH Điểm GH, kết hợp các yếu tố này, là chỉ số hữu ích để phân biệt các mô hình, với giá trị từ 0 đến 1, trong đó giá trị 1 cho thấy mô hình rất tốt.

Mô hình docking phân tử

Quá trình trong MOE bắt đầu bằng việc loại bỏ các phân tử nước và các phối tử không cần thiết như OLA và PEG, để giữ lại chuỗi protein và phối tử thông qua Sequence Editor Tiếp theo, cấu trúc được sửa chữa, proton hóa, tính toán điện tích riêng phần, và tối ưu hóa hình học, đồng thời thực hiện tối thiểu hóa năng lượng với gradient 0,0001 kJ/mol bằng công cụ QuickPrep.

Sử dụng công cụ QuickPrep để chuẩn bị cấu trúc 3D protein và proton hóa với các thiết lập như sau:

- Cố định (Tether – Receptor): Strength: 5.000

- Các thông số khác để mặc định, lưu phức hợp đã được chuẩn bị dưới dạng file *pdb

- Bước 1: tối thiểu hóa năng lượng lần 1, chọn Compute/Minimize/Molecule, thiết lập thông số như sau:

+ Termination: Energy Change = 0,0001 kcal/mol

+ Các thông số khác để mặc định

- Bước 2: tiến hành chạy động học phân tử bằng công cụ Compute/Dynamics/Setup Smilated Annealing, chọn Run = 5 và các thông số khác để mặc định, OK

- Bước 3: tối thiểu hóa năng lượng lần 2 giống như bước 1, lưu lại dưới dạng *mol2

Quá trình này được tiến hành trong LeadIT

Bước đầu tiên trong quá trình docking là chuẩn bị túi gắn kết bằng công cụ Prepare receptor Bạn cần tải protein đã chuẩn bị trước bằng phần mềm MOE dưới định dạng *.pdb, sau đó chọn chuỗi protein tương tác với phối tử và phối tử tham chiếu Khoảng gắn kết mặc định là 6,5 Å tính từ phối tử tham chiếu, nhưng đối với các phân tử cồng kềnh, bạn có thể tăng giá trị này Lưu ý rằng việc tăng giá trị có thể làm giảm độ chính xác của mô hình mô tả phân tử docking Sau khi hoàn tất chuẩn bị, màn hình sẽ hiển thị vùng khoang gắn kết được sử dụng cho quá trình docking.

Bước 2: Chọn phối tử cho quá trình docking bằng công cụ Docking Tải tệp tin bằng định dạng *.mol2 hoặc *.sdf Tệp tin *.sdf chứa các phối tử đã được tối thiểu hóa năng lượng hai lần, và sẽ được sử dụng để chuẩn bị cho quá trình docking.

Bước 3: Xác định các thông số cho quá trình docking bằng công cụ Docking/ Define FlexX Docking:

Để tối ưu hóa quá trình docking, chúng ta nên giữ lại 10 cấu dạng tốt nhất, được xác định bởi điểm số docking âm nhất Điểm số này phản ánh tổng năng lượng tiêu thụ cho các tương tác gắn kết giữa phân tử hợp chất và mục tiêu tác động Trong phần chi tiết docking, hãy thiết lập số kết quả tối đa cho mỗi lặp lại là 1000 và cho mỗi phân mảnh là 200, trong khi các thông số khác giữ nguyên ở chế độ mặc định.

2.5.2 Đánh giá mô hình Để đánh giá mô hình docking phân tử, người ta dùng điểm số chức năng Điểm số chức năng là trái tim của mô hình docking phân tử bằng cách hỗ trợ chương trình docking khám phá hiệu quả túi gắn kết của một ligand Nó cũng chịu trách nhiệm đánh giá ái lực gắn kết một khi các cấu dạng gắn kết chính xác được xác định Điểm số chức năng có thể được phân loại thành ba loại: (a) Điểm số chức năng dựa trên trường lực để tính toán các tương tác mục tiêu phối tử không liên kết, như Van Der Waals và năng lượng tĩnh điện Chúng thường có thêm thuật ngữ GB/SA hoặc PB/SA để giải thích cho các hiệu ứng solvat (b) Điểm số chức năng thực nghiệm tính toán năng lượng tự do ràng buộc tổng thể trong một số điều kiện, bao gồm tương tác liên kết hydro và tương tác kỵ nước (c) Điểm số chức năng dựa trên kiến thức hàm tính toán các tương tác mục tiêu và phối tử trên tổng số tiềm năng thống kê phụ thuộc khoảng cách giữa phối tử và mục tiêu Chương trình FlexX sử dụng điểm số chức năng thực nghiệm [18]

Trong đề tài này, việc đánh giá mô hình sẽ thực hiện như sau: Chuẩn bị 4 phối tử ở dạng file sdf với cấu dạng được mô tả như sau:

Phối tử 1: Phối tử risperidon được tách ra từ phức hợp đồng kết tinh 6CM4

Phối tử 2: Phối tử risperidon được tách ra từ phức hợp đồng kết tinh 6CM4 và được chuẩn bị như quy trình chuẩn bị phối tử như trên

Phối tử 3: Phối tử risperidon được vẽ bằng phần mềm Chemdraw và được chuẩn bị như quy trình chuẩn bị phối tử như trên

Phối tử dopamin đã được thiết kế bằng phần mềm Chemdraw và được chuẩn bị theo quy trình tiêu chuẩn Việc bổ sung phối tử dopamin là cần thiết để thực hiện đánh giá, vì risperidon hoạt động như một chất đối vận, trong khi dopamin đóng vai trò là chất chủ vận.

Sau khi thực hiện docking 4 phối tử, cần ghi nhận điểm số chức năng, giá trị RMSD và mô thức gắn kết Yêu cầu đặt ra là giá trị RMSD phải nhỏ hơn 2, đồng thời mô thức gắn kết phải bao gồm các acid amin quan trọng liên quan đến chất chủ vận và đối vận.

Mô hình ADME

QikProp là một công cụ dự đoán ADME (hấp thụ, phân phối, chuyển hóa và thải trừ) nhanh chóng và chính xác, giúp người dùng dễ dàng phân tích các đặc tính vật lý và dược dụng của các phân tử hữu cơ, cả đơn lẻ và theo lô Chương trình không chỉ dự đoán các thuộc tính phân tử mà còn cung cấp phạm vi so sánh với 95% các loại thuốc đã biết, từ đó giúp người nghiên cứu có cái nhìn tổng quan Bên cạnh đó, QikProp cũng gắn cờ 30 nhóm chức năng phản ứng có khả năng gây ra kết quả dương tính giả trong các xét nghiệm sàng lọc thông lượng cao (HTS) Để thực hiện đánh giá ADME, QikProp xem xét nhiều thuộc tính quan trọng.

Dự đoán sinh khả dụng và chuyển hóa:

QPlogS là giá trị dự đoán độ tan của chất trong dung dịch nước, được biểu thị bằng nồng độ chất tan (S) ở trạng thái cân bằng với chất rắn kết tinh, tính bằng mol.dm⁻¹.

QPPCaco đo lường tính thấm của tế bào Caco-2 bằng đơn vị nm/giây, với Caco-2 là mô hình đại diện cho hàng rào máu-ruột, và dự đoán này áp dụng cho quá trình vận chuyển không chủ động PHOA đánh giá sự hấp thụ đường uống của con người trên thang điểm từ 0 đến 100%, dựa vào mô hình hồi quy tuyến tính đa định lượng, và thuộc tính này thường có mối tương quan tốt với khả năng hấp thụ đường uống, vì cả hai đều đo cùng một đặc tính.

#metab: Số phản ứng trao đổi chất có khả năng[83]

Dự đoán về sự xâm nhập của hàng rào máu não:

Thuốc có tính phân cực cao không thể vượt qua hàng rào máu não, do đó hệ số phân bố máu/não (QPlog BB) được sử dụng như một yếu tố dự đoán khả năng tiếp cận của thuốc vào hệ thống thần kinh trung ương Cần lưu ý rằng dự đoán QikProp chủ yếu áp dụng cho các loại thuốc uống, chẳng hạn như dopamin và serotonin, vì chúng có tính phân cực cao và không thể xâm nhập vào hệ thần kinh trung ương.

Dự đoán liên kết với protein huyết tương:

Hiệu quả của thuốc phụ thuộc vào khả năng liên kết với protein huyết tương, như albumin, lipoprotein, glycoprotein và globulin α, β, γ Sự liên kết này làm giảm đáng kể lượng thuốc có sẵn trong lưu thông máu.

Thông số QPlogKhsa dự đoán khả năng gắn kết của thuốc với albumin người [83]

Để đánh giá mô hình, một tập hợp dữ liệu đã được sử dụng làm thuốc ở người sẽ được tính toán các thông số và đánh giá dựa trên các tiêu chí đã đề ra.

Khoảng cho phép của các thông số được trình bày như trong Bảng 2.3 [83]

Bảng 2.3 Khoảng các giá trị thông số ADME phù hợp [83]

Thông số Khoảng hoặc giá trị đề nghị

Sàng lọc ảo

Trình tự các bước trong quá trình sàng lọc ảo được mô tả như trong Hình 2.4

Hình 2.4 Sơ đồ các bước tiến hành sàng lọc ảo

Sàng lọc bằng pharmacophore Đối với tập có kích thước lớn, trên trang web http://zincpharmer.csb.pitt.edu/, Chọn

“Search ZINC" Trong tab “ Pharmacophore", chọn “ Load features " để tải mô hình pharmacophore được chọn lên trang web Trong tab “ Filters ”, thiết lập thông số như sau :

- Subset selection: ZINC Purchasable : Last updated 12/20/14

Để tải mô hình lên hệ thống, hãy chọn “Submit Query” Sau khi hoàn tất, kết quả sẽ hiển thị bên phải, bao gồm cấu dạng thỏa mô hình pharmacophore, tên chất và RMSD Để lưu kết quả dưới dạng file *.sdf, chọn “Save Result” Kết quả này sẽ được mở trong MOE để xuất ra file *.mdb Để chọn các chất thỏa luật 5 Lipinski, hãy chọn “Select Entries/Druglike”, đây là bước sàng lọc các chất tương tự như thuốc Kết quả cuối cùng sẽ được lưu ở file.

Các tập dữ liệu nhỏ như Drugbank và TCM được tải về và tối thiểu hóa bằng phần mềm MOE Sau đó, cấu dạng được chuẩn bị với phần mềm Ligandscout để tiến hành sàng lọc Quá trình sàng lọc được thực hiện trong phần mềm Ligandscout.

Các chất sàng lọc được gộp chung vào một tập tin *.mdb và được lọc bằng công cụ “Druglike” và “Unique” trong phần mềm MOE Tiếp theo, năng lượng của các phân tử được tối thiểu hóa bằng công cụ “Energy minimize” Các thông số mô tả được tính toán và những phân tử không phù hợp bị loại bỏ Cuối cùng, hoạt tính của các phân tử tiềm năng được dự đoán và lựa chọn thông qua công cụ “Compute/Model/Evaluate”, với kết quả được xuất ra file *.sdf.

Trong phần mềm Maestro, tiến hành nhập file *.sdf và tính toán các thông số ADME Kết quả được xử lý bằng Excel

Các cấu trúc phẳng phân tử được tạo ra và chuyển đổi thành cấu trúc 3D thông qua phần mềm MOE Sau đó, năng lượng của các cấu trúc này được tối thiểu hóa bằng phần mềm Sybyl Cuối cùng, quá trình docking được thực hiện trong phần mềm LeadIT.

Mô phỏng động học phân tử

Quá trình mô phỏng động học phân tủ được thực hiện trong phần mềm Gromac, với protein và phối tử được tạo topology theo trường lực CHARMM27 Phức hợp protein - phối tử được đặt trong hộp 12 mặt, cách ít nhất 1 nm từ các cạnh, và thiết lập điều kiện biên tuần hoàn Cuối cùng, hộp được bổ sung nước mô hình TIP3P và trung hòa điện tích bằng dung dịch NaCl 0,15.

M Hệ được tối thiểu hóa năng lượng trong vòng 100 ps với thuật toán độ dốc nhất (steepest descent algorithm) Quá trình NVT (đẳng nhiệt-đẳng tích) thực hiện trong vòng 100 ps Quá trình NPT (đẳng nhiệt-đẳng áp) kéo dài trong thời gian 100 ps Sau khi hệ đã đạt trạng thái cân bằng với nhiệt độ 300 K (26,85 °C) và áp suất 1 bar không đổi, hệ được tiến hành mô phỏng động lực học (quá trình MD) với độ dài 20 ns Cả 3 quá trình NVT, NPT, MD đều sử dụng thuật toán nhảy cóc tích hợp các phương trình chuyển động Newton Phương pháp lưới hạt mịn Ewald ( smooth particle mesh Ewald

- SPME) được dùng để tính toán tương tác tĩnh điện, với giá trị ngưỡi là 1,2 nm Kết quả quỹ đạo được phân tích bằng phần mềm Gromacs

RMSD (căn bậc hai trung bình bình phương độ lệch) là số đo định lượng được sử dụng phổ biến nhất Giá trị RMSD được tính bằng:

RMSD (Root Mean Square Deviation) là phép tính trung bình được thực hiện trên n cặp nguyên tử tương đương, trong đó di là khoảng cách giữa hai nguyên tử trong cặp thứ i Phép tính này có thể áp dụng cho bất kỳ loại và tập hợp nguyên tử nào, chẳng hạn như các nguyên tử Cα của toàn bộ protein, các nguyên tử Cα của tất cả các acid amin trong một tập hợp cụ thể (như các vòng xoắn xuyên màng, túi gắn kết hoặc vòng loop), hoặc tất cả các nguyên tử nặng trong một phân tử phối tử nhỏ.

Nhược điểm chính của RMSD là nó bị ảnh hưởng bởi biên độ sai số, khiến cho hai cấu trúc giống hệt nhau nhưng khác vị trí của vòng lặp hoặc đầu cuối linh hoạt có thể có RMSD lớn Điều này làm cho RMSD không thể áp dụng hiệu quả trong các thuật toán tối ưu hóa tổng thể Hơn nữa, RMSD có thể không phản ánh chính xác độ chính xác của mô hình thực sự do sự ảnh hưởng lớn từ các khu vực linh hoạt và xác định kém, chẳng hạn như đầu tận C và các vòng loop ngoại bào trong GPCR.

RMSD bằng 0 cho các cấu trúc giống hệt nhau và tăng lên khi hai cấu trúc trở nên khác biệt Nó là chỉ số đáng tin cậy về tính biến đổi đối với các protein tương đồng, như các cấu dạng thay thế của cùng một protein Giá trị RMSD phụ thuộc vào số lượng nguyên tử trong cấu trúc, ví dụ, RMSD có ý nghĩa khác nhau đối với protein có 500 acid amin.

Tất cả các khung protein được căn chỉnh với cấu trúc khung xương tham chiếu, và RMSD được tính toán dựa trên lựa chọn nguyên tử Việc theo dõi RMSD của protein cung cấp cái nhìn sâu sắc về cấu dạng của nó trong suốt mô phỏng Phân tích RMSD có thể cho thấy liệu mô phỏng đã đạt trạng thái cân bằng hay chưa, với dao động cuối cùng hướng đến việc kết thúc mô phỏng Thay đổi từ 1-3 Å là lý tưởng cho các protein nhỏ, hình cầu, trong khi thay đổi lớn hơn cho thấy protein đang trải qua sự thay đổi lớn về cấu dạng Một yếu tố quan trọng khác là sự hội tụ của mô phỏng, với các giá trị RMSD ổn định xung quanh một giá trị cố định Nếu RMSD của protein vẫn tiếp tục tăng hoặc giảm so với trung bình khi kết thúc mô phỏng, điều đó cho thấy hệ thống chưa được cân bằng và mô phỏng có thể không đủ dài để phân tích một cách nghiêm ngặt.

Căn bậc hai trung bình bình phương dao động (RMSF) rất hữu ích để mô tả các thay đổi cục bộ dọc theo chuỗi protein

RMSF cho acid amin i là:

Thời gian quỹ đạo RMSF được tính theo thời gian T, với tref là thời gian tham chiếu Vị trí của acid amin i được ký hiệu là ri, trong khi r' là vị trí của các nguyên tử trong acid amin i sau khi so sánh với tham chiếu Dấu ngoặc nhọn thể hiện rằng trung bình khoảng cách bình phương được tính từ việc lựa chọn các nguyên tử trong acid amin.

Trên biểu đồ, các đỉnh thể hiện những vùng protein có sự dao động lớn nhất trong quá trình mô phỏng, đặc biệt là phần đuôi (N và C) dao động nhiều hơn các phần khác Ngoài ra, các yếu tố cấu trúc như xoắn alpha và chuỗi beta thường cứng hơn so với phần không cấu trúc của protein, dẫn đến việc chúng dao động ít hơn các vùng vòng loop.

RMSF là chỉ số đo lường sự dịch chuyển của một nguyên tử hoặc nhóm nguyên tử so với cấu trúc tham chiếu, được tính trung bình trên tổng số nguyên tử Tuy nhiên, sự di chuyển theo cấu dạng phụ thuộc vào chiến lược áp dụng trong quá trình chồng cấu trúc.

2.8.2.3 Phần trăm liên kết hydro

Liên kết hydro được phân loại dựa trên độ mạnh và yếu của chúng, với sự phân tích hình học và năng lượng Bảng 2.4 cung cấp những ví dụ quan trọng, tạo nền tảng hóa học cho việc phân loại này Khi phân loại liên kết hydro, cần chú ý đến bản chất hóa học thay vì chỉ dựa vào các tiêu chí số học và ngưỡng điểm cắt.

Bảng 2.4 Phân loại liên kết hydro

Os-HO Độ dài liên kết H-A  X-H H-A > X-H H-A >> X-H Độ dài X-H (Å) 0,05-0,2 0,01-0,05 25 -3-1,2 1-8 -1,5-1,5 >25

Dopamin không thể vượt qua hàng rào máu não, vì vậy levodopa được sử dụng trong điều trị bệnh Parkinson do khả năng qua được hàng rào này Phần mềm dự đoán cho thấy logBB của dopamin thấp (-0,676), điều này phù hợp với thực tế Các chất chủ vận dopamin được thiết kế để liên kết và kích hoạt các thụ thể dopamin trên tế bào thần kinh với chỉ số logBB cao hơn Hơn nữa, dopamin bị chuyển hóa nhanh và mất tác dụng khi dùng qua đường tiêu hóa, do đó không được sử dụng đường uống, và cũng không tiêm dưới da hay tiêm bắp do tác dụng co mạch, chỉ được tiêm tĩnh mạch Chỉ định của dopamin chủ yếu là trong trường hợp sốc do nhồi máu cơ tim, không dùng cho bệnh Parkinson.

Dự đoán phần mềm phù hợp thực tế khi chỉ ra các thông số PHOA và PCaco là thấp nhất trong tất cả các thuốc

Bromocriptin có giá trị logS -5,44 và logKhSA 0,304, cho thấy hoạt chất này khó hòa tan trong nước Thực tế, bromocriptin không tan trong nước nhưng dễ tan trong methanol và ethanol Đây là thuốc chủ vận mạnh nhóm thụ thể D2 của dopamin và là thuốc đối kháng một phần của nhóm thụ thể D1 Thử nghiệm in vitro cho thấy 90 - 96% bromocriptin gắn với albumin huyết thanh.

Rotigotin là một loại thuốc có logP cao (4,365) và logS thấp, cho thấy độ tan kém trong nước Giá trị logP thực tế là 4,7, với độ tan trong nước chỉ đạt 37,4 mg/L, hòa tan kém trong môi trường trung tính nhưng tăng khi môi trường trở nên acid Kết quả dự đoán này hoàn toàn phù hợp với thực tế.

Sáu thuốc chủ vận dopamine 2 có các thông số ADME đạt giá trị chấp nhận được, cho phép áp dụng mô hình để tính toán cho tập dữ liệu lớn hơn.

Sàng lọc ảo

Tập ZINC, Drugbank và TCM chứa nhiều hóa chất và thuốc dễ dàng mua được, với Drugbank cung cấp thông số sinh dược học và dược động học rõ ràng cùng nhiều nghiên cứu về tính an toàn và hiệu quả TCM bao gồm các chất từ dược liệu, phản ánh cách sử dụng dân gian qua nhiều thế hệ Tổng cộng, ZINC có 13.190.317 chất, Drugbank 8.773 chất, và TCM 57.423 chất, dẫn đến 13.256.513 chất được sàng lọc bằng pharmacophore Kết quả cho thấy có 121 hit trong TCM, 232 hit trong Drugbank, và 672 hit trong ZINC, gộp lại thành 1.025 chất sau khi loại bỏ trùng lặp và không giống thuốc, còn lại 818 chất Qua quá trình sàng lọc, 350 chất được lựa chọn bằng miền ứng dụng, 124 chất từ mô hình BQSAR, và 76 chất sau khi áp dụng mô hình ADME Cuối cùng, bổ sung dopamin làm chất tham chiếu và tiến hành docking, cho ra 51 chất, bao gồm cả chất đối chiếu, minh họa cho quá trình sàng lọc như một cái phễu giảm dần số lượng chất.

Hình 3.12 minh họa phễu sàng lọc các chất tiềm năng, với 76 chất được đánh giá qua mô hình ADME Các giá trị QPlogPo/w, QPlogS, QPlogBB và PHOA được trình bày trong Hình 3.13 Đối với QPlogPo/w, giá trị chủ yếu nằm trong khoảng 2 đến 3, trong khi QPlogS có nhiều chất nhất trong khoảng từ -3,6 đến -2,4 Giá trị QlogBB tập trung nhiều ở khoảng -0,5 và 0 Cuối cùng, PHOA cho thấy sự gia tăng số lượng chất từ 65 đến 90, với số lượng cao nhất nằm trong khoảng từ 85 đến 90.

Hình 3.13 Biểu đồ Histogram thông số QPlogPo/w, QPlogS, QPlogBB, PHOA.

Sau khi tiến hành docking 76 chất, điểm số dao động từ -11,6 kJ/mol đến -37,1 kJ/mol Chúng tôi đã chọn ra 50 chất có điểm số docking âm thấp hơn dopamin Kết quả phân bố điểm số của 51 chất, bao gồm 50 chất tiềm năng và dopamin, được trình bày trong Hình 3.14.

Hình 3.14 Phân bố điểm số docking của 50 chất tiềm năng

Tập Drugbank có số chất tiềm năng nhiều nhất, và tập TCM có số chất ít nhất Trong

50 chất tiềm năng, 25 chất thuộc tập Drugbank, chiếm 50% về số lượng 15 chất thuộc tập ZINC và 10 chất thuộc tập TCM, với tỷ lệ 30% và 20% tương ứng

Tỷ lệ phần trăm các chất cùng với nguồn gốc được trình bày trong Hình 3.15 cho thấy rằng tỷ lệ các chất trong tập TCM thấp và trong Drugbank cao, cho thấy nhiều chất có thông số sinh dược học và dược động học không phù hợp đã bị loại bỏ Tuy nhiên, các chất trong tập Drugbank cần được nghiên cứu thêm và có những lưu ý khi sử dụng trong lâm sàng do khả năng gây ra tác động không mong muốn trong quá trình điều trị.

Hình 3.15 Nguồn gốc của 50 chất tiềm năng

Trong 51 chất (kể cả dopamin), tần số tương tác của các acid amin quan trọng trong khoang gắn kết được chỉ ra trong Hình 3.16

Hình 3.16 Tần số tương tác với các acid amin của 51 chất

Asp114 là acid amin quan trọng nhất, liên kết với 39 trong tổng số 51 chất, tiếp theo là Thr412 và Cys118 với 16 và 11 chất tương ứng Tương tác của Asp114 chủ yếu thông qua liên kết hydro và ion, trong khi Thr412 chỉ có liên kết hydro Acid amin His393 có vai trò ít hơn khi chỉ tương tác với 2 chất Trong nhóm acid amin serin, Ser193 nổi bật hơn Ser197 với 11 chất tương tác so với 4 chất.

Trong khuôn khổ nghiên cứu, 5 chất trong số 50 chất được sàng lọc sẽ được chọn để thực hiện mô phỏng động học Các chất này được lựa chọn dựa trên tiêu chí: i) Điểm số docking thấp, ii) cấu dạng gắn kết với các acid amin quan trọng như Asp114 và Ser193, iii) phân bố đồng đều giữa các tập sàng lọc Kết quả lựa chọn bao gồm 2 chất từ tập ZINC, 2 chất từ tập Drugbank và 1 chất từ tập TCM, như được trình bày trong Bảng 3.11.

Bảng 3.11 Đặc điểm của 5 chất sử dụng cho mô phỏng động học

Mô thức gắn kết với D2RN

ZINC09442049 -31,8 Asp114, Ser193, Val115, His393,

DB07889 -30,6 Asp114, Ser193, Trp100, Thr412,

Mô thức gắn kết của ZINC09442049 với thụ thể dopamine 2 được thể hiện trong Hình 3.17, trong đó nhóm thioure đóng vai trò quan trọng khi nằm sâu trong khoang gắn kết Nó neo giữ phối tử với protein thông qua liên kết cầu muối với Asp114 và liên kết hydro với Ser193.

Hình 3.17 Mô thức gắn kết và khoang gắn kết của ZINC09442049

Mô thức gắn kết trước khi mô phỏng động học của ZINC05857468 và thụ thể dopamin 2 được trình bày như trong Hình 3.18

Hình 3.18 Mô thức gắn kết và khoang gắn kết của ZINC05857468

Phối tử nằm hoàn toàn trong khoang gắn kết NH trong vòng benzimidazol liên kết cầu muối với Asp114 Nitơ của nhóm thioure liên kết hydro với Ser193

Mô thức gắn kết của TCM30487 với thụ thể dopamin 2 được minh họa trong Hình 3.19, trong đó nitơ của 3,4-dihydro-1H-isoquinolin đóng vai trò quan trọng trong việc hình thành liên kết cầu muối với Asp114 Đồng thời, nhóm OH gắn với 3,4-dihydro-1H-isoquinolin tạo ra liên kết hydro với Ser193.

Hình 3.19 Mô thức gắn kết và khoang gắn kết của TCM30487

Mô thức gắn kết trước khi mô phỏng động học của DB07889 và thụ thể dopamin 2 được trình bày như trong Hình 3.20

Hình 3.20 Mô thức gắn kết và khoang gắn kết của DB07889

Phần tương tác chính giữa phối tử và đuôi dimethylamino cùng hydroxy nằm sâu trong khoang gắn kết Nitơ trong dimethylamino của phối tử tạo liên kết cầu muối với Asp114, trong khi nhóm OH của phối tử hình thành liên kết hydro với Ser193.

Mô thức gắn kết trước khi mô phỏng động học của DB06152 và thụ thể dopamin 2 được trình bày như trong Hình 3.21

Hình 3.21 Mô thức gắn kết và khoang gắn kết của DB06152

Do cấu trúc nhỏ gọn, phân tử nằm hoàn toàn trong khoang Nitơ hóa trị 4 liên kết cầu muối với Asp114 và OH phenol liên kết hydro với Asp114.

Mô phỏng động học phân tử

Sự khác biệt chính giữa ba cấu trúc protein trong các tinh thể 6CM4, 6LUQ và 6VMS nằm ở vùng loop nội bào IL3, kéo dài từ acid amin 223 đến 361 với cách đánh số khác nhau Cấu trúc tinh thể 6CM4 và 6LUQ chứa vùng IL3 của một protein khác, có trình tự không hoàn toàn giống với thụ thể dopamin 2, với độ dài 139 acid amin Trong khi đó, cấu trúc tinh thể 6VMS chỉ có 6 acid amin và cũng hoàn toàn khác so với trình tự gốc của thụ thể dopamin 2.

Các cấu trúc tinh thể 6CM4, 6LUQ, và 6VMS đã được chuẩn bị để tiến hành mô phỏng động học Kết quả RMSD từ quá trình mô phỏng trong 20 ns được thể hiện trong Hình 3.22.

Hình 3.22 Kết quả mô phỏng động học thụ thể dopamin 2 trong cấu trúc tinh thể

Độ dài của vùng IL3 ảnh hưởng đến sự ổn định của protein, với các tinh thể 6CM4 và 6LUQ có vùng IL3 dài và giá trị RMSD dao động lớn, trong khi tinh thể 6VMS có vùng IL3 ngắn hơn và giá trị RMSD ổn định từ 1,5 đến 3 Å Vùng IL3 đóng vai trò quan trọng trong việc gắn kết với protein G và β arrestin, thể hiện tính linh động cao Năm 2018, David Montgomery đã tạo mô hình homology cho thụ thể dopamin 2 và thực hiện mô phỏng động học trong 1000ns, cho kết quả RMSD ổn định khoảng 10 Å khi gắn kết với thụ thể dopamin Tuy nhiên, điều kiện nghiên cứu tại Việt Nam còn hạn chế Hơn nữa, túi gắn kết với phối tử nằm ở 7 đoạn xuyên màng không liên quan đến vùng IL3 Dựa trên phân tích này, một mô hình protein thụ thể dopamin 2 đã được xây dựng từ thông tin của các tinh thể 6CM4 và 6VMS, giữ nguyên cấu trúc 7 đoạn xuyên màng từ thụ thể 6CM4 và điều chỉnh mô hình loop tương tự.

6vms Protein mới này được ký hiệu là D2RN và sự thay đổi nêu trên được minh họa trong Hình 3.23

Hình 3.23 Thụ thể dopamin 2 được thay đổi vùng IL3 từ dài thành ngắn hơn

Sau đó, D2RN được tiến hành mô phỏng động học trong khoảng thời gian 40 ns Kết quả được trình bày theo như Hình 3.24

Hình 3.24 Giá trị RMSD của D2RN

Giá trị RMSD của thụ thể D2RN dao động từ 0,15 đến 0,4 Å, với xu hướng tăng lên 0,4 Å trong khoảng 30 ns trước khi giảm xuống khoảng 0,3 Å Để đánh giá các yếu tố ảnh hưởng đến độ ổn định của protein, giá trị RMSF được trình bày trong Hình 3.25.

Hình 3.25 Giá trị RMSF của D2RN

Các đỉnh trong Hình 3.25 chỉ ra các vị trí protein có sự dao động lớn, bao gồm các loop ngoại bào EL1, EL2, EL3 và các loop nội bào IL1, IL2 Vị trí IL3, một loop nội bào, đã được rút ngắn, tạo ra một đường thẳng dốc Ngoài ra, các acid amin quan trọng trong khoang gắn kết có độ dao động thấp, chỉ khoảng 0,1 nm, bao gồm các acid amin thân nước Ser193, Ser194, Ser197 tại vị trí trước 200 và các acid amin kỵ nước Trp386, Phe389, Phe390 tại vị trí trước 400.

Phức hợp D2RN với dopamin

Quá trình mô phỏng động học kéo dài 20 ns đã được thực hiện để đánh giá sự ổn định của protein D2RN và dopamin Kết quả cho thấy giá trị RMSD của protein trong phức hợp dao động từ 0,15 đến 0,3 nm, với độ chênh lệch chỉ 0,15 nm, thấp hơn 0,25 nm so với RMSD của protein D2R riêng lẻ Trong suốt 20 ns, phức hợp với dopamin thể hiện sự ổn định tốt hơn so với khi không có phối tử Đối với dopamin, căn bậc hai trung bình bình phương độ lệch chỉ từ 0,02 đến 0,1 nm, cho thấy sự ổn định cao trong thời gian mô phỏng.

Hình 3.26 Giá trị RMSD của protein (ở trên) và dopamin (ở dưới)

3.8.2 Phần trăm liên kết hydro

Trong nghiên cứu mô phỏng động học, chỉ các liên kết hydro mạnh với độ dài nhỏ hơn 3,2 Å và góc H từ 130º đến 180º được xem xét, trong khi các liên kết yếu bị loại bỏ Bảng 3.12 trình bày phần trăm liên kết hydro giữa protein D2RN và các phối tử, với Asp114 là acid amin có tần suất liên kết cao nhất, hiện diện ở dopamin và 5 phối tử khác Ser197 và Ser193 cũng là những acid amin quan trọng với tần suất liên kết thấp hơn ZINC09442049 có điểm số docking âm nhất nhưng không tạo được liên kết bền vững với Asp114, mặc dù có liên kết hydro với Ser193 với tần suất chỉ khoảng 55% Chất TCM30487 cho thấy sự tương tác mạnh mẽ với Asp114, Ser197, và Ser193, với phần trăm liên kết hydro đều trên 85% DB07889 và DB06152 cũng tạo liên kết với Asp114 với tần suất cao, lần lượt khoảng 128% và 181%.

Bảng 3.12 Tần suất liên kết hydro của những chất mô phỏng động học Phối tử Nhóm cho hydro Nhóm nhận hydro Tần suất (%)

ZINC09442049 có công thức hóa học C21H26N6O2S2 và phân tử khối 458,2, với danh pháp IUPAC là 1-(2-Methoxyethyl)-3-[4-[6-(2-methoxyethylcarbamothioylamino)-1H-benzimidazol-2-yl]phenyl]thiourea Nghiên cứu đã tiến hành mô phỏng động lực học phân tử của phức hợp protein D2RN và ZINC09442049 trong 20 ns để đánh giá sự gắn kết của phối tử Kết quả cho thấy giá trị RMSD của protein dao động từ 0,15 đến 0,4 nm, trong khi RMSD của phối tử khá ổn định, xung quanh 0,15 nm.

Hình 3.27 Giá trị RMSD của ZINC09442049 (dưới) và D2RN (trên)

Công thức cấu tạo và giá trị RMSF của phối tử ZINC09442049 trong protein D2RN được thể hiện rõ qua Hình 3.28 và Hình 3.29 Giá trị RMSF trung bình dao động chủ yếu trong khoảng 0,02 đến 0,08 nm, với hai đuôi methoxy có RMSF cao, lần lượt là 0,12 nm với O, 0,18 nm với C3, 0,1 nm với O1 và 0,15 nm với C15, cho thấy chúng có độ linh động cao Ngược lại, hai nitơ N3 và N4 trong thioure có vai trò neo giữ phối tử lại có RMSF thấp, chỉ khoảng 0,05 nm.

Hình 3.28 Công thức cấu tạo của ZINC09442049

Hình 3.29 Giá trị RMSF các nguyên tử của phối tử ZINC09442049

ZINC05857468 có công thức hóa học C18H18N4OS và phân tử khối 338,4, với danh pháp IUPAC là N - [[3- (1H-benzimidazol-2-yl) phenyl] carbamothioyl] butanamid Để đánh giá sự gắn kết của phối tử này, nghiên cứu đã thực hiện mô phỏng động lực học phân tử của phức hợp protein D2RN và ZINC05857468 trong 20 ns, với giá trị RMSD được minh họa trong Hình 3.30.

Hình 3.30 Giá trị RMSD của ZINC05857468 (dưới) và D2RN (trên)

Trong quá trình mô phỏng, căn bậc hai trung bình phương độ lệch (RMSD) của protein dao động từ 0,17 đến 0,27 nm, trong khi giá trị RMSD của phối tử ổn định ở khoảng 0,06 nm So với phức hợp protein D2RN và dopamin, RMSD của protein có giá trị thấp hơn một chút, trong khi độ biến động của ligand cũng ít hơn.

Công thức cấu tạo và giá trị RMSF của phối tử ZINC05857468 trong protein D2RN cho thấy đa phần các nguyên tử có trị số căn bậc hai trung bình bình phương dao động thấp, từ 0,02 – 0,04 nm, giúp phân tử ổn định trong khoang gắn kết với giá trị RMSD khoảng 0,06 nm Tuy nhiên, phần đuôi methyl lại có sự dao động lớn hơn, với giá trị RMSF của C4 đạt 0,1 nm.

Hình 3.31 Công thức cấu tạo của ZINC05857468

Hình 3.32 Giá trị RMSF các nguyên tử của phối tử ZINC05857468

TCM30487 có công thức hóa học C18H21NO3 và phân tử khối 299,4 Danh pháp IUPAC của nó là 1-[(4-hydroxyphenyl)methyl]-6-methoxy-2-methyl-3,4-dihydro-1H-isoquinolin-7-ol, trong khi tên thông thường là N-methylcoclaurin Hợp chất L-(+)-N-methylcoclaurin được chiết xuất từ cây dây hồ cầu Cocculus laurifolius DC thuộc họ Menispermaceae.

C5 C6 C7 C8 N2 C9 C10 N3 C11C12C13C14C15C16C17 S C N C1 O C2 C3 C4 N1 n m đặt tên là coclanolin D-(-)-N-Methylcoclaurin được phân lập từ Phylica rogersii

Nghiên cứu về phối tử TCM30487 trong phức hợp protein D2RN thuộc họ Pillans (Rhamnaceae) đã tiến hành mô phỏng động lực học phân tử trong 20 ns Kết quả cho thấy giá trị RMSD của protein trong 10 ns đầu dao động từ 0,15 đến 0,4 nm, sau đó giảm đều từ 0,4 đến 0,2 nm Trong khi đó, giá trị RMSD của phối tử TCM30487 khá ổn định, duy trì xung quanh 0,1 nm.

Hình 3.33 Giá trị RMSD của TCM30487 (dưới) và D2RN (trên)

Công thức cấu tạo và giá trị RMSF của phối tử TCM30487 trong protein D2RN cho thấy đa phần các nguyên tử có trị số căn bậc hai trung bình bình phương dao động thấp, từ 0,01 đến 0,03 nm, giúp phân tử ổn định trong khoang gắn kết với giá trị RMSD khoảng 0,1 nm Tuy nhiên, phần đuôi methyl có sự dao động nhẹ với giá trị RMSF đạt 0,05 nm.

Hình 3.34 Công thức cấu tạo của TCM30487

Hình 3.35 Giá trị RMSF các nguyên tử của phối tử TCM30487

Bàn luận

3.9.1 Mô hình QSAR Đề tài đã xây dựng được mô hình QSAR nhị phân và có thể áp dụng trong sàng lọc Tác giả Tintu K Kuruvilla đã thực hiện kỹ thuật QSAR dựa trên lý thuyết phiếm hàm mật độ cho 10 chất chủ vận dopamin [50] Các tham số lượng tử về điện tử của chất chủ vận dopamin được lấy làm biến dự đoán x và hoạt tính sinh học được đưa ra bởi ái lực gắn kết phân tử của hợp chất với thụ thể dopamin 2 được lấy làm biến đáp ứng y Phương trình hồi quy tuyến tính đa biến: ái lực gắn kết = 0,810658 thế hóa – 17,9763 độ cứng hóa – 259,344 độ mềm hóa + 1,152795 chỉ số ái điện tử + 89,88512 với R 2 = 0,831615 [50] Trong khi đó, đề tài này dùng nồng độ hiệu quả 50% thay cho ái lực gắn kết, thực hiện trên 255 chất với phương trình QSAR PLS là pEC50 7,70725 - 0.19210a_ICM - 0,20216BCUT_PEOE_0 – 0,21556GCUT_PEOE_0 + 0,52749Q_VSA_FPNEG – 0,01078SlogP_VSA4; R 2 =0,4698; RMSE=0,8144 Sự đa dạng về cấu trúc hóa học cũng như phương pháp định lượng xuất hiện trên nhiều tạp san khác nhau cùng với sự khớp các tham số của mô hình với dữ liệu thử nghiệm chính xác đã làm cho mô hình này thất bại Tuy nhiên, khi chuyển qua mô hình BQSAR thì các thông số đánh giá như điểm số GH từ 0,56 - 0,71 cho thấy mô hình khá tốt QSAR nhị phân xây dựng mô hình dự đoán thông qua việc sử dụng suy luận

BQSAR có khả năng dự đoán chính xác nhờ vào việc khái quát hóa dựa trên dữ liệu thực nghiệm, thay vì sử dụng nội suy Điều này mang lại kết quả khả quan hơn trong xác suất và thống kê quy mô lớn.

3.9.2 Mô hình 3D pharmacophore Đề tài đã xây dựng thành công mô hình pharmacophore trên 6 chất chủ vận Mô hình đi từ các chất chủ vận gồm điểm ion dương, vòng thơm, điểm kị nước, điểm cho hydro Ngoài ra đề tài đã dùng các tập chất để đánh giá mô hình pharmacophore từ 6 chất chủ vận, 11 chất đối vận, phức hợp với chất đối vận Xem xét 3 mô hình, chúng ta thấy không có sự khác biệt nhau qua nhiều Cả 3 mô hình đều có chung 1 điểm ion dương, 1 điểm kỵ nước Sự khác nhau ở đây có lẽ liên quan đến khoảng cách giữa các điểm trong mô hình và điểm cho, nhận hydro Ngoài ra, khi so sánh kết quả nghiên cứu này với những nghiên cứu khác, có nhiều điểm tương đồng như mô hình đều có điểm ion dương, điểm kỵ nước, điểm cho hydro Tam giác pharmacophore chất chủ vận gồm 3 điểm: điểm cho hydro (HBD), vòng thơm (R), điểm ion dương (P) và khoảng cách đo bằng Å của nghiên cứu này và của Thomas Sommer được minh họa như trong Hình 3.42 [88]

Hình 3.42 Mô hình pharmacophore nghiên cứu này (trái) và Thomas Sommer (phải)

Hai tam giác này có hình dạng tương tự, chỉ khác nhau một chút về độ dài cạnh Tam giác của Thomas Sommer có các cạnh dài hơn, nhưng sự khác biệt không đáng kể.

Chi tiết những điểm giống nhau và khác nhau so với những nghiên cứu của các tác giả đi trước được thể hiện trong Bảng 3.13

Bảng 3.13 So sánh các mô hình 3D pharmacophore với các nghiên cứu khác Tác giả Tập xây dựng Cách đánh giá/ phần mềm

6 thuốc thương mại: dopamin, pramipexol, rotigotin, apomorphin, ropinirol, bromocriptin

108 chất không hoạt tính, 400 chất decoy

- Điểm Sp, Se, Ya, GH

1 vòng thơm, 1 điểm kị nước, 1 điểm cho hydro

MLS1547, NCGC9147 - Điểm sinh tồn (gồm điểm gióng hàng, điểm vector, chồng phủ thể tích)

1 điểm tích điện dương, 2 vòng thơm, 1 điểm kỵ nước

11 chất gồm apomorphin, talipexol, ADTN và 8 chất nữa với cấu trúc cồng kềnh, kéo dài Chỉ 1 chất apomorphin xuất hiện trong tập 6 chất chủ vận của nghiên cứu này

493 chất đối vận, 39 decoy mỗi chất

1 vòng thơm, 1 điểm cho hydro

3.9.3 Mô hình docking và sàng lọc ảo Đề tài đã xây dựng được mô hình docking dựa trên cấu trúc tinh thể 6CM4 của thụ thể dopamin 2 Vì cấu trúc tinh thể 6CM4 chỉ xuất hiện gần đây vào năm 2018 nên những nghiên cứu trước đó nếu có thực hiện docking đều phải xây dựng mô hình homology Chẳng hạn như nghiên cứu của Thomas Sommer năm 2017 khi thực hiện docking đã dựa vào mô hình homology của tác giả Ralf C Kling năm 2013 [88] Tọa độ thụ thể β2 và protein Gαs được sử dụng làm hình mẫu (template) để tạo ra mô hình homology của thụ thể dopamin 2 trong phức hợp với protein Gαi1[46] Tuy nhiên, vào năm 2019, tác giả Emanuel Dani Ramdani đã so sánh việc docking trên cấu trúc tinh thể 6cm4 và mô hình homology Bằng cách đánh giá RMSD trong so sánh vùng gắn kết của protein và thẩm định sàng lọc lọc ảo trên tập phối tử và tập decoy, tác giả khuyến cáo rằng nên sử dụng cấu trúc tinh thể trong việc sàng lọc ảo [22] Chi tiết những điểm giống và khác nhau của nghiên cứ này và của Thomas Sommer được chỉ ra trong Bảng 3.14 Kết quả docking ở nghiên cứu này cũng như nghiên cứu khác chỉ ra rằng Asp114 rất quan trọng trong gắn kết Điểu này khẳng định lại một lần nữa trong mô hình pharmacophore khi điểm ion dương là bắt buộc phải có Điểm ion dương này đa phần là Nitơ, tạo liên kết cầu muối với Asp114 Hơn nữa, trong mô phỏng động học, Asp114 được xem như là một điểm gắn kết chặt chẽ với phối tử theo thời gian bằng cả liên kết hydro và liên kết ion Ngoài ra, Ser193 dường như quan trọng hơn Ser 197 theo như tần số tương tác với phối tử (tương tác với 11/50 phối tử so với 4/50 phối tử)

Bảng 3.14 So sánh mô hình docking và sàng lọc ảo với nghiên cứu khác Nghiên cứu Đặc điểm protein/ tập sàng lọc/ phần mềm/ mô hình đi kèm

- Đi từ cấu trúc tinh thể 6CM4

- Đánh giá lại bằng redocking

- Tập sàng lọc ZINC gồm 13.190.317 chất, Drugbank gồm 8.773 chất, TCM gồm 57.423 chất

- Mô hình đi kèm: BQSAR, Pharmacophore, ADME, động học phân tử

- Số chất sàng lọc được: 50 chất

- Acid amin quan trọng: Asp114

- Chưa tiến hành thử nghiệm in vitro sau sàng lọc

- Đi từ cấu trúc tinh thể 3SN6, 3P0G, 1AZT để xây dựng mô hình homology bằng chương trình ClustalX, BioEdit, Modeller 9v4, Amber 10

- Tập sàng lọc FCDB (tập thực phẩm) PhyDB (tập chất tự nhiên thương mại)

- Phần mềm docking AutoDock Vina

- Mô hình đi kèm: Pharmacophore

- Số chất sàng lọc được: 30 chất

- Acid amin quan trọng: Asp114

- Có 9 chất được thử nghiệm in vitro sau sàng lọc

Kết quả sàng lọc ảo cho thấy một nửa trong số 50 chất được tìm thấy thuộc tập Drugbank, trong khi phần còn lại thuộc tập TCM và ZINC Các chất trong tập Drugbank đã được nghiên cứu nhiều, giúp giảm lo ngại về sinh khả dụng, hấp thu, phân bố, thải trừ và độc tính DB06152, một thuốc chủ vận beta 2, lại được dự đoán là chủ vận dopamin, điều này không gây ngạc nhiên do có sự tương tác chéo giữa hai hệ thống dopaminergic và adrenergic Dopamin và norepinephrin, hai chất dẫn truyền thần kinh cổ điển, chia sẻ cùng một con đường tổng hợp và có thể cùng hiện diện trong một số tế bào thần kinh não Mặc dù truyền thống cho rằng các chất dẫn truyền thần kinh tương tác với thụ thể riêng biệt, ngày càng có nhiều bằng chứng cho thấy sự tương tác lẫn nhau giữa hai hệ thống này.

3.9.4 Mô phỏng động học phân tử

Kết quả mô phỏng động học cho thấy sự phù hợp với kết quả docking, với các liên kết hydro giữ vai trò quan trọng và không thay đổi nhiều trong hầu hết các phối tử Thời gian mô phỏng động học phân tử có thể khác nhau tùy thuộc vào điều kiện phòng thí nghiệm và mục đích nghiên cứu, tuy nhiên, 20 ns là thời gian hợp lý cho nghiên cứu này Nghiên cứu đã thực hiện mô phỏng trên 5 phân tử: 2 từ tập Drugbank, 2 từ tập ZINC và 1 từ tập TCM, và không ghi nhận phân tử nào có độ ổn định kém Các nghiên cứu khác tập trung vào vai trò của các acid amin yêu cầu thời gian dài hơn và mô hình đầy đủ hơn, bao gồm cả màng tế bào Bảng 3.15 trình bày chi tiết sự tương đồng và khác biệt giữa nghiên cứu này và các nghiên cứu khác.

Bảng 3.15 So sánh mô phỏng động học phân tử với nghiên cứu khác

Tác giả/Mục tiêu nghiên cứu Đặc điểm protein/ phối tử Điều kiện

- Nghiên cứu sự gắn kết của phối tử đã sàng lọc và protein

- Thụ thể dopamin 2 đã loại bỏ ảnh hưởng của IL3

- Phối tử gồm dopamin, ZINC09442049,

- Không có màng tế bào

- Trường lực CHARMM27 (cho protein và phối tử)

- Giải thích các acid amin xuất hiện trong tương tác bề mặt giữa thụ thể dopamin

- Thụ thể β2 và protein Gαs được sử dụng làm hình mẫu (template) tạo ra mô hình homology

- Phối tử chỉ có dopamin

- Màng tế bào Dioleoylphosphatidylcholin (DOPC)

- Trường lực GAFF (cho phối tử và phân tử DOPC), ff99FB(cho protein)

- Nghiên cứu về mối liên quan giữa sự gắn kết và tính chọn lọc chức năng của phối tử và thụ thể dopamin 2

- Thụ thể dopamin 3 cùng với 4 hình mẫu khác được dùng tạo ra mô hình homology

- Phối tử gồm dopamin , MLS1547

- Màng tế bào Phosphatidylcholine (POPC)

Ngày đăng: 14/07/2021, 17:53

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w