Công cụ hỗ trợ PROCHECK

Một phần của tài liệu Tin sinh học dự đoán cấu trúc protein (Trang 31)

PROCHECK cho phép tính toán các thông số hóa học lập thể của một mô hình cấu trúc, phân tích sự phân bố của các thông số đó, dựa vào độ phân giải của cấu trúc để tra các giá trị sai số chuẩn tương ứng và kết luận sơ bộ về chất lượng lập thể của cấu trúc đồng thời chỉ ra các vị trí có thể có sai sót.

G-factor là một giá trị thống kê, cho biết mức độ “bình thường” của một đặc tính bất kỳ. G-factor của một đặc tính X được tính như sau

24 Trong đó p(X) là xác suất của X. Như vậy, G-factor(X) càng thấp thì cấu trạng tương ứng mang đặc tính X càng có xác suất thấp. Phân phối xác suất của X được xác định dựa trên thống kê các cấu trúc protein đã được giải bằng phương pháp tán xạ tia X và có độ phân giải cao. G-factor lý tưởng khi >-0.5. Phần tử (hoặc cấu trúc) có G-factor <-1.0 cần được xem xét lại.

25

CHƯƠNG 4. MỘT VÍ DỤ VỀ DỰ ĐOÁN CẤU TRÚC PROTEIN

Để giúp chi phần lý thuyết ở trên dễ hiểu, sau đây đồ án sẽ thực hiện mô hình hoá cho một protein. Quy trình thực hiện trải qua 4 bước như trình bày ở trên và sử dụng nhiều website nhằm tạo ra cái nhìn tổng quan nhất về các công cụ phục vụ cho việc dự đoán cấu trúc protein.

Đồ án sẽ chọn một protein đã biết chắc chắn cấu trúc qua thực nghiệm và có sẵn trong ngân hàng Protein nhằm kiểm chứng cho tính chính xác của các website. Protein được sử dụng để làm minh hoạ là protein Rhodopsin. Protein này tồn tại ở võng mạc ( Retina ) và có số ID trong ngân hàng Protein là 1U19.

Cấu trúc của protein này sẽ được tải xuống từ ngân hàng dữ liệu protein dưới dạng file fasta.

Hinh 6. Cấu trúc mắt người

Một phần của tài liệu Tin sinh học dự đoán cấu trúc protein (Trang 31)

Tải bản đầy đủ (PDF)

(43 trang)