Phương pháp hồi qui logistic
Hàm logit
a Hàm logit là hàm số có dạng:
Khi z tiến đến +∞, hàm logit F(z) sẽ tiến đến 1, trong khi khi z tiến đến −∞, F(z) sẽ tiến đến 0 Điều này cho thấy hàm logit F(z) luôn nhận giá trị trong khoảng từ 0 đến 1 cho mọi giá trị của z Nhờ vậy, mô hình logistic đảm bảo rằng xác suất ước lượng luôn nằm trong khoảng từ 0 đến 1, không bao giờ vượt quá 1 hoặc thấp hơn 0, điều này không phải lúc nào cũng đúng với các mô hình khác Chính vì lý do này, mô hình logistic được xem là lựa chọn hàng đầu để ước lượng xác suất.
Hàm logit F(z) có giá trị bằng 0 tại z = −∞ Khi z tăng dần, giá trị của hàm F(z) cũng tăng theo, nhưng vẫn gần điểm 0.
0 trong một khoảng tương đối dài Sau đóF(z) tăng đáng kể hướng tới 1 Cuối cùng dừng lại ở 1 khi z →+∞ Kết quả là ta có một bức tranh hình chữ S.
Hình 1.1: Đồ thị của hàm logit
Trong hàm logit, đối số z có thể nhận giá trị tùy ý trên R, cho thấy rằng z có thể được xem như tổ hợp tuyến tính của các biến độc lập Điều này có nghĩa là F(z) phản ánh ảnh hưởng của tổ hợp tuyến tính các biến độc lập đến xác suất xuất hiện của giá trị biến phụ thuộc Đồng thời, giá trị của hàm logit luôn nằm trong khoảng [0; 1], tương ứng với miền giá trị của xác suất.
Mô hình hồi qui logistic nhị phân
Giả sử X 1 , X 2 , X 3 , X 4 , , X k là k biến độc lập dùng để dự báo Kí hiệu vecto
Mô hình logistic nhị phân được định nghĩa cho các biến X = (X1, X2, X3, X4, Xk) T, trong đó các biến Xi có thể là định tính hoặc định lượng Biến phụ thuộc Y cần dự báo là biến nhị phân, chỉ nhận một trong hai giá trị được mã hóa thành 0 hoặc 1 Biểu thức xác suất của mô hình logistic nhị phân có dạng đặc trưng.
P i=1 β i X i ) trong đó các tham số α, β i là các tham số chưa biết.
Chúng ta không thể xác định chính xác các tham số α, β i mà chỉ có thể ước lượng chúng dựa trên dữ liệu thu thập từ X s và Y Các ước lượng này được ký hiệu là αb và βb i.
1.2.1 Ước lượng các tham số trong mô hình
Có nhiều phương pháp để ước lượng tham số trong mô hình hồi quy logistic Trong bài viết này, chúng tôi sẽ trình bày phương pháp ước lượng hợp lý cực đại, một kỹ thuật nhằm tối đa hóa hàm hợp lý để đạt được giá trị lớn nhất.
Giả sử có n quan sát độc lập {(y i , x i )}i∈{1,2, ,n} ∈ ({0,1} ×R k+1 ) n với y i là giá trị của biến phụ thuộc Y và x i = (x i1 , x i2 , , x ik ) T là giá trị của các biến độc lập tại quan sát thứi.
Hàm hợp lý là hàm của các tham số chưa biết trong mô hình kí hiệu là L(θ) với θ= (α, β 1, , β 2 , β 3 , , β k ) T và được xác định bởi công thức:
Hàm hợp lý L(θ) đạt cực đại khi lnL(θ) cũng đạt cực đại Để tìm các ước lượng hợp lý cực đại cho các tham số α và β j, cần giải hệ phương trình đạo hàm riêng.
Theo định nghĩa 1.2.1 , tại quan sát thứ i xác suất có điều kiện để biến phụ thuộc
Y nhận giá trị bằng 1, theo các giá trị của biến độc lập X j là
Như vậy xác suất có điều kiện để tại quan sát thứ i biến phụ thuộc Y nhận giá trị bằng 0 theo các giá trị của biến độc lậpX j là
P(Yi = 0|X1 =xi1, , Xk=xik) =1−P(Yi = 1|X1 =xi1, , Xk=xik)
−(α+ P k j=1 β j x ij ) Để thuận tiện ta kí hiệu P(Y i = 1|X 1 =x i1 , , X k =x ik ) =π i Khi đó P(Y i = 0 |
X 1 =x i1 , , X k =x ik ) = 1−π i Xác suất để biến phụ thuộc Y nhận giá trị bằngytại quan sát thứ i là
P(Yi =yi |X1 =xi1, , Xk =xik) =π(xi) y i [1−π(xi)] 1−y i
Các bước để ước lượng tham số trong mô hình hồi qui logistic bằng phương pháp ước lượng hợp lí cực đại là:
Bước 1: Lập hàm hợp lý L(θ)và sử dụng giả thiết về tính độc lập của các quan sát ta có
Bước 2: Lấy ln 2 vế của phương trình 1.2.3 ta được: lnL(θ) n
Bước 3: Lấy đạo hàm riêng của hàm lnL(θ) theo các biến α, β j ta được:
Bước 4: Giải hệ phương trinh đạo hàm riêng :
Nghiệm của hệ phương trình 1.2.4 chính là ước lượng hợp lý cực đại của các tham sốα, β j
Chứng minh Lấy đạo hàm riêng cấp 2 của hàm lnL(θ) theo các biến α, β j ta được:
X i=1 x ij x im π i (1−π i ) với j, m= 1, k Đặt y = (y 1 , y 2 , , y n ) T , π = (π 1 , π 2 , , π n ) T là các ma trận cấp n×1, X là ma trận thiết kế cấpn×(k+ 1) được xác định bởi công thức:
V = (v ij )là ma trận đường chéo cấp n×n mà các phần tử trên đường chéo được xác định bởi vii=πi(1−πi)với i= 1, n
Đạo hàm cấp 1 và cấp 2 của hàm lnL(θ) theo các biến α, βj được biểu diễn dưới dạng ma trận: l 0 (θ) = X T (y−π) và l 00 (θ) =−X T V X Để chứng minh rằng nghiệm của hệ phương trình đạo hàm riêng là ước lượng hợp lý cực đại cho các tham số α, βj, cần chỉ ra rằng đạo hàm cấp 2 của hàm lnL(θ) không dương với mọi θ ∈ R k+1.
Thật vậy giả sử u là một phần tử bất kỳ thuôc R k+1 Biểu diễn u T l 00 (θ)u dưới dạng ma trận ta được u T l 00 (θ)u=−u T X T V Xu=−Pn i=1(x T i u) 2 V
Các phần tử trên đường chéo chính của ma trận V đều là số dương, dẫn đến u T l 00 (θ)u ≤ 0 cho mọi u ∈ R k+1 Điều này cho thấy hàm lnL(θ) là hàm lõm, vì vậy điểm cực trị của nó sẽ là điểm cực đại.
Trong nghiên cứu này, chúng tôi tiến hành ước lượng các tham số trong mô hình hồi quy logistic nhị phân với biến phụ thuộc là "hình thành thai" và hai biến độc lập: "niêm mạc tử cung" và "thời gian vô sinh" Biến "niêm mạc tử cung" được mã hóa dưới dạng nhị phân với hai giá trị 0 và 1, trong khi "thời gian vô sinh" là một biến liên tục.
Bảng 1.1: ước lượng hệ số βb p-value Tỷ số chênh OR nmtc 682 008 1.978 thoigianvs -.042 011 959
Từ bảng 1.1 ta thấy ước lượng hệ số của biến "niêm mạc tử cung" là 0.682, và của biến "thời gian vô sinh" là - 0.042.
1.2.2 Ước lượng sai số chuẩn của các hệ số hồi qui
Ma trân hiệp phương sai S của các hệ số được xác định bởi công thức
S = (X T V X) −1 trong đó ma trận X, V được xác định như trong mục 1.2.1 Khi đó ước lượng ma trân hiệp phương sai Sbtương ứng được xác định bởi công thức:
Sb= (X T V Xb ) −1 với Vb xác định như sau:
Để tính ước lượng sai số chuẩn, ta lấy căn bậc hai của các phần tử trên đường chéo chính của ma trận hiệp phương sai.
1.2.3 Kiểm tra sự phù hợp của mô hình
Kiểm tra sự phù hợp của mô hình hồi qui logistic nhị phân chính là kiểm tra giả thuyết
Có hai phương pháp chính để kiểm tra sự phù hợp của mô hình hồi quy logistic nhị phân: phương pháp kiểm tra tỷ số hợp lý và phương pháp sử dụng tiêu chuẩn Wald.
A Phương pháp kiểm tra tỷ số hợp lý
Giá trị cực đại của hàm hợp lý trong mô hình không có biến độc lập được ký hiệu là L H, với giá trị ước lượng tương ứng là Lc H Trong khi đó, L K là giá trị cực đại của hàm hợp lý trong mô hình có biến độc lập, với giá trị ước lượng tương ứng là Lc K.
Tỷ số Lc H /Lc K được gọi là tỷ số hợp lý của mô hình hồi qui logistic Khi đó đại lượng thống kê
Tiêu chuẩn Lc K) được sử dụng để kiểm tra sự phù hợp của mô hình hồi quy logistic với dữ liệu thu thập Theo định lý Hosmer - Lemeshow, nếu giả thuyết H đúng, thì thống kê LR sẽ có phân phối gần giống với phân phối Khi bình phương với k bậc tự do Định lý này đã được chứng minh thông qua phương pháp mô phỏng.
Các bước để kiểm tra giả thuyết:
Bước 1: Tính đại lượng thống kê LR Đặt giá trị này là c.
Bước 2: Gọi Z là biến ngẫu nhiên có phân phối Khi bình phương với k bậc tự do Ta đặt α=P(Z > c) Bước 3: So sánh α với mức ý nghĩa α 0 cho trước;
- Nếu α ≤α 0 ta bác bỏ giả thuyết H (với mức ý nghĩa α 0 100%)
- Nếu α > α 0 ta chấp nhận giả thuyết H ( với độ tin cậy (1−α 0 ).100%)
B Kiểm định theo tiêu chuẩn Wald
Tiêu chuẩn thống kê Wald kí hiệu là W, được xác định bởi công thức:
W = θc T (X T V X)bθ, trong đó θb = (α, b, βc1, βb2, βb3, , βbk)T là ước lượng hợp lý cực đại của vector hệ số X là ma trận thiết kế, và V là ma trận đường chéo được xác định theo định lý 1.2.2 Nếu giả thuyết H đúng, thì đại lượng thống kê W có phân phối xấp xỉ phân phối Khi bình phương với k bậc tự do.
Từ đó ta có các bước kiểm tra giả thuyết theo tiêu chuẩn Wald là
Bước 1: Tính tiêu chuẩn thống kê W
Bước 2: Gọi Z là biến ngẫu nhiên có phân phối Khi bình phương với k bậc tự do Ta đặt α=P(Z > W) (1.2.5)
Bước 3: So sánh α với mức ý nghĩa α 0 cho trước:
- Nếu α ≤α 0 ta bác bỏ giả thuyết H (với độ tin cậy α 0 100%).
- Nếu α > α 0 ta chấp nhận giả thuyết H (với độ tin cậy (1−α 0 ).100%)
Chú ý : Trong trường hợp mô hình chỉ có một biến độc lập thì tiểu chuẩn thống kê Wald có thể tính theo công thức đơn giản sau :
W = βb 1 / SE(βc 1), trong đó βb 1 là ước lượng tham số β 1 theo phương pháp ước lượng hợp lý cực đại, và SE(βc 1) là sai số chuẩn của ước lượng βb 1 Theo định lý 1.2.2, nếu giả thuyết H đúng, thì đại lượng thống kê W sẽ có phân phối xấp xỉ phân phối chuẩn N(0,1).
Để kiểm tra tiêu chuẩn Wald cho mô hình với một biến độc lập, quy trình thực hiện tương tự như trường hợp tổng quát Trong Bước 2, cần sử dụng Z là biến ngẫu nhiên có phân phối chuẩn N(0,1).
Khi mô hình chỉ có một biến độc lập, việc kiểm tra theo tiêu chuẩn Wald trở nên đơn giản hơn so với tiêu chuẩn tỷ số hợp lý Do đó, tiêu chuẩn Wald được ưu tiên sử dụng trong các kiểm tra mô hình với một biến độc lập cũng như trong việc kiểm tra giả thuyết bằng không cho từng hệ số hồi quy.
Mô hình hồi qui logistic bội
Mô hình hồi quy logistic bội được áp dụng khi biến phụ thuộc Y có hơn hai giá trị phân loại, thường là ba giá trị được mã hóa bằng các số 0, 1, 2 trong trường hợp đơn giản nhất Mô hình này có thể được mở rộng để xử lý nhiều hơn ba giá trị phân loại Trong mô hình hồi quy logistic bội, một trong các giá trị phân loại sẽ được chọn làm giá trị tham khảo, và các giá trị còn lại sẽ được so sánh với giá trị này Lựa chọn giá trị tham khảo phụ thuộc vào ý đồ của nhà nghiên cứu, tuy nhiên, việc thay đổi giá trị tham khảo không ảnh hưởng đến cấu trúc của mô hình mà chỉ làm thay đổi giá trị và cách giải thích các tham số ước lượng.
1.3.1 Định nghĩa mô hình hồi qui logistic bội
Giả sử có k biến độc lập X1, X2, X3, X4, , Xk được sử dụng để dự báo, được biểu diễn dưới dạng vector X (X1, X2, X3, X4, , Xk) T Các biến Xj có thể là biến định tính hoặc biến định lượng Biến phụ thuộc Y nhận ba giá trị phân loại, được mã hóa bằng ba số 0, 1, 2.
Ta chọn giá trị phân loại Y = 0 làm giá trị tham khảo Khi đó mô hình hồi qui logistic bội có dạng: lnP(Y = 1|X1, X2, , Xk)
X j=1 β 2j X j trong đó α 1 , α 2 , β 1j , β 2j là các tham số chưa biết (j = 1, k)
P j=1 β 2j X j Để thuận tiện ta kí hiệu P(Y =u/X 1 , X 2 , , X k )=P(Y =u/X)
Vì P(Y = 1 |X)+ P(Y = 0 |X)+P(Y = 2|X) = 1 nên thay 1.3.1,và 1.3.2 vào ta có : e α 1 + k
Thay 1.3.3 vào 1.3.1 và 1.3.2 ta suy ra:
1.3.2 Ước lượng các tham số trong mô hình hồi qui logistic bội Để ước lượng các tham số trong mô hình hồi qui logistic bội người ta sử dụng phương pháp ước lượng hợp lý cực đại.
Giả sử có n quan sát độc lập Tại quan sát thứ i xác suất để biến phụ thuộc Y nhận giá trị bằng u ( (u= 0,2)được kí hiệu bởi Π iu Π i1 =P(Y i = 1|X 1 =x i1 , X 2 =x i2 , , X k =x ik ) Π i0 =P(Y i = 0|X 1 =x i1 , X 2 =x i2 , , X k =x ik ) Π i2 =P(Y i = 2|X 1 =x i1 , X 2 =x i2 , , X k =x ik )
Từ định nghĩa của mô hình hồi qui logistic bội ta có ln(Π i1 Π i0 ) = α 1 + k
1 Nếu tại quan sát thứ i biến phụ thuộc Y nhận giá trị bằng 0
0 Trong các trường hợp còn lại. y i1
1 Nếu tại quan sát thứ i biến phụ thuộc Y nhận giá trị bằng 1
0 Trong các trường hợp còn lại. yi2
1 Nếu tại quan sát thứ i biến phụ thuộc Y nhận giá trị bằng 2
0 Trong các trường hợp còn lại. với y i0 +y i1 +y i2 =1
Như vậy xác suất để tại quan sát thứ i biến phụ thuộc Y nhận giá trị y là
Vì yi0+yi1+yi2=1 nênyi0 = 1−yi1−yi2 Do đó P(Yi =yi) = Π 1−y i0 i1 −y i2 Π y i1 i1 Π y i2 i2
Qui trình để ước lượng tham số trong mô hình hồi qui logistic bội:
Bước 1: Lập hàm hợp lý L và sử dụng tính độc lập của các quan sát ta có
Bước 2: Lấy ln của hàm hợp lý ta có: lnL=Σ n i=1 [y i1 ln(Π i1 Π i0 ) +y i2 ln(Π i2 Π i0 ) +lnΠ i0 ]
Bước 3: Lấy đạo hàm của hàmlnL theo các tham số α 1 , α 2 , β 1j , β 2j vớij = 1, k ta có :
Bước 4: Giải hệ phương trình đạo hàm riêng:
Nghiệm của hệ phương trình 1.3.4 là ước lượng hợp lý cực đại cho các tham số α 1, α 2, β 1j và β 2j Chứng minh rằng nghiệm của hệ phương trình này là điểm cực đại của hàm lnL tương tự như đã trình bày trong mục 1.2.1.
Mô tả số liệu và phần mềm sử dụng trong phân tích
Nguồn gốc số liệu
Dữ liệu phân tích trong luận văn cung cấp thông tin về các bệnh nhân vô sinh đã thực hiện kỹ thuật thụ tinh trong ống nghiệm tại Trung tâm hỗ trợ sinh sản Bệnh viện Phụ Sản Trung ương, trong khoảng thời gian từ tháng 1 đến tháng 12 năm 2009.
Bệnh viện Phụ Sản Trung ương, trước đây gọi là bệnh viện C, tọa lạc tại 43 Tràng Thi, Hoàn Kiếm, Hà Nội Đây là một trong hai bệnh viện hàng đầu chuyên về Phụ Sản và Sơ sinh tại Việt Nam, cùng với bệnh viện Từ Dũ.
Bệnh viện Phụ - Sản Trung ương là cơ sở y tế hàng đầu với quy mô 700 giường bệnh nội trú, 14 khoa lâm sàng, 09 khoa cận lâm sàng và 07 trung tâm Bệnh viện không chỉ chuyên về phụ sản, sinh đẻ kế hoạch và sơ sinh mà còn là trung tâm đào tạo đại học và sau đại học, nghiên cứu khoa học, cùng với việc chỉ đạo tuyến và chuyển giao công nghệ trong lĩnh vực này trên toàn quốc Với bề dày lịch sử và đội ngũ giáo sư, bác sĩ được đào tạo bài bản trong nước và nâng cao tay nghề ở nước ngoài, bệnh viện cam kết cung cấp dịch vụ chăm sóc sức khỏe sinh sản chất lượng cao.
Dưới thời Pháp thuộc, khu vực bệnh viện hiện nay là một nhà tu, sau là nhà thương
Bệnh viện Phụ - Sản Trung ương có nguồn gốc từ bệnh viện “C”, được thành lập vào ngày 19/7/1955 theo Nghị định 615-ZYO/NĐ/3A của Bộ trưởng Bộ Y tế Hoàng Tích Trí Đến năm 1960, bệnh viện được tổ chức lại theo hướng chuyên khoa phụ sản Ngày 14/5/1966, Thủ tướng Phạm Văn Đồng ký Quyết định số 88/CP đổi tên bệnh viện “C” thành Viện Bảo vệ Bà mẹ và Trẻ sơ sinh, đánh dấu sự ra đời của một viện chuyên ngành đầu tiên tại Việt Nam nghiên cứu sức khỏe phụ nữ và trẻ sơ sinh Đến năm 2003, để đáp ứng nhu cầu chăm sóc sức khỏe sinh sản ngày càng cao, Bộ Y tế đã ký Quyết định 2212/QĐ-BYT đổi tên viện thành bệnh viện Phụ - Sản Trung ương, tiếp tục thực hiện các chức năng khám, chữa bệnh với yêu cầu cao hơn trong tình hình mới.
Mô tả số liệu
2.2.1.1 Các biến độc lập liên tục a "thời gian vô sinh" : Số năm bệnh nhân bị vô sinh.
Bảng 2.1: Thời gian vô sinh Trung bình Trung vị Độ lệch chuẩn Phương sai Min Max
Thời gian mắc bệnh vô sinh của bệnh nhân dao động từ 1 năm đến 39 năm, với trung bình là 5,82 năm Về độ tuổi của người mẹ trong quá trình điều trị, tuổi thấp nhất ghi nhận là 21 tuổi với 3 trường hợp, trong khi tuổi cao nhất là 54 tuổi với 1 trường hợp, và độ tuổi trung bình là 33,41 tuổi.
Để đánh giá ảnh hưởng của tuổi mẹ đối với kết quả thụ tinh trong ống nghiệm, người ta thường phân chia tuổi mẹ thành 4 nhóm giai đoạn: nhóm không quá 35 tuổi, nhóm từ 35 đến 37 tuổi, nhóm từ 38 đến 40 tuổi và nhóm trên 40 tuổi Việc phân loại này giúp nghiên cứu rõ hơn về mối liên hệ giữa độ tuổi và tỷ lệ thành công của quy trình thụ tinh trong ống nghiệm.
30, nhóm 31 - 35, nhóm 36 - 40, nhóm từ 41 trở lên Vì vậy trong phân tích này biến
"tuổi" được mã hóa lại thành biến "nhóm tuổi" Cụ thể như sau:
+ "nhóm tuổi từ 41": Gồm các bệnh nhân từ 41 tuổi trở lên.
+ "nhóm tuổi từ 36 đến 40": Gồm các bệnh nhân từ 36 đến 40 tuổi.
+ "nhóm tuổi từ 31 đến 35": Gồm các bệnh nhân từ 31 đến 35 tuổi.
+ "nhóm tuổi k quá 30": Gồm các bệnh nhân từ 0 đến 30 tuổi.
Bảng 2.2: Nhóm tuổi của người mẹ nhomtuoi N (Số bệnh nhân) Tỷ lệ (%) nhomtuoitu41 84 7 nhomtuoi36den 40 315 26.1 nhomtuoi31den 35 454 37.6 nhomtuoikqua30 355 29.4
Theo bảng 2.2, nhóm bệnh nhân từ 31 đến 35 tuổi có số lượng điều trị vô sinh cao nhất với 454 bệnh nhân, chiếm 37.6% Ngược lại, nhóm bệnh nhân từ 41 tuổi trở lên có số lượng thấp nhất, chỉ với 84 bệnh nhân, tương đương 7%.
Vì biến "nhóm tuổi" có 4 giá trị, nó được mã hóa thành 3 biến nhị phân Biến "nhóm tuổi không quá 30" được chọn làm nhóm đối chứng Cụ thể, "nhóm tuổi 31 đến 35" sẽ nhận giá trị 1 khi biến "nhóm tuổi" có giá trị bằng 3.
+ "nhóm tuổi 36 đến 40" nhận giá trị bằng 1 nếu biến "nhóm tuổi "nhận giá trị bằng 2
+ "nhóm tuổi từ 41" nhận giá trị bằng 1 nếu biến " nhomtuoi " nhận giá trị bằng 1. c."Sảy": Số lần bệnh nhân đã bị sảy thai.
Bảng 2.3: Sảy thai say N Tỷ lệ ( % )
Trong tổng số 1208 bệnh nhân có 688 bệnh nhân chưa từng bị sảy thai chiếm tỉ lệ
Trong một nghiên cứu, 57% trong số 520 bệnh nhân đã từng trải qua sảy thai, chiếm tỷ lệ 43% Đáng chú ý, có 17 bệnh nhân đã từng bị sảy thai từ 5 lần trở lên Thêm vào đó, "số chu kỳ IVF" đề cập đến số lần bệnh nhân đã thực hiện thụ tinh trong ống nghiệm trước đó.
Theo bảng 2.4, hầu hết các bệnh nhân trong phân tích đã từng trải qua quy trình thụ tinh trong ống nghiệm, với chỉ 3 bệnh nhân thực hiện thụ tinh trong ống nghiệm lần đầu Số lượng bệnh nhân đã có kinh nghiệm thực hiện thụ tinh trong ống nghiệm chiếm ưu thế trong nghiên cứu này.
1 lần chiếm tỉ lệ cao nhất Có 14 bệnh nhân đã thực hiện thu tinh trong ống nghiệm từ 5 lần trở lên.
Bảng 2.4: Số lần thụ tinh trong ống nghiệm sockivf N Tỷ lệ ( % )
Tổng liều thuốc FSH mà bệnh nhân sử dụng là 1208 100 e, được tính bằng mg FSH (hormone kích thích nang trứng) là một nội tiết tố quan trọng giúp kích thích sự phát triển của nang noãn Thông thường, cơ thể chỉ sản xuất đủ FSH để một nang trứng phát triển thành nang trưởng thành Việc sử dụng thuốc FSH cho phép thu được nhiều noãn trưởng thành hơn trong một chu kỳ kinh.
Trong một nghiên cứu với 1208 bệnh nhân được kích thích buồng trứng bằng thuốc FSH, liều thuốc sử dụng dao động từ 900 mg đến 5600 mg Trung bình, bệnh nhân nhận tổng liều là 2277 mg, với giá trị trung vị là 2250 mg.
Để đánh giá hiệu quả thu được noãn trưởng thành từ các tổng liều khác nhau, biến "tổng liều" được mã hóa thành biến "nhóm tổng liều" Biến "nhóm tổng liều" là biến định tính với 3 mức: nhóm tổng liều nhỏ hơn 2000 mg, nhóm tổng liều từ 2000 đến 3000 mg, và nhóm tổng liều lớn hơn 3000 mg Như vậy, biến tổng liều được phân thành 3 nhóm tương ứng.
+ "tổng liều nhỏ 2000" : Nhóm bệnh nhân sử dụng tổng số liều FSH nhỏ hơn 2000mg trong cả đợt điều trị kích thích buồng trứng.
+ "tổng liều lớn 3000" : Nhóm bệnh nhân sử dụng tổng số liều FSH lớn hơn 3000mg trong cả đợt điều trị kích thich buồng trứng.
+ "tổng liều từ 2000 đến 3000" : Nhóm bệnh nhân sử dụng tổng liều FSH từ 2000 đên 3000 mg trong cả đợt điều trị.
Bảng 2.5: Nhóm tổng liều thuốc FSH nhóm tổng liều N Tỷ lệ (%) nhóm tổng liều nhỏ 2000 378 31.3 nhóm tổng liều lớn 3000 158 13.1 nhóm tổng liều 2000 đến 3000 672 55.6
Biến "nhóm tổng liều" là biến độc lập với 3 giá trị, được mã hóa thành 2 biến nhị phân Nhóm bệnh nhân sử dụng "tổng liều từ 2000 đến 3000" được chọn làm nhóm đối chứng.
+ "nhóm tổng liều nhỏ 2000" nhận giá trị bằng 1 nếu "nhomtonglieu" nhận giá trị bằng 1.
Nhóm tổng liều lớn 3000 sẽ nhận giá trị bằng 1 khi "nhomtonglieu" có giá trị bằng 2 Nồng độ nội tiết tố FSH của bệnh nhân được đo vào ngày thứ 3 của vòng kinh, với đơn vị tính là IU/L.
Trong nghiên cứu với 1208 bệnh nhân điều trị, nồng độ FSH vào ngày thứ 3 dao động từ 0.1 IU/L đến 78 IU/L Cụ thể, có một trường hợp ghi nhận nồng độ FSH thấp nhất là 0.1 IU/L và một trường hợp có nồng độ cao nhất là 78 IU/L Trung bình, nồng độ FSH vào ngày thứ 3 là 7.3 IU/L, với giá trị trung vị là 6.9 IU/L.
Nồng độ FSH vào ngày thứ 3 của chu kỳ kinh nguyệt ở người bình thường không vượt quá 10 IU/L Để đánh giá tác động của nồng độ FSH ngày 3 đối với kết quả thụ tinh, người ta đã chuyển đổi biến FSH ngày 3 thành một biến nhị phân.
0: Nếu nồng độ FSH ngày thứ 3 của vòng kinh > 10 IU/l.
1: Nếu nồng độ FSH ngày thứ 3 của vòng kinh ≤ 10 IU/L.
Theo bảng 2.6, trong số 1208 bệnh nhân, có 1095 bệnh nhân có nồng độ FSH ngày 3 bình thường, chiếm tỷ lệ 90.6% Ngược lại, chỉ có 113 bệnh nhân có nồng độ FSH ngày 3 cao, chiếm tỷ lệ 9.4%.
Bảng 2.6: Nồng độ FSH ngày 3 fshn3 N (Số bệnh nhân) Tỷ lệ (%)
Tổng số 1208 100 g "niêm mạc tử cung" : Độ dày của niêm mạc tử cung ngày tiêm HCG, đơn vị tính là mm.
Trong nghiên cứu với 1208 bệnh nhân điều trị, độ dày niêm mạc tử cung dao động từ 2 mm đến 22 mm, với 1 trường hợp ở mỗi mức độ Độ dày trung bình của niêm mạc tử cung trong mẫu phân tích đạt 11.026 mm, trong khi giá trị trung vị là 11 mm.
Phần mềm phân tích SPSS 43 Chương 3
SPSS, which stands for Statistical Package for the Social Sciences, is a specialized statistical software Initially developed in the 1960s, it was exclusively used on mainframe computers but has since evolved to be compatible with personal computers.
Phần mềm SPSS được sử dụng để xử lý thông tin sơ cấp, tức là dữ liệu thu thập trực tiếp từ đối tượng nghiên cứu Sau khi được xử lý, thông tin sẽ trở thành dữ liệu định lượng, mang ý nghĩa thống kê rõ ràng.
Phần mềm SPSS cho phép người dùng thiết kế bảng biểu và sơ đồ thống kê, tính toán các đặc trưng mẫu trong thống kê mô tả, đồng thời cung cấp một hệ thống đầy đủ các phương pháp phân tích thống kê.
Bài viết này so sánh các mẫu bằng nhiều tiêu chuẩn tham số và phi tham số, bao gồm các bài kiểm tra phi tham số (Nonparametric Test) Nó cũng đề cập đến các mô hình phân tích phương sai theo dạng tuyến tính tổng quát (General Linear Models) và các mô hình hồi quy đơn biến, nhiều biến, cũng như hồi quy phi tuyến tính (Nonlinear) và hồi quy Logistic.
+ Phân tích theo nhóm (Cluster Analysis);
+ Phân tích tách biệt (Discriminatory Analysis);
+ Và nhiều chuyên sâu khác (Advanced Statistics).
SPSS được ứng dụng trong hầu hết các lĩnh vực của xã hội chẳng hạn như:
+ Ứng dụng SPSS trong nghiên cứu tâm lý học: tâm lý tội phạm, tâm lý học sinh-sinh viên ;
+ Ứng dụng SPSS trong nghiên cứu xã hội học: ý kiến của người dân trong việc xây dựng lại khu chung cư, thống kê y tế ;
+ Ứng dụng SPSS trong nghiên cứu thị trường: nghiên cứu và định hướng phát triển sản phẩm, mở rộng thị trường; sự hài lòng của khách hàng ;
+ Ứng dụng SPSS nghiên cứu đa dạng sinh học, trong phát triển nông lâm nghiệp .
Sử dụng phần mềm thống kê SPSS cho phép phân tích thực trạng, xác định các yếu tố ảnh hưởng và dự đoán xu hướng tương lai Điều này giúp đưa ra quyết định chính xác và giải quyết vấn đề một cách nhanh chóng, hiệu quả.
Phân tích kết quả điều trị vô sinh tại bệnh viện phụ sản trung ương
3.1 Ảnh hưởng của các biến độc lập lên biến "hình thành noãn"
Trong tổng số 1208 bệnh nhân điều trị có 1203 bệnh nhân có noãn, và 5 bệnh nhân không có noãn để tiến hành chọc hút.
Trong nghiên cứu này, tất cả bệnh nhân đều áp dụng các biện pháp nhằm tăng số lượng noãn thu được trong một chu kỳ kinh Tuy nhiên, vẫn có trường hợp bệnh nhân không sản xuất noãn Để phân tích ảnh hưởng của các yếu tố đến sự hình thành noãn, chúng tôi đã xây dựng mô hình hồi quy logistic nhị phân, trong đó biến phụ thuộc "hình thành noãn" được xác định là 1 nếu có noãn sau điều trị và 0 nếu không có noãn.
Trong mô hình nghiên cứu này, chúng tôi đã loại bỏ các biến độc lập như "số noãn", "niêm mạc tử cung", "sinh", "số phôi" và "số phôi chuyển" Do đó, các biến độc lập còn lại bao gồm: thời gian vô sinh, nhóm tuổi, số chu kỳ IVF, nhóm tổng liều, FSHN3, nguyên nhân và phác đồ điều trị.
Trước hết ta trình bày mô hình với đầy đủ các biến độc lập kể trên Kết quả cho ra được trình bày trong bảng 3.1
Bảng 3.1: Mô hình đầy đủ với biến phụ thuộc là biến hình thành noãn
Các biến độc lập P- giá trị Tỷ số chênh OR
Phác đồ nganvoiantagonist 1.000 1.648 nganvoiagonist 989 000 pddai - - tổng liều < 2000mg 992 2.049E6
Theo bảng 3.1, trong mô hình với tất cả các biến độc lập nêu trên, mức ảnh hưởng của các biến này không có ý nghĩa thống kê.
Phương pháp Backward:Wald giúp loại bỏ các biến độc lập có ảnh hưởng thấp, từ đó tạo ra mô hình thu gọn Kết quả chi tiết được thể hiện trong bảng 3.2.
Bảng 3.2: Mô hình thu gọn với biến phụ thuộc là biến hình thành noãn
Các biến độc lập P- giá trị Tỷ số chênh OR nhomtuoitu 41 018 112
Biến "nhómtuổitừ41" có ảnh hưởng thống kê đáng kể đến khả năng hình thành noãn, với p-giá trị nhỏ hơn 0.05 Cụ thể, bệnh nhân từ 41 tuổi trở lên chỉ có 11.2% khả năng có noãn để tiến hành chọc hút so với nhóm bệnh nhân dưới 41 tuổi.
3.2 Ảnh hưởng của các biến độc lập lên biến "nhóm số noãn"
Trong nghiên cứu với 1203 bệnh nhân thu được noãn, số lượng noãn thu được dao động từ 1 đến 26 Để xác định các yếu tố khác biệt giữa các nhóm số noãn, mô hình hồi quy logistic bội đã được xây dựng với biến phụ thuộc là "nhóm số noãn" Biến này được phân loại thành ba mức: từ 1 đến 5 noãn, từ 6 đến 10 noãn, và từ 11 noãn trở lên, trong đó nhóm từ 6 đến 10 noãn được chọn làm nhóm đối chứng.
Các biến độc lập trong mô hình bao gồm thời gian vô sinh, nhóm tuổi, sảy thai, số chu kỳ IVF, nhóm tổng liều, FSHN3, nguyên nhân và phác đồ điều trị Kết quả so sánh giữa nhóm có số noãn từ 1 đến 5 và nhóm từ 6 đến 10 được trình bày trong bảng 3.3, cho thấy những điểm khác biệt rõ rệt giữa hai nhóm này.
Các yếu tố có ảnh hưởng thống kê đến xu hướng thu được từ 1 đến 5 noãn hoặc từ 6 đến 10 noãn bao gồm: số chu kỳ IVF, nhóm tuổi từ 31 đến 35, phác đồ ngắn với Agonist, tổng liều thuốc nhỏ hơn 2000 mg, tổng liều thuốc lớn hơn 3000 mg và nồng độ FSH n3 Các yếu tố này đóng vai trò quan trọng trong việc xác định số lượng noãn thu được trong quá trình điều trị.
Khi tăng số chu kỳ thụ tinh trong ống nghiệm thêm một lần, khả năng thu được từ 1 đến 5 noãn sẽ giảm, trong khi khả năng thu được từ 6 đến 10 noãn lại không bị ảnh hưởng.
Bảng 3.3: Kết quả so sánh nhóm số noãn từ 1 đến 5 với nhóm số noãn từ 6 đến 10
Các biến độc lập P- giá trị Tỷ số chênh OR
6 30 Phác đồ nganvoiantagonist 871 958 nganvoiagonist 000 1.976 pddai - - tổng liều < 2000mg 000 528
Bệnh nhân trong nhóm tuổi từ 31 đến 35 có khả năng thu được từ 1 đến 5 noãn chỉ đạt 67.8% so với nhóm bệnh nhân dưới 30 tuổi, trong khi khả năng thu được từ 6 đến 10 noãn vẫn cao hơn.
35 thì khả năng thu được 6 đến 10 noãn nhiều hơn khả năng thu được 1 đến 5 noãn.
Ảnh hưởng của các biến độc lập lên biến "hình thành thai"
Trong nghiên cứu với 1171 bệnh nhân chuyển phôi, có 835 bệnh nhân không có thai và 336 bệnh nhân có thai Để xác định các yếu tố ảnh hưởng đến khả năng hình thành bào thai, chúng tôi đã xây dựng mô hình hồi quy logistic nhị phân, trong đó biến phụ thuộc "hình thành thai" nhận giá trị 1 nếu bệnh nhân có thai và 0 nếu không có thai.
Các biến độc lập trong mô hình nghiên cứu bao gồm thời gian vô sinh, nhóm tuổi, số lần sảy thai, số chu kỳ IVF, tổng liều thuốc, nồng độ FSHN3, nguyên nhân gây vô sinh, phác đồ điều trị, số lượng sinh, số noãn, số phôi và số phôi được chuyển.
Kết quả từ mô hình với các biến độc lập được trình bày trong bảng 3.5 cho thấy ảnh hưởng đáng kể của các yếu tố như "Phác đồ ngắn với Agonist, nhóm tuổi từ 41, số noãn, số phôi, và số phôi chuyển" đến khả năng có thai.
Phương pháp Backward: Wald cho phép loại bỏ dần các biến độc lập có ảnh hưởng thấp, từ đó tạo ra mô hình thu gọn hiệu quả hơn Kết quả chi tiết được trình bày trong bảng 3.6.
Bảng 3.5: Mô hình đầy đủ với biến phụ thuộc là biến hình thành thai
Các biến độc lập P- giá trị Tỷ số chênh OR
Phác đồ nganvoiantagonist 498 832 nganvoiagonist 042 715 pddai - - tổng liều < 2000mg 932 1.014
Bảng 3.6: Mô hình thu gọn biến phụ thuộc là biến hình thành thai
Các biến độc lập P- giá trị Tỷ số chênh OR sockivf 0697 849
NNDohaivc 056 626 nhomtuoitu41 012 352 pdnganvoiAgonist 035 718 nmtc 063 1.647 sonoan 019 923 sophoi 000 1.222 spchuyen 009 1.224
So sánh bảng 3.5 và bảng 3.6 cho thấy sự xuất hiện của biến "không rõ nguyên nhân" có ảnh hưởng thống kê đến khả năng hình thành thai Dựa trên bảng 3.6, có thể rút ra một số kết luận quan trọng liên quan đến yếu tố này.
Nhóm bệnh nhân không xác định được nguyên nhân gây vô sinh chỉ có khả năng mang thai là 66,3% so với nhóm bệnh nhân có nguyên nhân vô sinh do vấn đề ở tử cung.
+ Nhóm bệnh nhân từ 41 tuổi trở lên thì khả năng có thai chỉ bằng 35.2 % so với nhóm bệnh nhân dưới 41 tuổi.
+ Nhóm bệnh nhân làm phác đồ ngắn với Agonist khả năng có thai chỉ bằng 71.8
%so với nhóm bệnh nhân sử dụng hai phác đồ còn lại là phác đồ ngắn với antagonist và phác đồ dài.
+ Đối với biến số noãn chọc hút được: Khi số noãn chọc hút được tăng lên 1 noãn thì khả năng có thai giảm đi 8%.
+ Đối với biến số phôi: Số phôi tăng thêm 1 thì khả năng có thai tăng gấp 1.222 lần.
+ Đối với biến số phôi chuyển: Sô phôi chuyển tăng thêm 1 phôi thì khả năng có thai tăng gấp 1.224 lần.
Ảnh hưởng của các biến độc lập lên biến "sảy1"
Sau khi bệnh nhân mang thai, có thể xảy ra các sự cố như sảy thai hoặc thai chết lưu Để xác định các yếu tố ảnh hưởng đến nguy cơ sảy thai, chúng ta sẽ xây dựng mô hình hồi quy logistic nhị phân với biến phụ thuộc "sảy1" Biến "sảy1" có giá trị 1 nếu bệnh nhân bị sảy thai và giá trị 0 nếu không.
Trong tổng số 336 bênh nhân có thai, có 39 bệnh nhân bị sảy thai, còn lại 297 bệnh nhân không bị sảy thai.
Các biến độc lập trong mô hình nghiên cứu bao gồm thời gian vô sinh, số lần sảy thai, số chu kỳ IVF, phác đồ điều trị, nhóm tổng liều, mức FSHN3, nhóm tuổi, kết quả sinh, nguyên nhân vô sinh, số lượng noãn, số phôi chuyển và NMTc.
Kết quả chạy mô hình với đầy đủ các biến độc lập kể trên được ghi lại trong bảng 3.7.
Từ bảng 3.7 ta thấy mức độ ảnh hưởng của các biến: "phác đồ ngắn với Antagonist, sinh" lên biến sảy1 có ý nghĩa thống kê.
Phương pháp Backward: Wald cho phép loại bỏ dần các biến độc lập có ảnh hưởng thấp, từ đó tạo ra một mô hình thu gọn hiệu quả Kết quả chi tiết được thể hiện trong bảng 3.8.
So sánh bảng 3.7 và bảng 3.8 cho thấy các biến độc lập có ảnh hưởng thống kê đáng kể đến khả năng xảy thai sau khi thụ tinh trong ống nghiệm không thay đổi Từ bảng 3.8, chúng ta có thể rút ra một số kết luận quan trọng.
Nhóm bệnh nhân sử dụng phác đồ ngắn với Antagonist có nguy cơ sảy thai cao gấp 3.09 lần so với nhóm bệnh nhân áp dụng hai phác đồ khác.
Những bệnh nhân đã từng sinh con có nguy cơ sảy thai khi thực hiện thụ tinh trong ống nghiệm cao gấp 2.9 lần so với những bệnh nhân chưa từng sinh con.
Bảng 3.7: Mô hình đầy đủ với biến phụ thuộc là biến sảy1 Các biến độc lập P- giá trị Tỷ số chênh OR
Phác đồ nganvoiantagonist 036 3.592 nganvoiagonist 980 989 pddai - - tổng liều < 2000mg 933 1.037
6 8mm - - sonoan 248 1.090 sophoi 204 884 spchuyen 538 862 sinh (=1) 015 3.099
Bảng 3.8: Mô hình thu gọn biến phụ thuộc là biến say1 Các biến độc lập P- giá trị Tỷ số chênh OR say 529 899 sockivf 449 1.192
NNDohaivc 244 2.484 nhomtuoitu36den40 100 454 pdnganvoiAntagonist 048 3.090 tonglieulon3000 401 493 sonoan 285 1.079 sophoi 208 889 sinh 013 2.926
Ảnh hưởng của các biến độc lập lên biến "lưu"
Trong một nghiên cứu với 336 bệnh nhân mang thai, có 314 bệnh nhân không gặp phải tình trạng thai chết lưu, trong khi 22 bệnh nhân bị thai chết lưu Để xác định các yếu tố ảnh hưởng đến khả năng thai chết lưu, chúng tôi đã xây dựng mô hình hồi quy logistic với biến phụ thuộc "lưu", trong đó giá trị 1 đại diện cho bệnh nhân bị thai chết lưu và giá trị 0 cho bệnh nhân không bị thai chết lưu.
Trong tổng số 336 bênh nhân có thai, có 22 bệnh nhân bị thai chết lưu, còn lại 314 bệnh nhân không bị thai chết lưu.
Các biến độc lập trong mô hình nghiên cứu bao gồm thời gian vô sinh, số lần sảy thai, số chu kỳ IVF, phác đồ điều trị, nhóm tổng liều, mức FSHN3, nhóm tuổi, tình trạng sinh sản, nguyên nhân vô sinh, số noãn, số phôi chuyển và nmtc.
Kết quả từ mô hình với các biến độc lập được trình bày trong bảng 3.9 cho thấy rằng mức độ ảnh hưởng của các biến này đến khả năng thai bị chết lưu sau thụ tinh trong ống nghiệm không có ý nghĩa thống kê.
Bảng 3.9: Mô hình đầy đủ với biến phụ thuộc là biến lưu Các biến độc lập P- giá trị Tỷ số chênh OR
Phác đồ nganvoiantagonist 229 2.427 nganvoiagonist 859 899 pddai - - tổng liều < 2000mg 843 889
6 8mm - - sonoan 574 1.058 sophoi 385 894 spchuyen 240 1.417 sinh (=1) 274 434
Phương pháp Backward: Wald cho thấy rằng việc loại bỏ các biến độc lập có ảnh hưởng thấp không dẫn đến việc phát hiện yếu tố nào có ý nghĩa thống kê ảnh hưởng đến khả năng thai chết lưu sau khi thụ tinh trong ống nghiệm.
Ảnh hưởng của các biến độc lập lên biến "sinh1"
Trong quá trình mang thai, nhiều yếu tố tác động đến khả năng giữ thai của người mẹ cho đến khi sinh Bài phân tích này tập trung vào các yếu tố của người mẹ trước khi điều trị vô sinh tại Bệnh viện, cũng như các phương pháp điều trị ảnh hưởng đến khả năng sinh con Để thực hiện điều này, chúng tôi xây dựng mô hình hồi quy logistic nhị phân với biến phụ thuộc "sinh1", trong đó giá trị bằng 1 thể hiện bệnh nhân sinh được con và 0 nếu không.
Mẫu phân tích gồm 336 bệnh nhân có thai, với 129 bệnh nhân không sinh được con, 207 bệnh nhân sinh được con.
Các biến độc lập trong mô hình nghiên cứu bao gồm thời gian vô sinh, số lần sảy thai, số chu kỳ IVF, phác đồ điều trị, nhóm tổng liều, nồng độ FSHN3, nhóm tuổi, tình trạng sinh sản, nguyên nhân vô sinh, số lượng noãn, số phôi chuyển và nmtc.
Kết quả chạy mô hình với đầy đủ các biến độc lập được trình bày trong bảng 3.10.
Từ bảng 3.10 ta thấy mức độ ảnh hưởng của biến "số noãn, số phôi" lên khả năng sinh con sau thụ tinh trong ống nghiệm có ý nghĩa thống kê.
Phương pháp Backward: Wald cho phép loại bỏ các biến độc lập có ảnh hưởng thấp, từ đó tạo ra mô hình thu gọn Kết quả này được thể hiện trong bảng 3.11 So sánh giữa bảng 3.10 và bảng 3.11 cho thấy rằng các biến độc lập có ảnh hưởng thống kê đáng kể đến khả năng sinh con sau thụ tinh trong ống nghiệm vẫn không thay đổi.
Từ bảng 3.11 ta có thể rút ra một số kết luận sau:
+ Khi số noãn chọc hút được tăng 1 noãn thì khả năng có thể sinh con của bệnh nhân giảm đi 11.5 %.
Khi số phôi tăng thêm một phôi, khả năng sinh con tăng gấp 1.171 lần Tuy nhiên, mức ảnh hưởng của biến thời gian vô sinh đối với khả năng sinh con không có ý nghĩa thống kê.
Bảng 3.10: Mô hình đầy đủ với biến phụ thuộc là biến sinh1
Các biến độc lập P- giá trị Tỷ số chênh OR
Phác đồ nganvoiantagonist 136 493 nganvoiagonist 549 843 pddai - - tổng liều < 2000mg 861 1.051
6 8mm - - sonoan 039 890 sophoi 019 1.177 spchuyen 669 936 sinh (=1) 205 666
Bảng 3.11: Mô hình thu gọn biến phụ thuộc là sinh1 Các biến độc lập P- giá trị Tỷ số chênh OR thoigianvs 100 947 nmtc 084 2.260 sonoan 023 885 sophoi 016 1.171
Nghiên cứu cho thấy mức độ khác biệt về khả năng sinh sản giữa nhóm bệnh nhân có độ dày niêm mạc tử cung bình thường (> 8mm) và nhóm có độ dày niêm mạc mỏng (≤ 8mm) trong ngày tiêm HCG không có ý nghĩa thống kê.