1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Đề tài xác Định mức Độ Ảnh hưởng của các thông số Điều chỉnh trong máy in 3d Ảnh hưởng Đến chất lượng bản in

59 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xác Định Mức Độ Ảnh Hưởng Của Các Thông Số Điều Chỉnh Trong Máy In 3D Ảnh Hưởng Đến Chất Lượng Bản In
Tác giả Nguyễn Quốc Hùng, Nguyễn Hồ Bá Huy, Nguyễn Kiên Đức, Nguyễn Văn Luân, Đào Vũ Huy Hiếu
Người hướng dẫn Nguyễn Kiều Dung
Trường học Đại Học Quốc Gia Thành Phố Hồ Chí Minh
Chuyên ngành Cơ khí
Thể loại báo cáo bài tập lớn
Năm xuất bản 2024
Thành phố Thành Phố Hồ Chí Minh
Định dạng
Số trang 59
Dung lượng 1,81 MB

Cấu trúc

  • I. TỔNG QUAN DỮ LIỆU (6)
    • 1. Mô tả về bộ dữ liệu (6)
    • 2. Mô tả về biến (6)
  • II. KIẾN THỨC NỀN (7)
    • 1. Tổng quát về mô hình hồi quy tuyến tính bội (7)
    • 2. Hàm hồi quy tổng thể (PRF - Population Regression Function) (7)
    • 4. Các giả thuyết của phương pháp bình phương nhỏ nhất cho mô hình hồi quy tuyến tính bội (9)
    • 5. Phân tích phương sai (10)
    • 6. Khoảng tin cậy và kiểm định các hệ số hồi quy (12)
      • 6.1 Ước lượng khoảng tin cậy đối với các hệ số hồi quy (12)
      • 6.2. Kiểm định giả thiết đối với 𝛃 𝐣 ̇ (13)
      • 7.1 Khái quát về kiểm định WALD (14)
      • 7.2 Kiểm định ý nghĩa của mô hình (15)
    • 8. Đa cộng tuyến (Multicollinearity) (17)
  • III. TIỀN XỬ LÝ SỐ LIỆU (18)
    • 1. Đọc dữ liệu (Import data) (18)
    • 2. Làm sạch dữ liệu (18)
      • 2.1 Kiểm tra dữ liệu khuyết (18)
      • 2.2 Kiểm tra định dạng của biến (19)
      • 2.3 Xử lý định dạng của biến (20)
    • 1. Thực hiện thống kê tổng thể cho các biến (22)
    • 2. Tính toán giá trị thống kê của các biến liên tục (23)
    • 3. Thống kê số lượng cho các biến định tính (23)
    • 4. Vẽ đồ thị histogram (biểu đồ cột) thể hiện phân phối của biến phản hồi (24)
    • 5. Vẽ biểu dồ boxplot (biểu đồ hộp của biến phản hồi so với biến phân loại .22 (25)
      • 5.1 Vẽ biểu đồ boxplot thể hiện phân phổi của của biến roughness (25)
      • 5.2 Vẽ biểu đồ boxplot thể hiện phân phối của biến tension_strenght (26)
      • 5.3 Vẽ biểu đồ boxplot thể hiện phân phối của biến elongation (27)
    • 6. Vẽ ma trận tương quan giữa các biến (28)
    • 7. Vẽ biểu đồ scatter plot (biểu đồ tán xạ) thể hiện phân phối (29)
  • V. THỐNG KÊ SUY DIỄN (32)
    • 1. Xây dựng mô hình hồi quy tuyến tính (32)
      • 1.1 Các mô hình hồi quy (32)
      • 1.2 Kiểm định để tìm mô hình hồi quy phù hợp (39)
    • 2. Vẽ đồ thị kiểm tra các giả định của mô hình (42)
    • 3. Kiểm định trung bình hai mẫu (46)
      • 3.1 Tạo bảng dữ liệu (46)
      • 3.2 Kiểm tra tính chuẩn của biến roughness của các nhóm (49)
      • 3.3 Kiểm định phương sai 2 mẫu (50)
      • 3.4 Bài toán kiểm định trung bình mẫu (50)
      • 3.5 Sự khác biệt về kết luận ở hai bài toán (51)
    • 4. Bài toán anova một yếu tố (52)
      • 4.1 Kiểm tra các điều kiện (54)
      • 4.2 Phân tích phương sai (anova) (57)
  • TÀI LIỆU THAM KHẢO (59)

Nội dung

Vẽ biểu dồ boxplot biểu đồ hộp của biến phản hồi so với biến phân loại .22 5.1 Vẽ biểu đồ boxplot thể hiện phân phổi của của biến roughness...22 5.2 Vẽ biểu đồ boxplot thể hiện phân phối

TỔNG QUAN DỮ LIỆU

Mô tả về bộ dữ liệu

The file "data.csv" contains the dataset from the research group of the Mechanical Engineering Department at TR/Selcuk University The original data is available at: https://www.kaggle.com/datasets/afumetto/3dprinter.

Nghiên cứu này nhằm xác định tác động của các tham số cài đặt đến chất lượng, độ chính xác và độ bền của sản phẩm in Dữ liệu thu thập từ 50 quan sát với 9 tham số cài đặt và 3 thông số đầu ra được đo lường Để đạt được mục tiêu, các thử nghiệm về chất liệu và độ bền đã được thực hiện trên máy thử nghiệm Sincotec GMBH với khả năng kéo tối đa 20 kN.

Mô tả về biến

Các thông số đầu vào (được cài đặt)

STT Biến Loại dữ liệu Đơn vị

1 Layer Height (Độ dày mỗi lớp in) Liên tục (mm)

2 Wall Thickness (Độ dày) Liên tục (mm)

5 Nozzle Temperature (Nhiệt độ mũi) Liên tục 0 C

6 Bed Temperature (Nhiệt độ bàn in) Liên tục 0 C

7 Print Speed (Tốc độ in) Liên tục mm/s

8 Material (Nguyên liệu) Phân loại

9 Fan Speed (FS - Tốc độ quạt) Liên tục %

Các thông số đầu ra (được đo)

1 Roughness (Độ nhám) Liên tục μm

2 Tension Strenght (Sức căng) Liên tục MPa

3 Elongation (Độ giãn dài) Liên tục %

Bảng trên bao gồm 9 biến cài đặt và 3 biến đầu ra quyết định chất lượng bản in Chúng ta sẽ dự đoán chất lượng bản in dựa trên 9 biến cài đặt này Trong đó, có 2 biến phân loại quan trọng là Infill Pattern và Material.

KIẾN THỨC NỀN

Tổng quát về mô hình hồi quy tuyến tính bội

Hồi quy tuyến tính bội là mô hình với một biến phụ thuộc với hai hoặc nhiều biến độc lập:

Trong mô hình hồi quy, các hệ số β được định nghĩa như sau: β₀ là hệ số tung độ góc, trong khi β₁, β₂, β₃, , βₖ lần lượt là các hệ số dốc của biến Y theo các biến X₁, X₂, X₃, , Xₖ, với các biến còn lại giữ nguyên Cụ thể, β₁ thể hiện sự thay đổi của Y khi X₁ thay đổi, trong khi các biến X₂, X₃, , Xₖ không đổi; tương tự cho β₂ và β₃ Cuối cùng, ϵᵢ đại diện cho thành phần ngẫu nhiên, có kỳ vọng bằng 0 và phương sai không đổi σ².

Hồi quy tuyến tính là phương pháp dự đoán giá trị biến phụ thuộc (Y) dựa trên biến độc lập (X), với đặc điểm là các tham số của tổng thể β1 và βk có tính chất tuyến tính Phương pháp này thường được áp dụng để dự đoán các giá trị liên tục, chẳng hạn như thời gian người dùng dừng lại trên một trang web hoặc số lượng truy cập vào một website Qua việc thu thập dữ liệu, chúng ta ước lượng hàm hồi quy của tổng thể, từ đó xác định các tham số β1, β2, , βk.

Hàm hồi quy tổng thể (PRF - Population Regression Function)

Trong mô hình hồi quy, với 𝑌 là biến phụ thuộc và 𝑋1, 𝑋2, … , 𝑋𝑘 là các biến độc lập, biến Y được coi là ngẫu nhiên và tuân theo một phân phối xác suất nhất định Do đó, tồn tại giá trị kỳ vọng E(Y|X1, X2,…, Xk) là một giá trị xác định.

Do vậy F (X1, X2,…, Xk) = E (Y|X1, X2,…, Xk) là hàm hồi quy tổng thể của Y theo X1,

Với một cá thể i, tồn tại (X1,i, X2,i,…, Xk,i, Yi)

Ta có: Yi ≠ F (X1, X2,…, Xk) ⇒ ui = Yi – F

Do vậy: Yi = E (Y|X1, X2,…, Xk) + ui

Hồi quy tổng thể PRF:

3 Hàm hồi quy mẫu (SRF – Sample Regression Function):

Do chúng ta không nắm rõ tổng thể, nên không thể xác định chính xác giá trị trung bình của biến phụ thuộc Vì vậy, cần phải dựa vào dữ liệu mẫu để thực hiện ước lượng.

Trên một mẫu có n cá thể, gọi Y ^ = ^ F (X 1 , X 2 ,… X K )

Với một cá thể mẫu có thể Y ≠ F ^ (X 1 , X 2 ,… X K ) sinh ra ε i = Y − ^ F (X 1, X 2 , X K ) , với 𝜀 𝑖 gọi là phần dư SRF.

Giả sử có một mẫu quan sát với giá trị thực tế là (Xi, X2i, Xki) với (i = 1, 2, 3, k).

Chúng ta sẽ sử dụng thông tin từ mẫu để xây dựng các ước lượng cho các hệ số βm (với m = 1, 2, 3, k) Từ các giá trị ước lượng này, chúng ta có thể viết thành hàm hồi quy.

Ta có hàm hồi quy mẫu tổng quát được viết dưới dạng như sau:

Ước lượng ^ β m được kỳ vọng là một ước lượng không chênh lệch và hiệu quả cho β m Giá trị ước lượng Y ^ l đại diện cho các giá trị Y i, và sai lệch giữa chúng được gọi là phần dư, được tính bằng ε i = Y i − Y ^ l Để ước lượng SRF, cần chọn một phương pháp phù hợp để xác định các tham số của 𝐹, bằng cách tìm các tham số của ^ F và sử dụng giá trị quan sát của các tham số này làm giá trị xấp xỉ cho tham số của 𝐹.

Các giả thuyết của phương pháp bình phương nhỏ nhất cho mô hình hồi quy tuyến tính bội

Xét mô hình hồi quy bội:

Giống như mô hình hồi quy đơn, mô hình hồi quy bội này có các tính chất sau:

 Đường hồi quy bội đi qua điểm

 Các ε i không tương quan với Y ^ : ∑ i=1 n ε i =0 × Y ^ l = 0

 ^ β l là các ước lượng tuyến tính không chệch và có phương sai nhỏ nhất cho các β i ¿

Phân tích phương sai

Để đánh giá mức độ giải thích của mô hình và tỷ lệ phần trăm biến động của biến phụ thuộc, người ta sử dụng chỉ số R².

SSE (Tổng bình phương sai lệch) là tổng bình phương của tất cả các sai lệch giữa các giá trị của biến phụ thuộc Y từ hàm hồi quy mẫu và giá trị trung bình của chúng Nó phản ánh độ chính xác của hàm hồi quy.

SSR (Tổng bình phương sai lệch) là tổng của các bình phương chênh lệch giữa các giá trị quan sát Y và các giá trị dự đoán từ hàm hồi quy.

SST (Tổng bình phương tổng) là tổng của tất cả các bình phương sai lệch giữa các giá trị quan sát Yi và giá trị trung bình SST được phân chia thành hai phần: một phần được tạo ra từ SSE và một phần từ SSR.

Khi đó hệ số xác định R 2 được xác định theo công thức:

Hệ số xác định, hay còn gọi là R², là tỷ số giữa tổng biến thiên được giải thích bởi mô hình và tổng bình phương cần được giải thích R² đo lường tỷ lệ phần trăm của toàn bộ sai lệch Y so với giá trị trung bình mà mô hình có thể giải thích Do đó, R² được sử dụng để đánh giá mức độ phù hợp của hàm hồi quy.

 R 2 cao nghĩa là mô hình ước lượng được giải thích được một mức độ cao biến động của biến phụ thuộc.

 Nếu R 2 = 1, nghĩa là đường hồi quy giải thích 100% thay đổi của y.

Nếu R² = 0, mô hình không cung cấp thông tin về sự thay đổi của biến phụ thuộc y Nghiên cứu viên thường mong muốn R² càng lớn càng tốt, nhưng R² không giảm khi thêm nhiều biến vào mô hình, dẫn đến nguy cơ sai lệch khi cố gắng tăng giá trị này Để khắc phục nhược điểm này, hệ số xác định hiệu chỉnh được sử dụng để đánh giá mức độ phụ thuộc của Y vào X.

Về mặt ý nghĩa, R² và R² điều chỉnh đều thể hiện mức độ phù hợp của mô hình hồi quy Thông thường, hai hệ số này không có sự chênh lệch lớn Tuy nhiên, khi số lượng biến độc lập X tương đối lớn so với kích thước mẫu n, việc sử dụng R² điều chỉnh là cần thiết để đánh giá chính xác hơn mức độ thích hợp của mô hình hồi quy bội.

Phân tích phương sai (ANOVA) một nhân tố là phương pháp thống kê được sử dụng để đánh giá ảnh hưởng của một biến định tính (nhân tố nguyên nhân) lên một biến định lượng (nhân tố kết quả) trong nghiên cứu Phương pháp này giúp kiểm tra giả thuyết về sự khác biệt giữa các nhóm và xác định xem có sự ảnh hưởng đáng kể nào từ nhân tố nguyên nhân đến kết quả hay không.

Hình 1 – Bảng công thức Anova

Khoảng tin cậy và kiểm định các hệ số hồi quy

6.1 Ước lượng khoảng tin cậy đối với các hệ số hồi quy

Mục đích của phân tích hồi quy không chỉ là ước lượng các tham số β1, β2, , βk mà còn để kiểm tra mối quan hệ phụ thuộc giữa các biến Do đó, việc hiểu rõ phân bố xác suất của các tham số này là rất quan trọng, vì chúng phụ thuộc vào phân bố của các sai số ui.

Với các giả thiết OLS, ui có phân phối N (θ, 𝜎2) Các hệ số ước lượng tuân theo phân phối chuẩn:

Ước lượng phương sai sai số được thực hiện dựa vào các phần dư bình phương tối thiểu, trong đó k là hệ số trong phương trình hồi quy đa biến Đối với ước lượng hai phía, chúng ta tìm kiếm các giá trị thỏa mãn điều kiện đã đề ra.

Khoảng tin cậy 1 − α của βj̇’ là:

6.2 Kiểm định giả thiết đối với 𝛃 𝐣 ̇

Kiểm định ý nghĩa thống kê của các hệ số hồi quy là cần thiết để xác định xem biến giải thích có ảnh hưởng thực sự đến biến phụ thuộc hay không Điều này giúp xác minh tính hợp lệ của mô hình hồi quy và đảm bảo rằng các hệ số hồi quy không chỉ đơn thuần là ngẫu nhiên.

Có thể đưa ra giả thiết nào đó đối với βj̇’, chẳng hạn βj̇’ = βj̇’ ∗ Nếu giả thiết này đúng thì:

Loại giả thiết Giả thiết H0 Giả thiết đối H1 Miền bác bỏ

 βj̇’ < 0  xj̇’ có tác động ngược

 βj̇’ > 0  xj̇’ có tác động thuận

7 Kiểm định mức độ ý nghĩa chung của mô hình (trường hợp đặc biệt của kiểm định WALD)

7.1 Khái quát về kiểm định WALD

Giả sử chúng ta có 2 mô hình dưới đây:

Mô hình U, hay còn gọi là mô hình không giới hạn (Unrestrict), cho phép các tham số tự do, trong khi mô hình R, hay mô hình giới hạn (Restrict), có điều kiện rằng β3 và β4 phải bằng 0 Sự khác biệt này tạo ra những ảnh hưởng quan trọng đến cách thức phân tích và diễn giải dữ liệu trong nghiên cứu.

R Ta có thể kiểm định giả thuyết liên kết β3 = β4 = 0 với giả thuyết đối là ít nhất một trong những hệ số này không bằng 0 Kiểm định giả thuyết liên kết này được gọi là kiểm định Wald, thủ tục như sau. Đặt các mô hình giới hạn và không giới hạn là:

Mô hình (R) có được bằng cách bỏ bớt một số biến ở mô hình (U), đó là: Xm+1,

• H1 : “Không phải đồng thời các tham số bằng 0”

Mô hình U chứa k hệ số hồi quy chưa biết, trong khi mô hình R chỉ có m hệ số hồi quy chưa biết, dẫn đến việc R có ít hơn (k-m) thông số so với U Câu hỏi đặt ra là liệu (k-m) biến bị loại ra có ảnh hưởng liên kết có ý nghĩa đối với biến Y hay không.

Trị thống kê kiểm định đối với giả thiết này là:

R2 là chỉ số đo độ thích hợp không hiệu chỉnh Theo giả thuyết không, Fc tuân theo phân phối F với (k-m) bậc tự do cho tử số và (n-k) bậc tự do cho mẫu số.

Bác bỏ giả thuyết H0 khi:

Hoặc giá trị p-value của thống kê F nhỏ hơn mức ý nghĩa cho trước

7.2 Kiểm định ý nghĩa của mô hình

Trong hồi quy đa biến, giả thuyết "không" cho rằng mô hình không có ý nghĩa, tức là tất cả các hệ số hồi quy riêng đều bằng 0 Để kiểm tra giả thuyết này, người ta sử dụng kiểm định Wald, thường được gọi là kiểm định F.

• Bước 1: Giả thuyết “không” là H0: β 1 = β 2 = = β k = 0.

Giả thuyết đối là H1: “có ít nhất một trong những giá trị β khác không”.

Bước 2 trong quy trình hồi quy là hồi quy biến Y dựa trên một hằng số và các biến độc lập X1, X2, , Xk Sau đó, tính tổng bình phương sai số cho hai trường hợp SSRU và SSRR Phân phối F được xác định là tỷ số của hai biến ngẫu nhiên có phân phối khi bình phương độc lập, từ đó cho ta giá trị thống kê cần thiết.

Vì H0: β 1 = β 2 = = β k = 0, nhận thấy rằng trị thống kê kiểm định đối với giả thuyết này sẽ là:

• Bước 3: Tra số liệu trong bảng F tương ứng với bậc tự do (k-1) cho tử số và

(n- k) cho mẫu số, và với mức ý nghĩa α cho trước.

• Bước 4: Bác bỏ giả thuyết H0 ở mức ý nghĩa α nếu Fc > F(α, k − 1, n − k) Đối với phương pháp giá trị p-value, tính giá trị p = P (F > F c | H 0 ) và bác bỏ giả thuyết H0 nếu p bé hơn mức ý nghĩa α.

Đa cộng tuyến (Multicollinearity)

Một trong những giả định quan trọng của mô hình hồi quy tuyến tính cổ điển (CLRM) là không tồn tại mối quan hệ tuyến tính chính xác giữa các biến giải thích Khi có một hoặc nhiều mối quan hệ như vậy, hiện tượng này được gọi là đa cộng tuyến hoặc cộng tuyến.

Hình 2 - Trường hợp đa cộng tuyến

TIỀN XỬ LÝ SỐ LIỆU

Đọc dữ liệu (Import data)

Ta sử dụng hàm read.csv để đọc dữ liệu:

 Đọc dữ liệu và lưu với tên data

 Trích 10 dòng đầu tiên của dữ liệu data

Hình 3 - Hiển thị 10 giá trị đầu tiên của tập dữ liệu

Làm sạch dữ liệu

2.1 Kiểm tra dữ liệu khuyết Code:

Giải thích: Kiểm tra và xuất vị trí NA (không có giá trị)

Nhận xét: Dữ liệu data không có dữ liệu khuyết. apply(is.na(data),2,which) data

Ngày đăng: 06/12/2024, 12:55

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w