T Ổ NG QUAN V Ề ĐỀ TÀI
T ổ ng quan v ề h ệ th ố ng ki ể m tra ngo ạ i quan s ả n ph ẩ m
Kiểm tra chất lượng là quá trình theo dõi và đo lường thông tin về chất lượng để đánh giá việc thực hiện các mục tiêu và nhiệm vụ trong kế hoạch chất lượng đã được đề ra.
Mục đích của kiểm tra chất lượng:
- Phát hiện nhưng sai lệch trong quá trình thực hiện mục tiêu, nhiệm vụ chất lượng, tìm ra nguyên nhân và xóa bỏ, ngăn ngừa sai lệch đó.
- Đảm bảo quá trình thực hiện đúng yêu cầu, sản xuất những sản phẩm đúng tiêu chuẩn đề ra
Đánh giá sản phẩm giúp xác định mức độ phù hợp của các thông số kỹ thuật so với tiêu chuẩn thiết kế và yêu cầu trong hợp đồng mua bán.
- Xác định những sản phẩm kém chất lượng, xác định nguyên nhân và loại bỏ
Kiểm tra ngoại quan sản phẩm là một bước quan trọng trong quy trình kiểm tra chất lượng Phương pháp này cho phép người kiểm tra đánh giá sản phẩm mà không cần sử dụng các công cụ đo lường.
Kiểm tra ngoại quan là quy trình kiểm tra bằng mắt thường nhằm phát hiện sai lệch của sản phẩm so với bản mẫu, đóng vai trò quan trọng trong quy trình sản xuất.
Hình 1.1 Kiểm tra ngoại quan bằng mắt
Trong sản xuất công nghiệp, việc kiểm tra ngoại quan sản phẩm bằng con người gặp nhiều hạn chế như chi phí cao do phải thuê nhiều nhân công và năng suất thấp do mệt mỏi hoặc cảm xúc không tốt của công nhân Để khắc phục những vấn đề này, các hệ thống kiểm tra ngoại quan tự động đã được nghiên cứu và áp dụng rộng rãi trong các nhà máy.
1.1.2 Mô hình hệ thống kiểm tra ngoại quan sản phẩm
Mô hình hệ thống kiểm tra ngoại quan sản phẩm bao gồm các thành phần chính như hệ thống cấp phôi, hệ thống chiếu sáng, hệ thống camera chụp ảnh và hệ thống xử lý Những thành phần này phối hợp chặt chẽ để đảm bảo quá trình kiểm tra sản phẩm diễn ra hiệu quả và chính xác.
Hệ thống kiểm tra sản phẩm bao gồm nhiều thành phần quan trọng, bắt đầu từ hệ thống cấp phôi, giúp đưa sản phẩm vào vị trí kiểm tra chính xác Hệ thống này có thể sử dụng băng truyền hoặc robot để gắp sản phẩm Để duy trì chất lượng hình ảnh, hệ thống chiếu sáng sử dụng đèn đảm bảo độ sáng ổn định, tránh nhiễu từ môi trường Hệ thống camera chụp ảnh từ nhiều góc độ khác nhau, tập trung vào các vị trí kiểm tra ngoại quan Hệ thống xử lý hình ảnh nhận dữ liệu từ camera và thực hiện các quy trình phân loại sản phẩm, quyết định sản phẩm nào đạt yêu cầu và loại bỏ những sản phẩm không đạt Đồng thời, hệ thống này cũng thống kê kết quả kiểm tra, ghi nhận số lượng sản phẩm lỗi và đạt yêu cầu, từ đó cung cấp thông tin để phân tích nguyên nhân gây lỗi và cải tiến quy trình sản xuất, giảm thiểu lỗi trong tương lai.
Hình 1.2 Hệ thống kiểm tra chất lượng
1.1.3 Một số hệ thống kiểm tra ngoại quan sản phẩm
Hình 1.3 Hệ thống kiểm tra ngoại quan chiết rót
Hệ thống kiểm tra mức chiết rót tại nhà máy bia sử dụng cảm biến để kiểm tra mỗi chai bia, kích hoạt hệ thống thị giác để chụp ảnh và lưu trữ hình ảnh Phần mềm thị giác máy sẽ phân tích hình ảnh và đưa ra phản hồi đạt hoặc không đạt dựa trên mức đổ đầy của chai Nếu phát hiện chai được đổ đầy không đúng cách, hệ thống sẽ kích hoạt bộ chuyển hướng để loại bỏ chai đó Người điều hành có thể theo dõi các chai bị từ chối và thống kê quy trình trên màn hình.
Hình 1.4 Hệ thống kiểm tra ngoại quan bảng mạch điện tử
Hệ thống kiểm tra bảng mạch điện tử sử dụng camera để chụp ảnh và kiểm tra chất lượng, phát hiện các lỗi như hàn thiếu linh kiện và sai vị trí Kết quả kiểm tra được gửi đến robot để quyết định gắp hoặc loại bỏ sản phẩm lỗi Hệ thống này không chỉ mang lại độ chính xác cao hơn mà còn tăng tốc độ kiểm tra, đặc biệt là khả năng phát hiện những linh kiện nhỏ mà mắt người khó có thể nhận biết và mất nhiều thời gian để kiểm tra.
Hình 1.5 Hệ thống tự động kiểm tra số lượng sản phẩm trong hộp
Hệ thống tự động kiểm tra số lượng sản phẩm trong hộp bằng cách sử dụng camera để chụp ảnh và xác định số lượng sản phẩm bên trong Nếu số lượng sản phẩm không chính xác, hệ thống sẽ đưa ra cảnh báo.
Hệ thống kiểm tra sẽ đảm bảo rằng tất cả các sản phẩm bên trong hộp được kiểm tra đầy đủ trước khi tiến hành đóng gói Nếu có thiếu sót, quy trình sẽ quay lại các bước trước đó để bổ sung kịp thời.
T ổ ng quan v ề công ngh ệ h ọ c máy, h ọ c sâu và x ử lý ả nh ứ ng d ụ ng
hệ thống kiểm tra ngoại quan.
1.2.1 Xử lý ảnh a Khái niệm
Xử lý hình ảnh kỹ thuật số là quá trình sử dụng máy tính để xử lý hình ảnh thông qua các thuật toán, thuộc lĩnh vực xử lý tín hiệu kỹ thuật số Phương pháp này mang lại nhiều lợi ích so với xử lý ảnh tương tự, cho phép áp dụng nhiều thuật toán khác nhau và giảm thiểu vấn đề nhiễu và biến dạng Hình ảnh được xác định trong không gian hai chiều (hoặc nhiều hơn), cho phép mô hình hóa quá trình xử lý dưới dạng hệ thống đa chiều Sự phát triển của xử lý ảnh kỹ thuật số chủ yếu chịu ảnh hưởng bởi ba yếu tố: sự tiến bộ của công nghệ máy tính, sự phát triển của toán học, đặc biệt là lý thuyết toán học rời rạc, và nhu cầu ngày càng tăng về ứng dụng trong các lĩnh vực như môi trường, nông nghiệp, quân sự, công nghiệp và khoa học y tế.
Xử lý hình ảnh kỹ thuật số là một ứng dụng cụ thể và là một công nghệ thực tế dựa trên:
- Phân tích tín hiệu đa quy mô
Một số kỹ thuật được sử dụng trong xử lý hình ảnh kỹ thuật số bao gồm:
- Phân tích thành phần độc lập
- Phương trình vi phân từng phần
- Đối sánh tính năng điểm
- Phân tích thành phần chính
- Bản đồ tự tổ chức c Chuyển đổi hình ảnh kỹ thuật số
Bộ lọc kỹ thuật số được sử dụng để làm mờ và làm sắc nét hình ảnh kỹ thuật số Lọc có thểđược thực hiện bởi:
- Tích chậpvới cáchạt nhânđược thiết kế đặc biệt(mảng bộ lọc) trong miền không gian
- Lọc trong miền tần số (Fourier)
Hình 1.6 Ví dụ về một số phép lọc
Các phép biến đổi affine
Phép biến đổi Affine cho phép thực hiện các phép biến đổi hình ảnh cơ bản như tỷ lệ, xoay, dịch, phản chiếu và cắt Để áp dụng ma trận affine, hình ảnh được chuyển đổi thành ma trận với các giá trị tương ứng với cường độ pixel Mỗi pixel được biểu diễn dưới dạng vectơ tọa độ [x, y], trong đó x và y là hàng và cột của pixel trong ma trận Quá trình này cho phép nhân tọa độ với ma trận chuyển đổi affine, xác định vị trí mà giá trị pixel sẽ được sao chép vào hình ảnh đầu ra.
Hình 1.7 Ví dụ về một số phép biến đổi
Các phép biến đổi hình thái
Hình thái toán học là lý thuyết và kỹ thuật phân tích các cấu trúc hình học, dựa trên lý thuyết tập hợp, lý thuyết mạng, và hàm ngẫu nhiên Nó thường được áp dụng cho hình ảnh kỹ thuật số, nhưng cũng có thể được sử dụng cho đồ thị, bề mặt lưới, chất rắn và nhiều cấu trúc không gian khác.
Các phép biến đổi hình thái cơ bản: giãn nở, xói mòn, mở, đóng.
Hình 1.8 Ví dụ về phép xói mòn và giản nở d Các ứng dụng
Hình ảnh máy ảnh kỹ thuật số
Máy ảnh kỹ thuật số được trang bị phần cứng xử lý hình ảnh chuyên dụng, bao gồm chip chuyên dụng hoặc mạch bổ sung, nhằm chuyển đổi dữ liệu thô từ cảm biến hình ảnh thành hình ảnh đã được chỉnh sửa màu sắc, lưu trữ ở định dạng tệp tiêu chuẩn.
Cải tiến phương pháp chất lượng hình ảnh
Chất lượng hình ảnh có thể bị ảnh hưởng bởi nhiều yếu tố như rung máy, phơi sáng quá mức, phân bố mức xám không đồng đều và nhiễu Để khắc phục vấn đề nhiễu, phương pháp làm mịn có thể được áp dụng, trong khi đó, việc cải thiện phân phối mức xám có thể thực hiện thông qua cân bằng biểu đồ.
Khi xử lý hình ảnh, nếu phát hiện một số màu không đạt yêu cầu, bạn có thể lấy các màu xung quanh và tính trung bình để cải thiện chất lượng hình ảnh Đây là một phương pháp đơn giản để áp dụng kỹ thuật làm mịn Kỹ thuật làm mịn này có thể được thực hiện thông qua việc sử dụng mặt nạ và tích chập.
Học máy (Machine Learning - ML) là nghiên cứu về các thuật toán máy tính có khả năng cải thiện tự động thông qua kinh nghiệm và dữ liệu Là một phần của trí tuệ nhân tạo, các thuật toán học máy xây dựng mô hình dựa trên dữ liệu mẫu, hay còn gọi là "dữ liệu đào tạo", để đưa ra dự đoán hoặc quyết định mà không cần lập trình rõ ràng Học máy được ứng dụng rộng rãi trong nhiều lĩnh vực như y học, lọc email, nhận dạng giọng nói và thị giác máy tính, nơi mà việc phát triển các thuật toán truyền thống gặp khó khăn hoặc không khả thi.
Hình 1.9 Ví dụ về 1 bài toán trong học máy b Học thuyết
Mục tiêu chính của người học trong lĩnh vực máy học là khái quát hóa từ kinh nghiệm, cho phép máy thực hiện chính xác các nhiệm vụ mới sau khi được đào tạo trên tập dữ liệu Các ví dụ đào tạo thường đến từ những phân bố xác suất chưa biết, và người học cần xây dựng một mô hình chung để đưa ra dự đoán chính xác trong các tình huống mới Lý thuyết học tập tính toán phân tích hiệu suất của các thuật toán học máy, nhưng do tập huấn luyện có giới hạn và tương lai không chắc chắn, lý thuyết này thường không đảm bảo hiệu suất Sự phân tách độ lệch-phương sai giúp xác định sai số tổng quát hóa, trong đó độ phức tạp của giả thuyết cần phù hợp với độ phức tạp của hàm cơ sở dữ liệu để đạt hiệu suất tối ưu Nếu giả thuyết quá phức tạp, mô hình có thể bị trang bị quá mức và dẫn đến tổng quát hóa kém Ngoài ra, các nhà lý thuyết cũng nghiên cứu sự phức tạp về thời gian và tính khả thi của việc học, với các kết quả khả quan cho thấy một lớp hàm nhất định có thể học trong thời gian đa thức, trong khi các kết quả phủ định chỉ ra rằng một số lớp không thể học được trong cùng khoảng thời gian.
Các phương pháp tiếp cận máy học truyền thống được phân loại thành ba nhóm chính, dựa trên loại "tín hiệu" hoặc "phản hồi" mà hệ thống học tập nhận được.
Học có giám sát là quá trình mà máy tính tiếp nhận các đầu vào mẫu cùng với đầu ra mong muốn, với mục tiêu là xác định một quy tắc chung để ánh xạ đầu vào thành đầu ra.
Học không giám sát là phương pháp mà thuật toán không nhận được nhãn, cho phép nó tự khám phá và xác định cấu trúc trong dữ liệu đầu vào Phương pháp này giúp phát hiện các mẫu tiềm ẩn và mối quan hệ trong dữ liệu mà không cần sự can thiệp của con người.
8 mục tiêu tự thân (khám phá các mẫu ẩn trong dữ liệu) hoặc một phương tiện hướng tới mục tiêu (học tính năng).
Học tăng cường là một chương trình máy tính tương tác trong một môi trường năng động, nơi nó thực hiện các mục tiêu cụ thể như lái xe hoặc chơi trò chơi với đối thủ Trong quá trình điều hướng không gian, chương trình nhận phản hồi tương tự như phần thưởng và cố gắng tối đa hóa phần thưởng đó.
Các thuật toán học tập có giám sát xây dựng mô hình toán học từ dữ liệu đào tạo, bao gồm cả đầu vào và đầu ra mong muốn Mỗi ví dụ huấn luyện được biểu diễn bằng vectơ đặc trưng, và dữ liệu này được tổ chức thành ma trận Qua quá trình tối ưu hóa lặp đi lặp lại một chức năng mục tiêu, các thuật toán học có giám sát phát triển một chức năng giúp dự đoán đầu ra cho đầu vào mới Chức năng tối ưu cho phép thuật toán xác định chính xác đầu ra cho các đầu vào không nằm trong dữ liệu huấn luyện.
Một thuật toán cải thiện độ chính xác của kết quảđầu ra hoặc dựđoán của nó theo thời gian được cho là đã học cách thực hiện nhiệm vụđó.
Hình 1.10 SVM một phương pháp học có giám sát
Các loại thuật toán học có giám sát bao gồm học tích cực, phân loại và hồi quy Thuật toán phân loại được áp dụng khi đầu ra giới hạn trong một tập giá trị cụ thể, trong khi thuật toán hồi quy cho phép đầu ra có bất kỳ giá trị số nào trong một khoảng Chẳng hạn, trong thuật toán phân loại lọc email, đầu vào là một email đến và đầu ra là tên thư mục chứa email đó.
Học tương tự là một nhánh của học máy có giám sát, liên quan đến hồi quy và phân loại Mục tiêu chính của nó là học từ các ví dụ thông qua việc sử dụng hàm tương tự để đo lường mức độ tương đồng hoặc liên quan giữa hai đối tượng.
9 ứng dụng trong hệ thống xếp hạng, đề xuất, theo dõi nhận dạng trực quan, xác minh khuôn mặt và xác minh diễn giả
Học tập không giám sát
Gi ớ i thi ệ u v ề rocker arm
Cò mổ (rocker arm) là thiết bị đòn bẩy trong cơ cấu phân phối khí của động cơ đốt trong, có chức năng chuyển động từ cam thành chuyển động thẳng để mở xupap Một đầu của cò mổ được nâng lên và hạ xuống bởi vấu cam, trong khi đầu còn lại tác động lên thân xupap Khi vấu cam nâng một đầu của cò mổ, đầu còn lại sẽ ép xuống thân xupap, mở xupap Khi trục cam quay trở lại, đầu bên ngoài cò mổ trở về vị trí ban đầu, tạo điều kiện cho lò xo xupap đóng lại.
Một số loại động cơ cam trên đỉnh sử dụng cò mổ ngắn, trong đó vấu cam đẩy xuống để mở xupap Cò mổ này có điểm tựa ở một đầu, với cam tác động tại vị trí giữa Loại cò mổ này phổ biến trên động cơ cam kép (DOHC) và thay thế cho các con đội xupap tác động trực tiếp Cánh tay đòn thường được làm từ thép dập, cân bằng sức mạnh, trọng lượng và chi phí Tuy nhiên, khối lượng quá lớn của cánh tay đòn có thể hạn chế tốc độ vận hành cao của động cơ, do đó, nhôm thường được sử dụng cho các cò mổ hiệu suất cao và nhiều cò mổ OEM trên động cơ OHC Cò mổ nhôm thường có miếng đệm hoặc con lăn bằng thép để giảm mài mòn Động cơ xe tải, chủ yếu là động cơ diesel, sử dụng cò mổ cứng hơn làm bằng gang hoặc thép cacbon rèn.
Các lỗi thường ngoại quan gặp trong quá trình sản xuất rocker arm:
- Lỗi lệch trục trên lỗ trục chính và lỗ ren của rocker arm
- Lỗi vát mép trên lỗ trục chính của rocker arm
- Lỗi xước trên bề mặt và cạnh của rocker arm
- Lỗi nhám bên trong lỗ trục chính và lỗcon lăn của rocker arm.
N ộ i dung nghiên c ứ u
Nghiên cứu các phương pháp học máy, học sâu và xử lý ảnh nhằm phát triển giải pháp tự động phát hiện lỗi trên sản phẩm cò mổ Những công nghệ này giúp nâng cao độ chính xác và hiệu quả trong quá trình kiểm tra chất lượng sản phẩm.
Từđó phát triển được hệ thống kiểm tra ngoại quan sản phẩm rocker arm có các tính năng sau:
- Phát hiện lỗi xước trên bề mặt và cạnh của rocker arm
- Phát hiện lỗi nhám bên trong lỗ trục chính và lỗ con lăn của rocker arm
- Phát hiện lỗi vát mép trên lỗ trục chính của rocker arm
- Phát hiện lỗi lệch trục trên lỗ trục chính và lỗ ren của rocker arm
THU Ậ T TOÁN PHÁT HI Ệ N L Ỗ I L Ệ CH TR Ụ C VÀ L Ỗ I VÁT MÉP
Thu ậ t toán RANSAC
RANSAC (Random Sample Consensus) là một phương pháp lặp để ước lượng tham số mô hình toán học từ dữ liệu có chứa giá trị ngoại lệ mà không bị ảnh hưởng bởi chúng Phương pháp này cũng được coi là một công cụ phát hiện ngoại lệ RANSAC là một thuật toán không xác định, cho ra kết quả hợp lý với xác suất nhất định, xác suất này tăng lên khi số lần lặp nhiều hơn Thuật toán được giới thiệu lần đầu bởi Fischler và Bolles tại SRI International vào năm 1981, nhằm giải quyết bài toán xác định vị trí, với mục tiêu nhận diện các điểm trong không gian chiếu lên hình ảnh thành tập hợp các điểm mốc có vị trí đã biết.
Hình 2.1 Ví dụ về RANSAC trong tìm đường thẳng 2D
Một giả định cơ bản trong phân tích dữ liệu là dữ liệu bao gồm "phần tử nội", tức là những dữ liệu có thể được mô hình hóa bằng một số tham số nhất định, mặc dù có thể bị nhiễu Ngược lại, "phần ngoại lai" là những dữ liệu không phù hợp với mô hình Phương pháp RANSAC giả định rằng, từ một tập hợp nhỏ các phần tử nội, có thể tồn tại một quy trình để ước tính các tham số của mô hình một cách tối ưu, phù hợp với dữ liệu đã cho.
Thuật toán RANSAC là một kỹ thuật học máy được sử dụng để ước lượng các tham số của mô hình thông qua việc lấy mẫu ngẫu nhiên từ dữ liệu quan sát Khi xử lý một tập dữ liệu chứa cả phần tử nội và phần ngoại lai, RANSAC áp dụng một sơ đồ bỏ phiếu để xác định mô hình phù hợp nhất Các phần tử dữ liệu trong tập được sử dụng để bỏ phiếu cho một hoặc nhiều mô hình, dựa trên hai giả định chính: các phần tử ngoại lai sẽ không ảnh hưởng đến bất kỳ mô hình nào và có đủ đặc trưng để xác định một mô hình tốt Thuật toán này chủ yếu bao gồm hai bước lặp đi lặp lại để tối ưu hóa kết quả.
Trong bước đầu tiên, một tập hợp con mẫu được chọn ngẫu nhiên từ dữ liệu đầu vào, chứa các mục dữ liệu tối thiểu cần thiết Mô hình phù hợp và các tham số tương ứng được tính toán chỉ dựa trên các phần tử trong tập hợp con mẫu này Số lượng của tập con mẫu phải đủ nhỏ để xác định các tham số của mô hình một cách chính xác.
Trong bước thứ hai, thuật toán xác định các phần tử trong tập dữ liệu phù hợp với mô hình đã được khởi tạo từ các tham số ước tính ở bước đầu tiên Những phần tử không phù hợp với mô hình này sẽ được xem là ngoại lệ.
Tập hợp các nội số thu được cho mô hình phù hợp được gọi là tập hợp đồng thuận Thuật toán RANSAC lặp lại hai bước cho đến khi tập hợp đồng thuận có đủ nội số Đầu vào cho RANSAC bao gồm tập hợp dữ liệu quan sát, phương pháp điều chỉnh mô hình và các tham số tin cậy RANSAC đạt được mục tiêu bằng cách lặp lại các bước này.
- Chọn một tập hợp con ngẫu nhiên của dữ liệu gốc Gọi tập hợp con này là tập hợp con giảđịnh
- Một mô hình được trang bị cho một tập hợp các giá trị giảđịnh
Tất cả dữ liệu sau đó được kiểm tra dựa trên mô hình đã được trang bị Những điểm phù hợp tốt với mô hình ước tính, theo các hàm tổn thất cụ thể, được xem là thuộc về tập hợp đồng thuận.
- Mô hình ước tính là tốt một cách hợp lý nếu có đủ nhiều điểm được xếp vào một phần của tập hợp đồng thuận
- Sau đó, mô hình có thểđược cải thiện bằng cách sử dụng lại tất cả các thành viên của tập hợp đồng thuận
Quy trình này lặp lại nhiều lần, mỗi lần tạo ra một mô hình bị từ chối do số điểm quá ít trong tập hợp đồng thuận hoặc một mô hình đã được tinh chỉnh Chúng tôi sẽ giữ lại mô hình đã tinh chỉnh nếu tập hợp đồng thuận của nó lớn hơn mô hình đã lưu trước đó.
Hình 2.2 Các ngoại lệ a Các thông s ố
Giá trị ngưỡng để xác định sự phù hợp của điểm dữ liệu với mô hình t và số lượng điểm dữ liệu gần cần thiết để khẳng định mô hình phù hợp tốt với dữ liệu d được xác định dựa trên các yêu cầu cụ thể của ứng dụng và tập dữ liệu.
RANSAC là một thuật toán mạnh mẽ trong việc đánh giá mô hình từ dữ liệu đầu vào, với khả năng cung cấp kết quả hữu ích dựa trên xác suất thành công mong muốn p Số lần lặp lại của thuật toán không thể xác định chỉ bằng lý thuyết, mà phụ thuộc vào cách chọn n điểm từ tập dữ liệu Để đạt được điều này, xác suất w được tính toán dựa trên tỷ lệ số phần tử thuộc mô hình so với tổng số điểm trong dữ liệu Khi w cao, khả năng RANSAC chọn đúng các phần tử trong mỗi lần lặp sẽ tăng lên, dẫn đến khả năng đạt được kết quả chính xác hơn.
Trong một số trường hợp, giá trị w không được biết trước, nhưng có thể sử dụng các giá trị thô để ước tính Giả sử n điểm được chọn độc lập, xác suất để tất cả n điểm là nội nguyên là 𝑤𝑤^𝑛, trong khi xác suất ít nhất một trong n điểm là ngoại lệ là 1 – 𝑤𝑤^𝑛 Nếu một mô hình kém được ước lượng từ tập điểm này, xác suất theo lũy thừa của k thể hiện khả năng mà thuật toán không bao giờ chọn tập hợp n điểm đều là ẩn số, và giá trị này cần phải tương đương với 1 - p Kết quả cuối cùng là một hệ thống xác suất phức tạp cần được xem xét kỹ lưỡng.
Kết quả nghiên cứu cho thấy rằng n điểm dữ liệu được chọn độc lập, nghĩa là mỗi điểm có thể được chọn lại trong cùng một lần lặp Tuy nhiên, đây không phải là một phương pháp hợp lý, và giá trị suy ra của k nên được xem là giới hạn trên khi các điểm được chọn mà không thay thế Trong quá trình tìm đường phù hợp với tập dữ liệu, thuật toán RANSAC thường chọn hai điểm trong mỗi lần lặp để xác định maybe_model, tức là đường thẳng nối giữa hai điểm này, với yêu cầu rằng hai điểm phải khác biệt Để tăng độ tin cậy, có thể thêm độ lệch chuẩn hoặc bội số của chúng vào k, trong đó độ lệch chuẩn của k được định nghĩa rõ ràng.
RANSAC có ưu điểm nổi bật trong việc ước lượng chính xác các tham số của mô hình, ngay cả khi dữ liệu chứa nhiều giá trị ngoại lệ Tuy nhiên, nhược điểm lớn của nó là không có giới hạn về thời gian tính toán, dẫn đến khả năng giải pháp thu được không tối ưu khi số lần lặp bị giới hạn Việc tăng số lần lặp có thể nâng cao xác suất tạo ra mô hình hợp lý, nhưng RANSAC cũng không luôn tìm được bộ tối ưu trong các bộ dữ liệu có nhiễu vừa phải, đặc biệt khi tỷ lệ phần tử nội thấp hơn 50% Để khắc phục những vấn đề này, RANSAC tối ưu đã được đề xuất, cho phép tìm ra tập hợp tối ưu ngay cả trong các tập dữ liệu có nhiễu cao, với tỷ lệ phần tử nội chỉ dưới 5%.
30 nhược điểm khác của RANSAC là nó yêu cầu thiết lập các ngưỡng dành riêng cho từng mô hình
RANSAC chỉ có khả năng ước tính một mô hình cho một tập dữ liệu cụ thể, và khi có nhiều hơn một mô hình tồn tại, nó có thể không tìm ra được mô hình nào Trong trường hợp này, biến đổi Hough là một kỹ thuật ước lượng mạnh mẽ có thể thay thế, hữu ích cho việc xử lý nhiều cá thể mô hình Một phương pháp khác là PEARL, kết hợp việc lấy mẫu mô hình từ các điểm dữ liệu giống như RANSAC, với việc ước tính lại các tham số lặp đi lặp lại và điều chỉnh đa mô hình dưới dạng bài toán tối ưu hóa.
Thuật toán RANSAC là một công cụ quan trọng trong lĩnh vực thị giác máy tính, được sử dụng để đồng thời giải quyết bài toán tương ứng và ước tính ma trận cơ bản giữa các camera stereo Nó cũng hỗ trợ tính toán các tham số cho các mô hình hình học như đường tròn, đường thẳng và mặt phẳng trong không gian 2D hoặc 3D Ngoài ra, RANSAC còn được áp dụng để loại bỏ nhiễu trong các mô hình, giúp cải thiện độ chính xác của các kết quả phân tích.
Hình 2.3 RANSAC trong bài toán ước tính mô hình 3D
2.1.5 Thuật toán RANSAC phát hiện đường tròn trên rocker arm
Thuật toán RANSAC cần năm dữ liệu đầu vào:
- Đám mây điểm 2D là ma trận chứa 2 tọa độ của điểm X, Y
- Sốđường tròn là sốđường tròn cần phát hiện trong đám mây điểm đầu vào
Phát hi ệ n l ỗ i l ệ ch tr ụ c
Hình 2.5 Lỗi lệch trục chính
Qui trình kiểm tra lỗi lệch trục:
- Chụp ảnh với hướng camera vuông góc lỗ trục cần kiểm tra và cắt ảnh phần chứa lỗ trục cần kiểm tra
Hình 2.6 Ảnh chụp rocker arm hướng vuông góc lỗ trục
Sử dụng các thuật toán để xác định đường tròn bên trong và đường tròn viền bên ngoài trên bề mặt, quá trình này bao gồm các bước làm mờ, làm sắc cạnh và tìm đường bao nhằm loại bỏ nhiễu và làm nổi bật cạnh của hai đường tròn cần tìm Thuật toán RANSAC được áp dụng để phát hiện hai đường tròn từ các cạnh đã được tách ra ở phía trên.
Hình 2.7 Ảnh tách cạnh và phát hiện đường tròn trên lỗ trục chính
Sau khi xác định hai đường tròn, tiến hành tính toán các thông số độ lệch tâm giữa chúng, bao gồm độ lệch tâm e, khoảng cách lớn nhất ∆𝑅𝑅𝑚𝑚𝑚𝑚𝑚𝑚, khoảng cách nhỏ nhất ∆𝑅𝑅𝑚𝑚𝑚𝑚𝑛𝑛 và khoảng cách trung bình ∆𝑅𝑅𝑚𝑚𝑚𝑚𝑚𝑚 Kết quả này sẽ được so sánh với giá trị đúng ∆𝑅𝑅𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 để phát hiện lỗi lệch trục.
Hình 2.8 Qui trình kiểm tra lỗi lệch trục
Hình 2.9 Công thức tính các giá trị ∆𝑅𝑅
Phát hi ệ n l ỗ i vát mép
Hình 2.10 Lỗi vát mép sâu lỗ trục chính
Hình 2.11 Lỗi lệch vát mép lỗ trục chính
Lỗi vát mép được chia thành hai loại: lệch vát mép và vát mép sâu Lỗi lệch vát mép xảy ra khi độ rộng vùng vát mép không đồng đều trên lỗ trục chính, trong khi lỗi vát mép sâu là khi độ sâu vùng vát mép vượt quá tiêu chuẩn, dẫn đến độ rộng vùng vát mép lớn hơn nhiều so với hình ảnh tiêu chuẩn Thuật toán kiểm tra lỗi vát mép tương tự như thuật toán kiểm tra lỗi lệch trục.
- Đầu tiên chụp ảnh vuông góc với bề mặt vát mép và cắt ảnh chưa vùng vát mép trên lỗ trục chính
Hình 2.12 Vát mép trên lỗ trục chính
Quá trình xử lý ảnh bao gồm các thuật toán làm mịn, làm sắc cạnh và tìm cạnh, nhằm loại bỏ nhiễu trong ảnh và giữ lại các cạnh quan trọng trên vùng vát mép.
Tìm đường tròn trong và ngoài của viền vát mép thông qua thuật toán RANSAC
Hình 2.13 Tách cạnh vùng vát mép trên lỗ trục chính
Hình 2.14 Tìm đường tròn vùng vát mép trên lỗ trục chính
- Từ2 đường tròn vừa tìm được, tính toán các thông sốtương quan giữa hai đường tròn: độ lệch tâm giữa hai đường tròn e, khoảng cách lớn nhất
∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑚𝑚 , khoảng cách nhỏ nhất ∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑛𝑛 và khoảng cách trung bình ∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑚𝑚
Từđó so sánh với giá trị đúng ∆𝑅𝑅 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 để kết luận vát mép đạt yêu cầu hay sản phẩm lỗi
THU Ậ T TOÁN PHÁT HI Ệ N L ỖI XƯỚ C
Thu ậ t toán YOLO
YOLO là một mô hình mạng tích chập mạnh mẽ, chuyên dùng cho việc phát hiện, nhận dạng và phân loại đối tượng Mô hình này được xây dựng dựa trên sự kết hợp giữa các lớp tích chập và các lớp kết nối, giúp nâng cao hiệu quả trong việc xử lý hình ảnh.
Các lớp tích chập trong mạng nơ-ron sẽ trích xuất đặc trưng từ hình ảnh, trong khi các lớp kết nối đầy đủ sẽ dự đoán xác suất và tọa độ của đối tượng.
Mô hình YOLO đơn giản nhận diện đối tượng trong ảnh đầu vào bằng cách xác định tọa độ của chúng Ảnh được chia thành các ô S×S, thường là 3x3, 7x7 hoặc 9x9, và việc chia ô này ảnh hưởng trực tiếp đến khả năng phát hiện đối tượng của mô hình.
Hình 3.3 Chia lưới trong yolo
Mô hình nhận đầu vào là một ảnh và trả về ma trận 3 chiều có kích thước S×S×(5×N+M) Trong đó, mỗi ô trong ma trận có số lượng tham số là (5×N+M), với N là số lượng hộp giới hạn và M là số lớp mà mỗi ô cần dự đoán Dự đoán của mô hình bao gồm các thông tin về mỗi hộp giới hạn.
The five components of the bounding box are defined as (x, y, w, h, prediction), where (x, y) represents the center coordinates of the bounding box, and (w, h) denote its width and height, respectively The prediction is calculated as Pr(Object) * IOU(pred, truth), where Pr(Object) indicates the probability of an object being present, and IOU (Intersection Over Union) serves as a metric to evaluate the accuracy of the object detector on a specific dataset.
Area of Overlap là diện tích giao nhau giữa hộp giới hạn dự đoán và hộp giới hạn thực, trong khi Area of Union là diện tích hợp giữa hai hộp này Các hộp giới hạn thực được gán nhãn bằng tay trong tập dữ liệu đào tạo và kiểm tra Nếu chỉ số IOU lớn hơn 0.5, dự đoán sẽ được coi là tốt.
Hàm lỗi trong YOLO được tính trên việc dựđoán và nhãn mô hình để tính Cụ thể hơn nó là tổng độ lỗi của 3 thành phần con sau:
Loss phân loại - độ lỗi trong việc dự đoán loại nhãn của đối tượng, hàm lỗi này chỉ xem xét các ô vuông có chứa đối tượng, trong khi các ô vuông khác không được tính đến Loss phân loại được tính theo công thức sau:
Trong đó 𝜋𝜋 𝑚𝑚 𝑐𝑐𝑜𝑜𝑜𝑜 : bằng 1 nếu ô vuông đang xét có object, ngược lại bằng 0 𝑝𝑝̂𝑚𝑚(𝑐𝑐): là xác xuất của lớp c tại ô vuông tương ứng mà mô hình dựđoán
Localization loss là hàm lỗi được sử dụng để đo lường độ chính xác của các boundary box dự đoán, bao gồm tọa độ tâm, chiều rộng và chiều cao, so với vị trí thực tế từ dữ liệu huấn luyện của mô hình Hàm Localization loss giúp cải thiện khả năng dự đoán của mô hình bằng cách giảm thiểu sai số giữa các giá trị dự đoán và giá trị thực tế.
38 loss được tính trên tổng giá trị lỗi dự đoán toạ độ tâm (x, y) và (w, h) của hộp giới đoạn dựđoán với hộp giới hạn thực
Hình 3.4 Ví dụ bouding box trong yolo
- Confidence loss là độ lỗi giữa dựđoán nhãn hộp giới hạn chứa object so với nhãn thực tế tại ô vuông đó.
Tổng lại chúng ta có hàm lỗi là tổng của 3 hàm lỗi trên:
3.1.3 Cấu trúc và đặc điểm mô hình yolov3 áp dụng phát hiện lỗi xước trên rocker arm
Mô hình YOLOv1 sử dụng 24 lớp chập, trong khi YOLOv2 áp dụng backbone là darknet19 kết hợp với 11 lớp chập để nhận dạng Đến YOLOv3, mô hình này sử dụng darknet53 làm backbone với 53 lớp tích chập đã được đào tạo trên ImageNet Đặc biệt, cho nhiệm vụ phát hiện, YOLOv3 có thêm 53 lớp khác chồng lên, tạo thành kiến trúc phức hợp với tổng cộng 106 lớp tích chập.
Kiến trúc mạng YOLOv3 cải tiến so với YOLOv1, khi mà thuật toán này chia bức ảnh thành các ô lưới có kích thước SxS, với S có thể là 3, 5 hoặc 7 Trong khi đó, YOLOv2 đã điều chỉnh kích thước lưới này để tối ưu hóa khả năng phát hiện đối tượng.
13 Nhưng đối với các kích thước đó, vẫn chưa đủ để có thể tìm kiếm những đối tượng có kích thước nhỏ trong bức hình Vậy nên YOLOv3 đã xử lý bằng cách là nhận dạng 3 lần trên một bức ảnh với kích thước khác nhau
Giả sử ta có bức ảnh đầu vào có kích thước: 416×416: Tại lớp tích chập thứ 82:
Bức ảnh được chia thành các ô lưới với kích thước 13×13 để tìm các vật thể lớn, trong khi tại lớp tích chập thứ 94, ảnh được chia thành các ô lưới 26×26 nhằm phát hiện các vật thể có kích thước trung bình Tương tự, lớp tích chập 106 sử dụng ô lưới 52×52 để nhận diện các vật thể nhỏ.
YOLO v3 áp dụng hàm mất mát nhị phân cross-entropy để tính toán lỗi phân loại cho từng nhãn, trong khi độ tin cậy của đối tượng và dự đoán lớp được thực hiện thông qua hồi quy logistic.
Phát hi ệ n l ỗi xướ c
Để phát hiện lỗi xước trên bề mặt và cạnh đề xuất sử dụng thuật toán YOLOv3 với các bước thực hiện là:
Bước đầu tiên trong quy trình đào tạo là thu thập dữ liệu bằng cách chụp ảnh độ phân giải cao (6000x4000 pixel) từ 7 hướng khác nhau quanh rocker arm, nhằm đảm bảo bao phủ toàn bộ bề mặt của nó Mỗi bức ảnh sẽ được chia thành các hình ảnh nhỏ hơn bằng cách trượt hình chữ nhật kích thước w x h dọc theo hướng x với bước w / 2 và hướng y với bước h / 2 Phương pháp này giúp giảm số lượng hình ảnh cần thiết cho quá trình đào tạo, từ đó tiết kiệm đáng kể thời gian.
Hình 3.7 Các hướng chụp ảnh
Hình 3.8 Quá trình chia nhỏ ảnh
Sau khi thu thập hình ảnh có khuyết tật, chúng ta cần chú thích chúng để sử dụng với YOLO Mỗi hình ảnh yêu cầu một tệp văn bản tương ứng có tên giống như hình ảnh và nằm trong cùng thư mục Mỗi dòng trong tệp văn bản phải mô tả một hộp giới hạn riêng biệt cho lỗi, bao gồm các thông tin cần thiết.
Ởđây:
một số nguyên từ0 đến (lớp - 1) tương ứng với các lớp trong tệp names
Height, Width- chiều cao và chiều rộng thực tế của hình ảnh x, y - tọa độ tâm của hộp giới hạn h, w - chiều cao và chiều rộng của hộp giới hạn
: h / Height Điều này có thểđược thực hiện với YOLO Mark, một công cụ chú thích hình ảnh đồ họa tạo tệp txt cho hình ảnh ởđịnh dạng YOLO
Trong quá trình đào tạo mô hình, chúng tôi chia ngẫu nhiên các hình ảnh được chú thích thành các tập huấn luyện và thử nghiệm theo tỷ lệ 80:20 Trọng số của mạng thần kinh được cập nhật lặp đi lặp lại trong khi huấn luyện, và việc sử dụng các tập huấn luyện lớn có thể làm tiêu tốn tài nguyên khi cập nhật trọng số cho toàn bộ tập Chúng tôi tiếp tục đào tạo cho đến khi tổn thất đạt ngưỡng nhất định Mặc định, trọng số cho bộ dò tùy chỉnh được lưu lại sau mỗi 100 lần lặp cho đến 1000 lần lặp, và sau đó là mỗi 10000 lần lặp Khi quá trình đào tạo hoàn tất, chúng tôi có thể sử dụng các trọng số đã tạo để thực hiện phát hiện.
Hình 3.9 Quá trình đào tạo mô hình
Bước 4: Kiểm tra với mô hình đào tạo được
Sau khi xác minh độ chính xác của mô hình đã được đào tạo trước, chúng tôi có thể sử dụng nó để phát hiện lỗi trong thời gian thực Hình dưới đây minh họa quy trình kiểm tra lỗi xước.
Hình 3.10 Quá trình phát hiện lỗi xước
THU Ậ T TOÁN PHÁT HI Ệ N L Ỗ I NHÁM
Thu ậ t toán Autoencoder
Autoencoder là một loại mạng thần kinh nhân tạo học mã hóa dữ liệu một cách hiệu quả qua phương pháp không giám sát Mục tiêu chính của autoencoder là rút trích đặc trưng từ dữ liệu để giảm chiều dữ liệu, trong khi vẫn tái tạo lại đầu vào gần nhất có thể từ mã hóa rút gọn Có nhiều biến thể của autoencoder, như autoencoder thưa thớt, giảm nhiễu và co rút, nhằm tối ưu hóa các đặc tính hữu ích của đầu vào Những mô hình này đã chứng minh hiệu quả trong việc học đặc trưng cho các nhiệm vụ phân loại và gần đây, autoencoder đa dạng đã được ứng dụng trong các mô hình sinh mẫu Autoencoder rất hữu ích trong nhiều lĩnh vực ứng dụng, từ nhận diện khuôn mặt đến việc hiểu nghĩa ngữ nghĩa của từ vựng.
Hình 4.1 Kiến trúc cơ bản autoencoder
Hình thức đơn giản nhất của autoencoder là một feedforward, phi mạng thần kinh tái phát tương tựnhư lớp đơn perceptron tham gia vào perceptron nhiều lớp (MLP)
Mã tự động sử dụng một lớp đầu vào và một lớp đầu ra được kết nối với nhau qua một hoặc nhiều lớp ẩn Lớp đầu ra có số nút (nơ-ron) tương đương với lớp đầu vào, với mục tiêu tái tạo lại các đầu vào bằng cách giảm thiểu sự khác biệt giữa đầu vào và đầu ra Điều này cho thấy mã tự động là một mô hình học tập không được giám sát, không nhằm dự đoán giá trị mục tiêu Y từ đầu vào X.
Một bộ mã tự động bao gồm hai phần, bộ mã hóa và bộ giải mã, có thể được định nghĩa là quá trình chuyển đổiɸ và ψ: ɸ: 𝑋𝑋 → 𝐹𝐹 ψ : 𝐹𝐹 → 𝑋𝑋 ɸ, ψ = 𝐴𝐴𝐴𝐴𝑎𝑎𝑎𝑎𝑈𝑈𝑈𝑈 ‖𝑋𝑋 −(ψ ∙ ɸ)∙ 𝑋𝑋‖ 2
Trong trường hợp đơn giản nhất, với một lớp ẩn, giai đoạn mã hóa của trình mã tự động lấy đầu vào 𝑥𝑥 ∈ 𝑅𝑅 𝑚𝑚 =𝑋𝑋 và ánh xạ nó tới ℎ ∈ 𝑅𝑅 𝑝𝑝 =𝐹𝐹:
Trong mạng nơ-ron, h thường được gọi là mã, biến tiềm ẩn hoặc đại diện tiềm ẩn, trong khi 𝜎 là một hàm kích hoạt phần tử, như hàm sigmoid hoặc đơn vị tuyến tính được chỉnh lưu W là ma trận trọng lượng và b là vector Trọng lượng và độ lệch được khởi tạo ngẫu nhiên và sau đó được cập nhật qua quá trình đào tạo thông qua lan truyền ngược Giai đoạn giải mã trong bản đồ tự động mã hóa nhằm tái thiết 𝑥′ có cùng hình dạng với x.
𝜎𝜎 ′ ,𝑊𝑊 ′ ,𝑏𝑏 ′ đối với bộ giải mã có thểkhông liên quan đến 𝜎𝜎,𝑊𝑊,𝑏𝑏 cho bộ mã hóa.
Tự động mã được đào tạo để giảm thiểu các lỗi xây dựng lại (chẳng hạn nhưlỗi bình phương), thường được gọi là "mất mát ":
Quá trình đào tạo mã tự động diễn ra thông qua việc truyền ngược lỗi, tương tự như cách hoạt động của một mạng thần kinh chuyển tiếp thông thường.
Mã tự động, ra đời từ những năm 80, chủ yếu được sử dụng để giảm kích thước và truy xuất thông tin Tuy nhiên, các biến thể hiện đại của mô hình này đã chứng minh được hiệu quả khi được áp dụng trong nhiều lĩnh vực và nhiệm vụ khác nhau.
Giảm kích thước là một trong những ứng dụng đầu tiên của học sâu, đóng vai trò quan trọng trong nghiên cứu mã tự động Mục tiêu chính là tìm phương pháp chiếu phù hợp, ánh xạ dữ liệu từ không gian đặc trưng cao sang không gian đặc trưng thấp Việc biểu diễn dữ liệu trong không gian chiều thấp hơn có thể nâng cao hiệu suất cho các tác vụ như phân loại Nhiều hình thức giảm số chiều giúp các ví dụ liên quan về mặt ngữ nghĩa gần nhau, từ đó hỗ trợ cho sự tổng quát hóa.
Mối quan hệ với phân tích thành phần chính (PCA)
Khi sử dụng kích hoạt tuyến tính hoặc chỉ một lớp ẩn sigmoid duy nhất, bộ mã tự động có mối liên hệ chặt chẽ với phân tích thành phần chính (PCA) Trọng lượng của bộ mã tự động với một lớp ẩn có kích thước p (với p nhỏ hơn kích thước đầu vào) mở rộng không gian con vectơ tương tự như không gian con được tạo ra bởi p thành phần chính, và đầu ra của bộ mã tự động là phép chiếu trực giao lên không gian con này Mặc dù trọng số của bộ mã tự động không tương đương với các thành phần chính và thường không trực giao, nhưng các thành phần chính có thể được khôi phục thông qua phân rã giá trị đơn lẻ.
Tiềm năng của Autoencoders nằm ở khả năng xử lý tính không tuyến tính, cho phép mô hình học hỏi những khái quát mạnh mẽ hơn so với PCA, đồng thời tái tạo đầu vào với mức mất thông tin thấp hơn đáng kể.
Việc truy xuất thông tin được cải thiện đáng kể nhờ vào việc giảm kích thước trong tìm kiếm, đặc biệt trong các không gian chiều thấp Tự động mã hóa, được giới thiệu bởi Salakhutdinov và Hinton vào năm 2007, đã được áp dụng cho băm ngữ nghĩa Thuật toán được đào tạo để tạo ra mã nhị phân chiều thấp, cho phép lưu trữ tất cả các mục cơ sở dữ liệu trong bảng băm ánh xạ vector mã nhị phân Bảng này hỗ trợ truy xuất thông tin bằng cách trả về các mục có cùng mã nhị phân với truy vấn hoặc các mục tương tự bằng cách điều chỉnh một số bit trong mã hóa của truy vấn.
Một ứng dụng quan trọng của mã tự động là phát hiện bất thường Mô hình học cách tái tạo các đặc điểm nổi bật trong dữ liệu huấn luyện, từ đó cải thiện khả năng tái tạo các quan sát thường xuyên Khi gặp phải sự bất thường, hiệu suất tái tạo của mô hình sẽ giảm Thông thường, chỉ dữ liệu bình thường được sử dụng để đào tạo, vì tần suất của dữ liệu bất thường thường quá thấp để ảnh hưởng đến biểu diễn của mô hình Sau khi huấn luyện, mã tự động có khả năng cấu trúc lại dữ liệu bình thường một cách chính xác, nhưng lại gặp khó khăn với dữ liệu bất thường mà nó chưa từng thấy Lỗi tái thiết giữa dữ liệu gốc và phiên bản tái tạo được sử dụng để xác định điểm bất thường.
Mã tự động đã trở thành một công cụ cực kỳ hữu ích trong xử lý hình ảnh nhờ vào các đặc tính đặc biệt của nó Chẳng hạn, trong tác vụ nén ảnh mất dữ liệu, mã tự động đã chứng minh khả năng vượt trội so với các phương pháp khác và có thể cạnh tranh với JPEG 2000 Ngoài ra, mã tự động cũng được ứng dụng hiệu quả trong tiền xử lý hình ảnh, đặc biệt là trong việc giảm kích thước hình ảnh Sự gia tăng sản xuất ảnh và phim kỹ thuật số, thường được chụp trong điều kiện kém, đã tạo ra nhu cầu cao về các phương pháp khôi phục ảnh hiệu quả Cuối cùng, các thí nghiệm thành công đã được thực hiện để khai thác các biến thể của mã tự động cơ bản cho các tác vụ chụp ảnh siêu phân giải.
SSIM (The structural similarity index measure), phép đo chỉ sốtương đồng về cấu trúc là một phương pháp để dựđoán chất lượng cảm nhận của truyền hình kỹ thuật
SSIM (Structural Similarity Index) là chỉ số được sử dụng để đo lường mức độ tương đồng giữa hai hình ảnh, giúp đánh giá chất lượng hình ảnh một cách chính xác Chỉ số này dựa trên hình ảnh gốc không bị nén hoặc biến dạng, từ đó cung cấp một phép đo đáng tin cậy cho chất lượng hình ảnh và video kỹ thuật số.
SSIM là mô hình nhận thức đánh giá sự suy giảm hình ảnh dựa trên thông tin cấu trúc và các hiện tượng cảm nhận quan trọng như che độ sáng và che độ tương phản Khác với các phương pháp như MSE hay PSNR, SSIM không chỉ ước tính sai số tuyệt đối mà còn xem xét sự phụ thuộc mạnh mẽ giữa các pixel lân cận, điều này cung cấp thông tin quan trọng về cấu trúc của đối tượng trong cảnh Che độ chói khiến biến dạng hình ảnh ít hiển thị hơn ở vùng sáng, trong khi che độ tương phản làm cho các biến dạng trở nên khó nhận thấy hơn ở những khu vực có hoạt động hoặc kết cấu đáng kể.
Chỉ số SSIM được tính toán trên các cửa sổ khác nhau của một hình ảnh Thước đo giữa hai cửa sổ x và y có kích thước chung NxN là:
𝜇𝜇𝑚𝑚, 𝜇𝜇𝑦𝑦 là trung bình của x và y
𝜎𝜎𝑚𝑚 2, 𝜎𝜎𝑦𝑦 2 là phương sai của x và y
𝜎𝜎 𝑚𝑚𝑦𝑦 là hiệp phương sai của x và y
𝑐𝑐1 = (𝑘𝑘1𝐿𝐿) 2 , 𝑐𝑐2 = (𝑘𝑘2𝐿𝐿) 2 là hai biến thể ổn định phép chia có mẫu số yếu L là phạm vi động của các pixel (thường là 2#𝑜𝑜𝑚𝑚𝑡𝑡𝑐𝑐 𝑝𝑝𝑡𝑡𝑡𝑡 𝑝𝑝𝑚𝑚𝑚𝑚𝑡𝑡𝑐𝑐 −1), 𝑘𝑘 1 = 0.01,𝑘𝑘 2 = 0,03 theo mặc định
Công thức SSIM dựa trên ba yếu tố chính để so sánh các mẫu x và y, bao gồm độ chói (l), tương phản (c) và cấu trúc (s) Mỗi yếu tố này được phân tích thông qua các hàm so sánh riêng biệt.
SSIM là sự kết hợp có trọng số của 2 phép đo trên:
47 Đặt 𝛼𝛼,𝛽𝛽,𝛾𝛾 thành 1 sẽthu được công thức phía trên
SSIM (Structural Similarity Index) đáp ứng tính đồng nhất của các thuộc tính không thể phân biệt và đối xứng, nhưng không tuân thủ bất đẳng thức tam giác hay không phủ định, do đó không phải là một hàm khoảng cách Trong một số điều kiện nhất định, SSIM có thể được chuyển đổi thành thước đo MSE gốc được chuẩn hóa, trở thành một hàm khoảng cách Hàm này không lồi, mà chỉ lồi cục bộ, khiến SSIM trở thành một mục tiêu khả thi để tối ưu hóa Công thức SSIM thường được áp dụng để đánh giá chất lượng hình ảnh, chủ yếu trên luma, nhưng cũng có thể áp dụng cho các giá trị màu như RGB hoặc YCbCr, với chỉ số SSIM cho ra giá trị thập phân từ 0 đến 1.
Phát hi ệ n l ỗ i nhám
Lỗi nhám bên trong lỗ xảy ra trong quá trình gia công lỗ Các nguyên nhân gây ra nhám là do mòn dao, sai lệch của đồ gá
Để phát hiện lỗi bên trong lỗ trục chính, đề xuất sử dụng mạng autoencoder với các bước thực hiện cụ thể Hình 4.3 minh họa ảnh OK và ảnh lỗi nhám bên trong lỗ trục chính.
Bước đầu tiên trong quy trình là thu thập dữ liệu bằng cách chụp ảnh với vị trí tương đối giữa lỗ và camera Camera nên được đặt nghiêng khoảng 45 độ, và ánh sáng cần được chiếu từ dưới lên để đảm bảo chất lượng hình ảnh tốt nhất.
Hình 4.4 Chụp ảnh bên trong lỗ
Bước 2: Xử lý dữ liệu
Sau khi chụp ảnh, chúng ta áp dụng thuật toán RANSAC để xác định hình elip, từ đó tạo vùng ROI nhằm cắt ảnh Quá trình này giúp biến ảnh thành định dạng phù hợp cho thuật toán autoencoder, phục vụ cho việc kiểm tra khuyết tật trên bề mặt lỗ.
Hình 4.5 Cắt ảnh trong lỗ trục chính
Bước 3: Đào tạo mô hình là giai đoạn quan trọng, trong đó chỉ sử dụng các ảnh không lỗi để đào tạo Mô hình autoencoder sẽ học cách mã hóa dữ liệu một cách lặp đi lặp lại cho đến khi hàm mất mát đạt ngưỡng yêu cầu Hàm mất mát SSIM được áp dụng trong quá trình này nhằm tăng cường hiệu suất cho mô hình Kết quả của quá trình đào tạo là tệp trọng số hdf5, chứa các tham số của mô hình autoencoder, được sử dụng để phát hiện khuyết tật trong các lỗ trục.
Hình 4.6 Đào tạo mô hình autoencoder
Mô hình đào tạo có khả năng tái tạo đầu vào là ảnh không lỗi một cách chính xác, trong khi đó, khi xử lý các ảnh có lỗi, hiệu suất của mô hình bị giảm Việc so sánh giữa đầu vào và đầu ra bằng chỉ số SSIM sẽ giúp phát hiện bất thường trên các ảnh lỗi.
Hình 4.7 Quá trình phát hiện lỗi bên trong lỗ trục chính
MÔ HÌNH H Ệ TH Ố NG VÀ K Ế T QU Ả TH Ự C NGHI Ệ M 51
Mô hình h ệ th ố ng
Trong hệ thống kiểm tra này, máy ảnh được lắp đặt ở đỉnh hộp, trong khi các đèn LED được sắp xếp xung quanh với khoảng cách hợp lý Rocker arm được đặt ở trung tâm đáy hộp và vị trí của nó được cố định bằng đồ gá từ bên ngoài Các động cơ và cơ cấu chấp hành sẽ hút rocker arm và xoay để chụp đủ 6 mặt của nó Lỗi lệch trục và vát mép sẽ được kiểm tra trên ảnh chụp mặt trên và mặt đáy khi máy ảnh ở vị trí vuông góc Đối với các lỗi xước trên thân và gân, sẽ tiến hành kiểm tra trên tất cả các mặt của rocker arm.
Hình 5.1 Vị trí camera, vật và đèn led trong hộp
Hình 5.2 Hệ thống cơ cấu chấp hành cho quá trình chụp ảnh
Hệ thống kiểm tra lỗi bên trong lỗ của rocker arm cần được cải thiện để đảm bảo chất lượng hình ảnh tốt hơn Việc sử dụng ánh sáng từ phía dưới và một tờ giấy trắng dày 0,5-1,5mm giữa rocker arm và đèn sẽ giúp tạo ra ánh sáng đồng đều hơn Khu vực chiếu sáng cần lớn hơn đường kính của lỗ, như minh họa trong Hình 5.3 Để chụp toàn bộ bên trong lỗ, mẫu cần được quay quanh trục lỗ và sau đó lật ngược lại để chụp từ phía dưới.
Hình 5.4 Hệ thống chiếu sáng khi chụp ảnh bên trong lỗ
Hình 5.5 Vị trí camera và rocker arm khi chụp ảnh trong lỗ
Hình 5.6 Hình ảnh hệ thống chụp bên trong lỗ thực tế
Hình 5.7 Hình ảnh chụp bên trong lỗ trục chính
Hình 5.8 Hình ảnh chụp bên trong lỗ con lăn
5.1.2 Hệ thống camera và máy tính xử lý
Nikon D7100 là một máy ảnh DSLR với độ phân giải tối đa 6000x4000 pixel và cảm biến CMOS APS-C (23.5x15.6mm), mang lại hiệu quả 24 megapixels Máy được thiết kế để loại bỏ bộ lọc răng cưa, giúp hình ảnh sắc nét hơn, nhạy sáng cao và tăng tốc độ xử lý Với khả năng khử nhiễu và cải thiện độ tương phản, Nikon D7100 tạo ra màu sắc rực rỡ và sống động Hệ thống lấy nét tự động 51 điểm mới với 15 điểm cross-type cho phép lấy nét nhanh và chính xác, ngay cả trong điều kiện ánh sáng yếu.
Máy ảnh hỗ trợ chụp ảnh chủ thể đang di chuyển, giảm thiểu hiện tượng nhòe mờ với ISO từ 100-6400, có thể mở rộng lên 25600 Tốc độ màn trập tối đa đạt 1/8000s, cho phép nắm bắt mọi khoảnh khắc đẹp ngay cả trong điều kiện ánh sáng yếu Một số cài đặt cơ bản cho hệ thống chụp ảnh rocker arm cũng được hỗ trợ.
Máy tính được sử dụng trong quá trình chụp ảnh và kiểm tra lỗi trên bề mặt rocker arm có cấu hình bao gồm CPU Intel Core i7-7800X với tốc độ 3.5GHz và RAM 16GB.
Để tăng tốc quá trình đào tạo các mô hình và hỗ trợ phát hiện lỗi, việc cài đặt thư viện CUDA 11.2 và cuDNN 8.2 là cần thiết cho GPU NVIDIA GeForce GTX 1060 6GB, giúp tối ưu hóa việc tải và chạy mô hình trên GPU.
K ế t qu ả th ự c nghi ệ m
5.2.1 Chuyển đổi đơn vị trên ảnh và thực tế
Lấy một mẫu đo kích thước vật trong thực tế bằng thước kẹp, so sánh với kích thước vật trên ảnh để tìm các hệ số chuyển đổi
Hình 5.10 Đo chiều dài vật trong thực tế
Hình 5.11 Đo chiều rộng vật trong thực tế
Hình 5.12 Đo chiều cao vật trong thực tế
Hình 5.13 Kích thước vật trên ảnh
Bảng 5.1 Kích thước vật thực tế và trên ảnh
Kích thước vật Trên ảnh (pixel) Thực tế (mm) Hệ số
Kết quả tính toán chuyển đổi từ bảng trên được áp dụng vào quá trình kiểm tra lỗi trên rocker arm Để đánh giá độ chính xác của thuật toán RANSAC, cần so sánh kết quả đo thực tế với kết quả thu được từ thuật toán.
Hình 5.14 Đo đường kính lỗ trục chính thực tế
Hình 5.15 Đo đường kính đường tròn ngoài thực tế
Bảng 5.2 Kích thước đường tròn thực tế và tính toán
Kích thước Trên ảnh (pixel) Tính toán (mm) Thực tế (mm) Đường tròn trong 597.54 6.64 6.625 Đường tròn ngoài 819.35 9.1 9.425
Kết quả từ bảng cho thấy độ sai lệch giữa kết quả tính toán bằng thuật toán RANSAC và kết quả đo thực tế là rất nhỏ, với độ sai lệch lớn nhất khoảng 0.3 mm Các yếu tố ảnh hưởng đến sai lệch bao gồm độ chính xác của thước đo, độ chính xác của phép đo, độ chính xác của thuật toán RANSAC và độ chính xác trong việc chuyển đổi đơn vị từ pixel sang mm Điều này chứng tỏ rằng thuật toán RANSAC có độ chính xác cao, phù hợp để áp dụng trong quá trình kiểm tra lỗi lệch trục và lỗi vát mép.
5.2.2 Kết quả thực nghiệm phát hiện lỗi lệch trục Áp dụng thuật toán trên dữ liệu thực đểđánh giá hiệu suất của quá trình phát hiện lỗi lệch trục chính Số lượng mẫu NG có lỗi lệch trục là 51 Kích thước vùng lỗ trục cần kiểm tra là 22.2x22.2 mm (2000x2000 pixel) Thông sốcài đặt cho thuật toán RANSAC: số vòng lặp tối đa 2000, ngưỡng khoảng cách để các điểm nằm trong 1 đường tròn là 10 pixel Tốc độ kiểm tra khoảng 1.5 s cho 1 ảnh Kết quả phát hiện đường tròn và tính toán các thông sốđể kiểm tra độ lệch trục như hình dưới đây.
Hình 5.16 Kết quả phát hiện lỗi lệch trục lỗ trục chính
Hình 5.17 Kết quả phát hiện lỗi lệch trục lỗ trục chính
Kết quả kiểm tra 51 mẫu cho thấy bán kính đường tròn trong dao động từ 6.48 đến 6.7 mm, với giá trị trung bình là 6.61 mm Bán kính đường tròn ngoài nằm trong khoảng từ 8.97 đến 9.56 mm, và giá trị trung bình đạt 9.22 mm Độ lệch tâm e có giá trị từ 0.06 đến 0.91 mm, trong đó giá trị trung bình của độ lệch tâm là 0.32 mm.
∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑚𝑚 từ 2.57-3.52 mm, giá trị trung bình ∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑚𝑚 là 2.93 mm, khoảng cách ∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑚𝑚 từ 2.4-2.94 mm, giá trị trung bình ∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑚𝑚 là 2.61 mm, khoảng cách ∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑛𝑛 từ 1.6- 2.64 mm, giá trị trung bình ∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑛𝑛 là 2.29 mm
Bảng 5.3 Thống kê kết quả kiểm tra lỗi lệch trục chính
Hiện tại, trung bình các chỉ số kiểm tra lỗi lệch trục trên lỗ gen là 6.61, 9.22, 0.32, 2.93, 2.61 và 2.29 Tuy chưa có mẫu lỗi cụ thể cho vị trí này, nhưng có thể áp dụng phương pháp tương tự như kiểm tra lỗi lệch trục trên lỗ trục chính Hình 5.12 dưới đây minh họa ví dụ về thuật toán kiểm tra lỗi lệch trục trên lỗ gen.
Hình 5.18 Kết quả phát hiện lỗi lệch trục lỗ gen
5.2.3 Kết quả thực nghiệm lỗi vát mép Áp dụng thuật toán để đánh giá quá trình phát hiện lỗi vát mép với sốlượng ảnh
Trong tổng số 61 ảnh, có 40 ảnh lệch vát mép và 21 ảnh vát mép sâu trên lỗ trục chính Kích thước vùng vát mép cần kiểm tra là 15.56x15.56 mm (1400x1400 pixel) Thuật toán RANSAC được cài đặt với số vòng lặp tối đa là 2000 và ngưỡng khoảng cách cho các điểm nằm trong 1 đường tròn là 7 pixel Tốc độ kiểm tra đạt khoảng 1 giây cho mỗi ảnh Đối với các lỗi lệch vát mép, giá trị ∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑚𝑚, ∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑚𝑚, ∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑛𝑛 có khoảng cách lớn với nhau và với ∆𝑅𝑅𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡, như minh họa trong hình 5.12.
Mẫu lỗi lệch vát mép cho thấy vùng vát mép lớn nhất đạt độ rộng 0.64 mm và vùng nhỏ nhất chỉ 0.35 mm, với độ lệch lớn nhất so với tiêu chuẩn là 0.19 mm Hình 5.13 minh họa kết quả kiểm tra lỗi vát mép sâu trên lỗ trục chính Đối với lỗi này, các giá trị ∆𝑅𝑅𝑚𝑚𝑚𝑚𝑚𝑚, ∆𝑅𝑅𝑚𝑚𝑚𝑚𝑚𝑚, ∆𝑅𝑅𝑚𝑚𝑚𝑚𝑛𝑛 có thể tương đối đồng nhất nhưng lại sai lệch lớn so với giá trị ∆𝑅𝑅 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 Ví dụ, độ rộng vùng vát mép lớn nhất lên tới 0.93 mm, gấp đôi giá trị tiêu chuẩn, với độ lệch so với tiêu chuẩn là 0.49 mm.
Hình 5.19 Kết quả kiểm tra lỗi lệch vát mép trên lỗ trục chính
Hình 5.20 Kết quả kiểm tra lỗi vát mép sâu trên lỗ trục chính
Kết quả kiểm tra các mẫu lệch vát mép trên lỗ trục chính cho thấy bán kính đường tròn trong dao động từ 6.55-6.64 mm, với giá trị trung bình là 6.59 mm Bán kính đường tròn ngoài nằm trong khoảng 6.99-7.18 mm, giá trị trung bình đạt 7.07 mm Độ lệch tâm e có giá trị từ 0.03-0.24 mm, trung bình là 0.12 mm Khoảng cách ∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑚𝑚 biến thiên từ 0.49-0.83 mm, với giá trị trung bình là 0.59 mm Khoảng cách ∆𝑅𝑅𝑚𝑚𝑚𝑚𝑚𝑚 từ 0.38-0.59 mm, giá trị trung bình là 0.47 mm, trong khi khoảng cách ∆𝑅𝑅𝑚𝑚𝑚𝑚𝑛𝑛 dao động từ 0.21-0.47 mm, với giá trị trung bình là 0.35 mm.
Bảng 5.4 Thống kê kết quả kiểm tra lỗi lệch vát mép trên lỗ trục chính
Kết quả kiểm tra các mẫu vát mép sâu trên lỗ trục chính cho thấy bán kính đường tròn trong dao động từ 6.56-6.65 mm, với giá trị trung bình là 6.6 mm Bán kính đường tròn ngoài nằm trong khoảng 6.09-7.45 mm, giá trị trung bình đạt 7.24 mm Độ lệch tâm e có giá trị từ 0.02-0.2 mm, với giá trị trung bình là 0.1 mm Khoảng cách ∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑚𝑚 dao động từ 0.57-1.09 mm, trung bình là 0.79 mm, trong khi khoảng cách ∆𝑅𝑅 𝑚𝑚𝑚𝑚𝑚𝑚 còn lại từ 0.47-0.89 mm, với giá trị trung bình là 0.69 mm.
∆𝑅𝑅𝑚𝑚𝑚𝑚𝑛𝑛 từ 0.33-0.78 mm, giá trị trung bình ∆𝑅𝑅𝑚𝑚𝑚𝑚𝑛𝑛 là 0.6 mm
Bảng 5.5 Thống kê kết quả kiểm tra lỗi vát mép sâu trên lỗ trục chính
Trung bình 6.6 7.24 0.1 0.79 0.69 0.6 cho thấy rằng hiện tại chưa có mẫu lỗi vát mép lệch và lỗi chiếu sâu vát mép tại vùng vát mép trên lỗ con lăn Tuy nhiên, có thể áp dụng phương pháp tương tự để kiểm tra lỗi tại đây như đã thực hiện với vùng vát mép trên lỗ trục chính Hình 5.15 dưới đây minh họa ví dụ áp dụng thuật toán cho vùng vát mép trên lỗ con lăn.
Hình 5.21 Kết quả kiểm tra lỗi vát mép trên lỗ con lăn
5.2.4 Kết quả thực nghiệm lỗi xước Đào tạo mô hình yolov3 với đầu vào 72 ảnh NG, 20 ảnh OK Do sốlượng ảnh NG nhỏ, để tăng số lượng mẫu áp dụng các phương pháp tăng cường dữ liệu cơ bản như lật, xoay, thay đổi độsáng độtương phản, … Đào tạo mô hình YOLOv3 với kích thước đầu vào của mạng là 416x416, batch size 64, max batches 20000 vòng lặp, learning rate 0.001, decay 0.0005 Biểu đồ quá trình đào tạo thu được như hình 5.16 và 5.17 Trên biểu đồ cho thấy loss giảm dần và đạt giá trị nhỏ nhất khoảng 0.0167 Giá trị độ chính xác trung bình (mean average precision – mAP) tăng dần và đạt giá trị lớn nhất 91% Do mAP có xu hướng giảm sau khi đạt giá trị lớn nhất, có nghĩa mô hình đang có xu hướng quá tải (overfit) nếu tiếp tục đạo tạo nên dừng quá trình đào tạo ở vòng lặp thứ 20000 Lấy mô hình tốt nhất tại vị trí đạt mAP 91% cho quá trình kiểm tra và đánh giá mô hình đào tạo được
Hình 5.22 Biểu đồ quá trình đào tạo YOLOv3
Hình 5.23 Biểu đồ quá trình đào tạo YOLOv3
Mô hình đào tạo đã được kiểm tra trên 112 ảnh NG và 184 ảnh OK, với kích thước ảnh lớn nhất là 5000x2000 pixel và tốc độ kiểm tra khoảng 3 giây mỗi ảnh Trong số 184 mẫu OK, mô hình phát hiện sai 3 mẫu NG, trong khi đối với 112 mẫu NG, mô hình đã phát hiện thành công 108 mẫu.
Từđó tính toán các tham sốđánh giá mô hình như sau:
Kết quả áp dụng cho các mẫu OK và NG được thể hiện trong hình 5.18, trong đó hệ thống sẽ đánh dấu vùng lỗi và hiển thị vị trí các lỗi trên màn hình ngay sau khi phát hiện.
Hình 5.24 Ảnh mẫu trước và sau khi kiểm tra lỗi xước
Hình 5.25 Kết quả phát hiện lỗi xước mẫu NG
Hình 5.26 Kết quả phát hiện lỗi xước mẫu OK
5.2.5 Kết quả thực nghiệm lỗi nhám Đào tạo mô hình autoencoder để phát hiện lỗi bên trong lỗ trục chính với các thông sốđầu vào: 360 ảnh OK kích thước 790x365 pixel, áp dụng các phương pháp tăng
Dữ liệu thu được bao gồm 50,000 ảnh với kích thước 128x128 pixel Quá trình đào tạo được thực hiện trong tối đa 1,000 epochs, với thời gian mỗi epoch là 64 giây Đào tạo dừng lại ở epoch thứ 700 khi giá trị validation loss không giảm sau 400 vòng lặp.
Kết quảđào tạo tốt nhất thu được với các giá trị ssim loss = 0.0413, mse loss 0.00006, validation ssim loss = 0.05072, validation mse loss = 0.00008
Hình 5.27 Biểu đồ loss mse khi đào tạo cho lỗ trục chính
Hình 5.28 Biểu đồ loss ssim khi đào tạo cho lỗ trục chính
K ế t lu ận, đánh giá hiệ u qu ả c ủ a gi ả i pháp
Bài luận văn này nghiên cứu các phương pháp kiểm tra ngoại quan sản phẩm rocker arm, tập trung vào việc phát hiện lỗi trong quá trình sản xuất như lệch trục, vát mép, xước và nhám bên trong Các phương pháp được áp dụng bao gồm thuật toán RANSAC cho lỗi lệch trục và vát mép, YOLO cho lỗi xước, và Autoencoder cho lỗi nhám Kết quả thử nghiệm cho thấy các phương pháp đạt hiệu quả cao với độ chính xác tốt và thời gian suy luận nhanh trong việc phát hiện đường tròn trên các lỗ trục Đặc biệt, thuật toán RANSAC cho kết quả chính xác với sai lệch chỉ 0.3 mm, đáp ứng yêu cầu kiểm tra lỗi lệch trục và vát mép, trong khi tốc độ kiểm tra lỗi lệch trục là 1.5 giây.
Mô hình phát hiện lỗi vát mép cho 1 ảnh đạt độ chính xác 96.4%, với các chỉ số precision 0.964, recall 0.973 và F1 0.484 Đối với lỗi nhám bên trong lỗ, mô hình đã phát hiện 100% mẫu lỗi hiện có, nhưng vẫn có sai sót trên các mẫu tốt Dù vậy, các mô hình YOLO và Autoencoder trong việc phát hiện lỗi xước và lỗi nhám vẫn gặp một số nhược điểm Thời gian suy luận khi phát hiện vết xước vẫn chậm do kích thước ảnh lớn, trong khi yêu cầu thực tế là cần chạy thời gian thực để phù hợp với sản xuất Mô hình YOLO chưa phát hiện toàn bộ ảnh lỗi xước và thường phát hiện nhầm các mẫu không có lỗi, trong khi Autoencoder cũng gặp tình trạng tương tự.
Trong tương lai, cần cải thiện độ chính xác của các mô hình đối với các mẫu không có lỗi và nâng cao thời gian suy luận cho mô hình YOLO Để áp dụng kết quả vào sản xuất, cần thu thập thêm mẫu, mở rộng tập dữ liệu và đào tạo lại các mô hình với dữ liệu mới nhằm tăng tính khái quát và độ chính xác Đối với lỗi vát mép và lỗi lệch trục, cần tính toán tham số ∆𝑅𝑅 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 đạt yêu cầu của nhà máy trên các mẫu tốt Đối với lỗi xước, việc thu thập thêm nhiều mẫu NG sẽ giúp cải thiện mô hình YOLO Đối với các lỗi nhám bên trong lỗ, có thể điều chỉnh mô hình hoặc hệ chiếu sáng để tránh phát hiện nhầm các mẫu OK và loại bỏ ảnh hưởng từ bên ngoài như bụi bẩn hay dầu.
[1] 1 Steger, Carsten; Markus Ulrich; Christian Wiedemann
(2018) Machine Vision Algorithms and Applications (2nd ed.)
[2] 2 Beyerer, Jürgen; Puente León, Fernando & Frese, Christian
(2016) Machine Vision - Automated Visual Inspection: Theory,
Practice and Applications Berlin: Springer doi:10.1007/978-3- 662-47794-6 ISBN 978-3-662-47793-9 Retrieved 2016-10-11
[3] 3 Graves, Mark & Bruce G Batchelor (2003) Machine Vision for the
Inspection of Natural Products Springer p 5 ISBN 978-1-85233- 525-0 Retrieved 2010-11-02
[4] 4 Steger, Carsten; Markus Ulrich; Christian Wiedemann
(2018) Machine Vision Algorithms and Applications (2nd ed.)
[5] 5 John Canny, “A computational approach to edge detection”,
Pattern Analysis and Machine Intelligence, IEEE Transactions on, (6):679–698, 1986.
[6] 6 Satoshi Suzuki and others, “Topological structural analysis of digitized binary images by border following”, Computer Vision, Graphics, and Image Processing, 30(1):32–46, 1985.
[7] 7 M A Fischler and R C Bolles, “Random sample consensus: A paradigm for model fitting with applications to image analysis and automated cartography”, Communications of the ACM, vol 24, no
[8] 8 Joseph Redmon, Ali Farhadi, “YOLOv3: An Incremental
[9] 9 Shuang Mei, Yudan Wang and Guojun Wen, “Automatic Fabric
Defect Detection with a Multi-Scale Convolutional Denoising
[10] 10 Jiawei Yu, Ye Zheng, Xiang Wang, Wei Li, Yushuang Wu, Rui
Zhao, Liwei Wu, “FastFlow: Unsupervised Anomaly Detection and
Localization via 2D Normalizing Flows”, ArXiv, 2021.
[11] 11 Karsten Roth, Latha Pemula, Joaquin Zepeda, Bernhard
Schửlkopf, Thomas Brox, Peter Gehler, “Towards Total Recall in
[12] 12 https://github.com/AlexeyAB/darknet
[13] 13 https://github.com/AlexeyAB/Yolo_mark
[14] 14 https://github.com/plutoyuxie/AutoEncoder-SSIM-for-unsupervised- anomaly-detection-