TỔNG QUAN
Tổng quan về trứng - trứng cút và một số tiêu chuẩn phân loại trứng
Trứng là thực phẩm giàu giá trị dinh dưỡng, cung cấp protein, chất béo, vitamin, khoáng chất và hormone Thành phần dinh dưỡng trong trứng được cân đối và tương quan hợp lý, mang lại lợi ích sức khỏe vượt trội.
Trứng gà có cấu tạo chung bao gồm bốn bộ phận chính: lòng đỏ, lòng trắng, màng vỏ và vỏ trứng Trong đó, lòng đỏ chiếm khoảng 31,9% khối lượng, lòng trắng chiếm 55,8%, vỏ cứng chiếm 11,9% và màng vỏ chỉ chiếm 0,4%.
7 Màng noãn hoàn (Màng lòng đỏ trứng)
10 Lớp màng màu vàng của lòng đỏ
11 Lớp màng màu trắng của lòng đỏ
15 Lớp biểu bì ngoài vỏ trứng
Hình 2-1: Cấu tạo chung của trứng [4].
Lòng đỏ trứng cút chứa nhiều vitamin và khoáng chất quan trọng, trong khi lòng trắng chủ yếu là nước với ít khoáng chất Mặc dù kích thước và trọng lượng của trứng cút chỉ khoảng 9g - 12g, nhỏ hơn so với trứng gà (50g - 64g) và trứng vịt (70g), nhưng hàm lượng dinh dưỡng trong trứng cút lại rất cao, thậm chí một số chất còn vượt trội hơn cả trứng gà và trứng vịt.
Bảng 2-1: Bảng giá trị dinh dƣỡng của trứng gà, trứng vịt và trứng cút [5], [6] Đơn vị Trứng gà
Hàm lƣợng dinh dƣỡng cơ bản
Kẽm, Zn mg 1.10 1.41 1.444 Đồng, Cu mg 0.014 0.062 0.067
2.1.2 Một số yếu tố cơ bản ảnh hưởng đến chất lượng trứng
Hình dạng trứng bị biến dạng, méo mó
Vỏ ngoài của trứng có vết bẩn
Hiện tƣợng nứt, vỡ ở vỏ trứng
Xuất hiện vệt máu trong trứng…
2.1.3 Tiêu chuẩn đánh giá, phân loại chất lƣợng trứng
Theo tiêu chuẩn của Mỹ, có hiệu lực từ ngày 20 tháng 7 năm 2000, trứng thương phẩm được phân loại thành ba loại chính: AA, A và B, trong đó loại AA được xem là có chất lượng tốt nhất.
Bảng 2-2: Tiêu chuẩn phân loại trứng [7]
Chiều sâu nhỏ hơn 1/8 inch
Chiều sâu nhỏ hơn 3/16 inch
Có vệt máu và những đốm nhỏ**
Biên ngoài khó xác định
Không có biểu hiện khuyết tật
Biên ngoài khó xác định
Không có biểu hiện khuyết tật
Có thể thấy phôi phát triển nhƣng chƣa có vệt máu
* : 1/32 diện tích bề mặt nếu nằm tập trung hoặc 1/16 nếu nằm rải rác
**: Đường kính không lớn hơn 1/8 inch
Hình 2-2: Hình rọi trứng gà loại AA, A và B [7]
Tính đến năm 2012 vẫn có rất ít các tài liệu đề cập về các tiêu chuẩn riêng cho phân loại trứng cút.
Một số phương pháp kiểm tra và phân loại chất lượng trứng
Nếu dựa vào phương pháp, có 2 phương pháp chính để kiểm tra chất lượng trứng là phương pháp phá hủy và phương pháp không phá hủy
Phương pháp kiểm tra không phá hủy: Cho phép kiểm tra chất lƣợng bên ngoài
Hình dáng, màu sắc, trọng lượng, tình trạng bề mặt (có vết bẩn hoặc không), và tình trạng vỏ (nứt hoặc không nứt) là những yếu tố quan trọng cần xem xét Phương pháp này rất phù hợp để áp dụng trong ngành sản xuất và cung ứng trứng ra thị trường.
Phương pháp kiểm tra không phá hủy sử dụng mắt quan sát trực tiếp hoặc công nghệ tiên tiến như xử lý ảnh, phân tích tần số đáp ứng để phát hiện sự nứt, cùng với cảm biến quang phổ để xác định tình trạng trứng có trống hay không.
Phương pháp kiểm tra phá hủy là một kỹ thuật chính xác để đánh giá thành phần dinh dưỡng và chất lượng của trứng, phù hợp cho việc áp dụng trong môi trường phòng thí nghiệm.
Hình 2-3: Quan sát bên trong trứng [9].
Có ba kỹ thuật phân loại phổ biến được sử dụng, bao gồm kỹ thuật cơ học, kỹ thuật quang phổ và quan sát bằng camera.
Kỹ thuật cơ học: chủ yếu dùng để đánh giá chất lƣợng cơ lý vỏ trứng nhƣ độ cứng, các vết nứt…
Sử dụng lực nén để kiểm tra chất lượng vỏ trứng bằng cách tác động lực trực tiếp và xác định mối quan hệ giữa lực tác động và độ biến dạng Tuy nhiên, phương pháp này có nhược điểm là có thể gây hư hại cho trứng và tốn nhiều thời gian.
Hình 2-4: Kiểm tra trứng bằng lực nén [10]
Hình 2-5: Kiểm tra trứng bằng phân tích âm thanh [11]
Dưới đây là kết qủa phân tích đáp ứng của trứng còn nguyên và trứng bị nứt
Trứng bị nứt cho thấy tín hiệu đáp ứng với nhiều điểm đột biến về biên độ, trong khi trứng còn nguyên có đáp ứng tương đối đồng đều Sự khác biệt này được thể hiện rõ trong hình 2-6.
Hình 2-7: Đồ thị phân tích đáp ứng âm thanh của trứng gà [11]
Kỹ thuật quang phổ là phương pháp phổ biến để xác định chất lượng nội tại của sản phẩm nông nghiệp mà không gây hại cho chúng Phương pháp này nổi bật với thời gian thực hiện nhanh, độ chính xác cao và tính kinh tế.
Hình 2-8: Phân tích trứng bằng quang phổ kế [10]
Kết quả phân tích tín hiệu trong việc phát hiện vệt máu trong trứng:
Hình 2-9: Đồ thị phân tích trứng bằng quang phổ kế [10]
Kỹ thuật quan sát bằng camera đang trở nên phổ biến trong việc nhận dạng và phân loại chất lượng trứng nhờ vào công nghệ xử lý ảnh số Phương pháp này cho phép xác định các yếu tố như kích thước, hình dáng, vết nứt, vệt máu và vết bẩn trên trứng Để nâng cao tính linh hoạt của hệ thống, có thể kết hợp công nghệ xử lý ảnh với các phương pháp điều khiển thông minh như fuzzy, mạng nơ ron và thuật toán di truyền (Genetic Algorithm - GA).
Hình 2-10: Phân tích vết bẩn vỏ trứng [10]
Hình 2-11: Phân tích vết nứt vỏ trứng.
Tổng quan về một số công trình nghiên cứu của các tác giả trong và ngoài nước có liên quan đến đề tài
Gần đây, nhiều nghiên cứu đã tập trung vào việc ứng dụng công nghệ tiên tiến trong việc phân loại trứng mà không cần phá hủy Năm 1991, R.T Elster và cộng sự đã sử dụng công nghệ xử lý ảnh để phát hiện vết nứt trên vỏ trứng gà, đạt độ chính xác 96% sau khi thử nghiệm trên 113 trứng loại A Năm 1992, J.W Goodrum và các cộng sự cải tiến phương pháp này bằng cách sử dụng hệ thống con lăn, cho phép quan sát trứng từ ba góc độ khác nhau, nâng cao độ chính xác trong phân tích Đến năm 1996, V.C Patel và các cộng sự đã kết hợp công nghệ xử lý ảnh với mạng nơ ron để phát hiện vết máu bên trong trứng và các khuyết tật trên vỏ, đạt độ chính xác 90% khi kiểm tra 10.000 trứng, trong đó có 90 trứng có vết máu và 297 trứng bị nứt.
Năm 1998, V.C Patel và các cộng sự đã cải tiến phương pháp phát hiện vết máu bằng cách sử dụng ảnh màu thay vì ảnh xám, với 384 giá trị histogram ảnh màu làm ngõ vào cho mạng nơ ron Cụ thể, phương pháp sử dụng 128 giá trị histogram cho mỗi màu đơn sắc đỏ, xanh lá và xanh dương Cấu trúc mạng gồm 384 ngõ vào, 24 nút lớp ẩn và 1 ngõ ra, với số nút lớp ẩn được tăng lên 40 cho việc phát hiện vết bẩn Độ chính xác trung bình đạt 92,8% cho phát hiện vết máu, 85% cho phát hiện vết bẩn và 87,8% cho phát hiện vết nứt.
Hiện tại, nhóm nghiên cứu chưa tìm thấy tài liệu nào về việc phát hiện vết nứt trên vỏ trứng cút từ cả tác giả trong và ngoài nước Điều này có thể do kích thước nhỏ của trứng cút (34,87 x 26,2mm) và độ dày vỏ trứng chỉ 0,27mm, cùng với những vệt màu ngẫu nhiên trên vỏ trứng gây khó khăn cho việc phân tích Do đó, nhóm nghiên cứu đang tìm cách phát triển một phương pháp áp dụng hiệu quả cho việc phát hiện vết nứt trên trứng cút.
2.3.2 Các vấn đề còn tồn tại
Qua phân tích các bài báo trên, các tác giả đã tiến hành phân tích trên trứng gà chƣa thử nghiệm cho trứng cút
Chưa tiến hành kiểm tra, so sánh ảnh hưởng của các màu sắc ánh sáng khác nhau (đèn rọi trứng) đến độ chính xác của phương pháp.
CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP THỰC HIỆN
Cơ sở lý thuyết
Đề tài nghiên cứu tập trung vào việc phân loại trứng cút, đặc biệt là phát hiện trứng cút bị nứt và không bị nứt Với kích thước nhỏ gọn của trứng cút, việc xác định tình trạng của chúng trở nên quan trọng trong quy trình sản xuất và bảo quản.
Trứng có kích thước 34,87 x 26,2mm và lớp vỏ ngoài mỏng chỉ 0,27mm, với các vệt màu phân bố ngẫu nhiên, gây khó khăn trong việc nhận dạng và phân loại so với các loại trứng khác như trứng gà hay trứng vịt Do đó, cần thiết phải sử dụng một hệ thống linh hoạt để nhận diện loại trứng này một cách hiệu quả.
Nhóm nghiên cứu sẽ áp dụng công nghệ xử lý ảnh kết hợp với mạng nơ ron lan truyền ngược nhiều lớp (MLP) để phân loại trứng cút, nhằm nhận dạng trứng bị nứt và không bị nứt, dựa trên các phương pháp nghiên cứu trong và ngoài nước liên quan đến việc phân loại trứng.
3.1.1.1 Giới thiệu về ảnh số
Một ảnh số được biểu diễn bởi một hàm hai chiều, trong đó hệ tọa độ không gian xác định độ lớn tại mỗi điểm, được gọi là cường độ hoặc mức xám của ảnh Khi các giá trị độ lớn là những đại lượng rời rạc hữu hạn, ảnh này được gọi là ảnh số.
Mỗi pixel, hay còn gọi là pel (viết tắt của picture element), trong một bức ảnh số có tọa độ và độ xám hoặc độ màu nhất định Đặc tính của hàm cho từng pixel thay đổi tùy thuộc vào loại ảnh, chẳng hạn như ảnh nhị phân hay ảnh xám.
Một ảnh số gồm các pixel đƣợc sắp xếp trong một mảng hình chữ nhật Hình 3-1: Biểu diễn cấu trúc ảnh số 2 chiều
(hoặc gọi là bitmap) Mức xám của ảnh L = 2 n , ví dụ n = 8 thì L = 2 8 = 256
Giá trị màu sắc trong hình ảnh được xác định bởi số lượng bit trên mỗi pixel (bpp) Cụ thể, với 1 bpp, mỗi pixel chỉ sử dụng 1 bit, cho phép tạo ra ảnh nhị phân với hai trạng thái bật và tắt Mỗi bit bổ sung sẽ làm tăng gấp đôi số màu có thể hiển thị; ví dụ, ảnh 2bpp có thể hiển thị 4 màu, trong khi ảnh 3bpp có thể hiển thị 8 màu.
1bpp = 2 1 = 2 màu (đen hoặc trắng)
Ảnh nhị phân là một loại ảnh số trong đó mỗi pixel chỉ có thể có hai giá trị là 0 hoặc 1, tương ứng với màu trắng (mức 1) và đen (mức 0) Loại ảnh này có nhiều ưu điểm như tính đơn giản, kích thước nhỏ gọn, và thuận tiện cho việc lưu trữ, xử lý và phân tích ảnh.
Ảnh xám, hay còn gọi là ảnh grayscale, là loại ảnh kỹ thuật số có độ sâu màu 8bit (256 màu) hoặc 16bit (65.535 màu), trong đó giá trị mỗi pixel được lưu trữ trong 1 byte Ảnh xám là một dạng của ảnh đen trắng, với giá trị độ sáng của mỗi pixel dao động từ 0 đến 255 trong trường hợp ảnh 8bit, tương ứng với sự chuyển đổi từ màu đen đến màu trắng.
Hình ảnh màu (color image) yêu cầu mỗi pixel thể hiện 3 kênh màu trong không gian màu, với các không gian thường dùng như RGB (đỏ, xanh lá, xanh dương), YCbCr và HSV (màu sắc, độ bão hòa và giá trị) Ảnh màu có thể có độ sâu màu 4bit, 8bit, 32bit, trong đó không gian màu RGB là phổ biến nhất trong xử lý ảnh, kết hợp từ ba màu cơ bản: đỏ, xanh lá và xanh dương.
Mỗi pixel ảnh màu đƣợc biểu diễn nhƣ sau: [ ] Khi phối hợp 3 màu cơ bản này, ta có đƣợc nhiều màu mong muốn
Hình 3-4: Biểu diễn ảnh xám
(Hình ảnh đƣợc trích từ tài liệu
The Scientist and Engineer's Guide to Digital Signal Processing By
(http://www.dspguide.com/ch23.ht m)
Hình 3-5: Ba màu cơ bản_RGB
Ví dụ với ảnh màu 8bit: màu đỏ (256,0,0); xanh lá (0,256,0); xanh dương (0,0,256), vàng (256, 256,0), tím (256,0,256), xanh lơ (0, 256, 256), trắng (256, 256, 256)
3.1.1.2 Giới thiệu về xử lý ảnh số
Xử lý ảnh số, hay còn gọi là DIP (Digital Image Processing), là quy trình sử dụng thuật toán máy tính để phân tích và xử lý hình ảnh kỹ thuật số Dưới đây là sơ đồ cơ bản minh họa cho quá trình này.
Số hóa Ảnh tương tự Ảnh số
Cải thiện chất lƣợng ảnh
Hình 3-6: Sơ đồ xử lý ảnh số [17]
Các thiết bị thu nhận ảnh phổ biến bao gồm máy ảnh kỹ thuật số, máy quay phim và thiết bị scan Những hệ thống này thực hiện hai quá trình chính: chuyển đổi năng lượng quang học thành năng lượng điện thông qua cảm biến và tổng hợp năng lượng điện để tạo ra hình ảnh.
Có 2 loại cảm biến hình ảnh sử dụng phổ biến là loại CCD CMOS Loại cảm biến CCD có đặc điểm là độ nhạy sáng cao, cho độ phân giải lớn và thể hiện đƣợc các dải màu liên tục Loại CMOS thì có độ nhạy sáng thấp hơn nên loại CCD đƣợc sử dụng phổ biến cho các loại máy ảnh kỹ thuật số và camera
Với sự tiến bộ của khoa học kỹ thuật hiện đại, cảm biến CMOS đang dần khôi phục ưu thế nhờ khả năng tích hợp cao, bao gồm các tính năng như ADC và cân bằng sáng.
CMOS Hình 3-7: Cảm biến CCD và CMOS
Với , : khoảng dịch chỉnh theo x và y; trong ảnh số
, Gradient của 1 điểm ảnh với hướng thay đổi về cường độ sáng:
Hướng của gradient được xác định bằng công thức:
( ⁄ ) Độ lớn của gradient điểm ảnh có thể đƣợc xác định bằng công thức:
) √ ( ) Gradient đƣợc tính thông qua việc trƣợt ma trận mặt nạ (nxn) lên ảnh đƣợc phân tích Mặt nạ này đƣợc gọi là mặt nạ cuộn hay kernel
Tính gradient trong ảnh đóng vai trò quan trọng trong việc tách biên dạng vật thể, giúp khoanh vùng và phân đoạn ảnh để phục vụ cho quá trình xử lý và phân tích hiệu quả.
Làm mƣợt ảnh và lọc nhiễu
Mặt nạ cuộn trong ảnh:
Giá trị đƣợc xác định bằng cách trƣợt mặt nạ qua từng pixel của ảnh tại vị trí Có thể viết lại dưới dạng tổng quát như sau:
VD: với mặt nạ cuộn có kích thước 3x3
Lọc ảnh là một quá trình quan trọng trong xử lý hình ảnh, với nhiều phương pháp khác nhau như lọc trung vị, lọc tuyến tính và lọc Gaussian Trong số đó, bộ lọc Gaussian được sử dụng phổ biến nhất nhờ hiệu quả trong việc làm mịn hình ảnh và giảm nhiễu Hàm Gaussian cơ bản đóng vai trò quan trọng trong việc thực hiện các phép lọc này.
Với là trị trung bình hoặc vị trí đỉnh, là phương sai Hàm gaussian tiêu chuẩn thì 0 và
Lọc gaussian sử dụng mặt nạ cuộn với kích thước 3x3, 5x5, 7x7…
Thông thường lọc gaussian cho ảnh I với mặt nạ cuộn kích thước nxn sẽ được tiến hành theo 3 bước:
1- Tạo mặt nạ cuộn gaussian 1 chiều có kích thước n
2- Trƣợt mặt nạ này qua từng cột của I đƣợc I N
3- Sau đó trƣợt mặt nạ qua từng hàng của IN, ta thu đƣợc kết quả
Hình 3-9: Mặt nạ cuộn gaussian 1 chiều
Ví dụ như mặt nạ 5x5 dưới đây, có thể tách thành mặt nạ 1 chiều có kích thước là 5
Chuyển ảnh màu sang ảnh xám, nhị phân
Chuyển sang ảnh xám: có 3 cách sau có thể áp dụng để chuyển từ ảnh màu sang ảnh xám:
Lightness: Lấy trung bình giá trị màu cao nhất và màu thấp nhất
Average: Lấy giá trị màu trung bình
Luminosity: Nhân theo hệ số
0 hoặc Ảnh gốc Trung bình max-min
Trung bình RGB Nhân hệ số
Hình 3-10: Chuyển từ ảnh màu sang ảnh xám [18]
THỰC NGHIỆM VÀ KẾT QUẢ ĐẠT ĐƢỢC
Xây dựng chương trình tổng thể
Sau khi nghiên cứu các lý thuyết liên quan đến phương pháp giải quyết vấn đề, bước tiếp theo là thiết kế chương trình thực nghiệm nhằm kiểm tra và đánh giá độ tin cậy của phương pháp này.
Chương trình được viết trên phần mềm Microsoft visual studio 2010 với sự hỗ trợ của thƣ viện Opencv 2.2
OpenCV (Open Source Computer Vision) là một thư viện mã nguồn mở nổi bật, cung cấp hơn 500 hàm chức năng và 2500 thuật toán cho xử lý ảnh mạnh mẽ Thư viện này rất phổ biến và tương thích với ngôn ngữ lập trình C/C++, đồng thời có thể chạy trên phần mềm Microsoft Visual Studio.
Vì vậy, Opencv thật sự là một công cụ đắc lực cho việc xây dựng chương trình thực nghiệm và đánh giá hiệu quả của phương pháp
Giao diện chính của chương trình:
Hình 4-1: Giao diện chương trình
Thể hiện hình ảnh cần phân tích và kết quả
Thiết lập thông số mạng nơ ron
Tải ảnh để kiểm tra
Lưu đồ: Toàn bộ phương pháp thực hiện trong luận văn này được tiến hành qua các bước sau:
Xử lý ảnh Tính histogram Tạo tập mẫu
Huấn luyện mạng Đánh giá chất lƣợng mạng nơ ron Đánh giá chất lƣợng tập mẫu
Hiệu chỉnh thông số mạng nơ ron
Phương pháp thực hiện được mô tả qua lưu đồ trong Hình 4-2, với các bước và công việc cụ thể sẽ được trình bày chi tiết trong phần tiếp theo.
Nội dung từng bước thực hiện:
Hệ thống con lăn cho phép thu thập mẫu trứng cút bằng cách quan sát từ ít nhất ba góc độ khác nhau, giúp đánh giá toàn bộ chu vi của trứng một cách chi tiết.
Khi thu thập mẫu trong điều kiện lý tưởng, ba góc độ sẽ lệch nhau 120 độ, điều này giúp nâng cao độ chính xác trong việc nhận diện vết nứt trên vỏ trứng cút.
Trong luận văn này, nhóm nghiên cứu sẽ xây dựng hai bộ tập mẫu khác nhau nhằm mục đích huấn luyện mạng nơ ron và đánh giá hiệu quả của phương pháp.
Sau khi thu thập mẫu, chúng tôi tiến hành huấn luyện mạng nơ ron để nhận diện trứng bị nứt và không bị nứt, trong phạm vi nghiên cứu Để tối ưu hóa hiệu quả của mạng nơ ron, nhóm nghiên cứu đã áp dụng thuật toán di truyền nhằm tìm ra cấu trúc mạng tối ưu cho các mô hình 3 lớp và 4 lớp.
Phương pháp sẽ được đánh giá hiệu quả bằng cách kiểm tra sai số trong việc phát hiện trứng có vết nứt và không có vết nứt trên cả tập mẫu kiểm tra và tập mẫu huấn luyện.
Thu thập và xử lý tập mẫu
Vỏ bề ngoài của trứng cút có nhiều vệt màu sắc đa dạng, với kích thước, hình dạng và phân bố khác nhau, tạo nên sự phong phú trong màu sắc và cường độ ánh sáng của ảnh rọi.
Để nâng cao hiệu quả huấn luyện, cần tạo ra một tập mẫu với số lượng ảnh mẫu lớn Quá trình thu nhận ảnh được thực hiện trong buồng tối nhằm giảm thiểu nhiễu sáng từ môi trường bên ngoài Sau khi ghi nhận ảnh rọi trứng, các công cụ trong công nghệ xử lý ảnh số sẽ được áp dụng để lọc nhiễu, cải thiện chất lượng ảnh và phân đoạn, khoanh vùng vị trí, tách biên dạng trứng Cuối cùng, một mặt nạ hình elip sẽ được sử dụng để loại bỏ vùng không gian xung quanh, chỉ giữ lại vùng không gian ảnh cần thiết.
Trứng cút có kích thước và hình dạng hình elip, và những yếu tố này sẽ thay đổi tùy thuộc vào kích thước và vị trí của trứng Việc phân tích trứng cút không chỉ giúp hiểu rõ hơn về đặc điểm của nó mà còn giảm thiểu ảnh hưởng từ môi trường bên ngoài.
Trường hợp trứng cút không có vết nứt:
Bảng 4-1: Xử lý với ảnh rọi của trứng không vết nứt Ảnh ban đầu Sau khi tách biên
Mặt nạ hình elip Ảnh thu nhận đƣợc Ảnh ban đầu Sau khi tách biên
Mặt nạ hình elip Ảnh thu nhận đƣợc
Ảnh có độ sáng tốt thường không có sự khác biệt rõ rệt giữa trước và sau khi xử lý, trong khi đó, với những bức ảnh tối, sự khác biệt trở nên rõ ràng hơn, đặc biệt là trong các trường hợp có vết nứt.
Trường hợp trứng cút có vết nứt:
Bảng 4-2: Xử lý với ảnh rọi của trứng có vết nứt Ảnh ban đầu Sau khi tách biên
Mặt nạ hình elip Ảnh thu nhận đƣợc Ảnh ban đầu Sau khi tách biên
Mặt nạ hình elip Ảnh thu nhận đƣợc
Sau khi xử lý, một số vệt sáng xung quanh đã được giảm thiểu, làm cho vết nứt trên vỏ trứng trở nên rõ ràng hơn so với ảnh gốc Để tạo mặt nạ hình elip, thư viện opencv2.2 cung cấp hàm fitEllipse(), cho phép dựng hình elip với kích thước và góc quay phù hợp với biên dạng của vật thể cần phân tích Sau khi thu thập được các thông số, hình elip được vẽ bằng lệnh ellipse() Để tối ưu hóa vùng phân tích trứng, kích thước hình elip được nhân với một hệ số lớn hơn 1 (1.05).
Trong những trường hợp đặc biệt, khi trứng được xoay một góc bất kỳ, chúng ta vẫn có khả năng xác định thông số mặt nạ hình elip phù hợp, đảm bảo rằng vùng không gian cần phân tích của trứng vẫn được duy trì.
Bảng 4-3: Xử lý với ảnh rọi của trứng bị lệch Ảnh ban đầu Sau khi tách biên
Mặt nạ hình elip Ảnh thu nhận đƣợc
Nhƣ đã trình bày ở trên, sẽ có hai tập mẫu nhƣ sau:
Mẫu huấn luyện bao gồm 1982 ảnh rọi trứng cút không có vết nứt, được ghi nhận từ 5-7 góc độ khác nhau Việc này nhằm tăng xác suất xuất hiện của các đặc điểm trong quá trình phân tích và kiểm tra.
Trong tổng số 3182 ảnh rọi, có nhiều bức ảnh ghi lại các vết nứt Việc chụp ảnh mẫu có vết nứt là cần thiết hơn so với những trường hợp không có vết nứt, do sự đa dạng về mức độ và loại nứt khác nhau Chúng ta cần ưu tiên phát hiện và loại bỏ trứng có vết nứt Do đó, mỗi trứng được chụp từ nhiều góc độ và với các mức độ nứt khác nhau, nhằm tăng tính đa dạng cho tập mẫu.
Mẫu kiểm tra được sử dụng để đánh giá độ chính xác của phương pháp, và sau đó được bổ sung vào tập mẫu huấn luyện cho đến khi đạt được kết quả mong muốn Cuối cùng, tập mẫu này ghi nhận ảnh rọi của trứng cút ở ba góc độ lệch nhau khoảng 120 độ, bao gồm tổng cộng 408 ảnh, trong đó có 204 ảnh không có vết nứt và 204 ảnh có vết nứt.
Dùng thuật toán di truyền tìm cấu trúc mạng
Thuật toán di truyền (GA) là công cụ hiệu quả để giải quyết bài toán tối ưu hóa GA mô phỏng quá trình tiến hóa tự nhiên thông qua các bước như chọn lọc, lai ghép và đột biến.
Trong bài viết này, chúng tôi sử dụng thuật toán di truyền để xác định số lượng nút trong lớp ẩn, từ đó cải thiện chất lượng hoạt động của mạng nơ ron.
Một số thông số chính của GA nhƣ sau:
Biến: Số nút lớp ẩn ( 00)
Mục tiêu là sai số khi kiểm tra với tập mẫu là nhỏ nhất
Kích thước quần thể là n = 20
Kích thước nhị phân biến : = 15
Tỉ lệ lai ghép (CR) là 0,5
Tỉ lệ đột biến (MR) là 0,02
Kích thước biến x được xác định theo công thức sau:
Với 00, số chữ thập phân mong muốn là 2
Trong các bước thực hiện thuật toán GA có bước giải mã nhiễm sắc thể (NST) đƣợc thực hiện theo công thức:
Trong đó, : Chuỗi mã hóa nhị phân của ; : Giá trị thập phân Với trường hợp này , 00,
NST là một chuỗi nhị phân của biến với số bit là 15bit (= )
Thuật toán GA được áp dụng trong trường hợp này theo sơ đồ sau:
Chọn ngẫu nhiên giá trị cho n biến x
Mã hóa biến x sang NST nhị phân
Giải mã cho từng NST Đánh giá chất lƣợng NST thông qua hàm mục tiêu
Sắp xếp và tạo quần thể mới
Kiểm tra điều kiện dừng
Chọn các cặp NST Lai ghép Đột biến
Hình 4-4: Sơ đồ thuật toán GA
Trong quá trình đánh giá chất lượng NST, các NST được giải mã sẽ được đưa vào cấu hình mạng nơ ron để thực hiện kiểm tra và đánh giá độ chính xác trên toàn bộ tập mẫu.
Trong quá trình sắp xếp và tạo quần thể mới, các nhiễm sắc thể (NST) được tổ chức lại theo thứ tự giảm dần về độ chính xác, giúp tối ưu hóa việc chọn lọc lai ghép và đột biến.
Bước lai ghép, số lượng NST được chọn để lai ghép phụ thuộc vào hệ số tỉ lệ lai ghép CR (Crossover rate) Số NST đƣợc chọn = CR*n
Trong quần thể, các NST được phân chia thành hai nhóm: nhóm NST tốt và nhóm NST xấu Những cặp NST tốt sẽ được lai ghép với nhau nhằm tạo ra thế hệ con, thay thế cho các NST xấu.
Cách thức lai ghép đƣợc thực hiện nhƣ sau:
Vị trí lai ghép đƣợc chọn một cách ngẫu nhiên
Đột biến là bước quan trọng trong quá trình tiến hóa của quần thể, được thực hiện bằng cách chọn vị trí ngẫu nhiên trên nhiễm sắc thể (NST) và đảo bit (từ 0 sang 1 hoặc ngược lại) Số lượng NST được chọn dựa trên hệ số tỷ lệ đột biến MR (Mutation rate), nhằm tối ưu hóa quần thể Đối với mạng nơ ron 4 lớp, quá trình đột biến được áp dụng cho cả hai lớp ẩn đầu tiên và thứ hai, giúp cải thiện khả năng học tập của mô hình.
Huấn luyện mạng noron
Hình 4-5: Cấu hình mạng nơ ron 3 lớp đƣợc sử dụng
Nhóm nghiên cứu sẽ bắt đầu bằng việc thử nghiệm với mạng nơ ron hồi tiếp MLP 3 lớp, sau đó tiếp tục với mạng nơ ron 4 lớp.
Số nút ngõ vào là 768 (tương ứng với 256 giá trị histogram của màu đỏ, 256 màu xanh lá, 256 màu xanh dương)
Số nút lớp ẩn thay đổi theo từng tập mẫu khác nhau
Số nút ngõ ra là 1 (tương ứng với 2 trường hợp là nứt hoặc không nứt)
Hàm kích hoạt: Hàm sigmoid
Dựa vào bảng so sánh sai lệch histogram trong phần 3, nhóm nghiên cứu nhận thấy rằng sai lệch histogram giữa ảnh rọi của trứng cút có vết nứt và không vết nứt trong trường hợp ảnh màu đỏ là rất ít so với ảnh màu xanh lá và xanh dương Do đó, nhóm nghiên cứu quyết định tiến hành thử nghiệm với số nút ngõ vào mạng nơ ron.
Chúng tôi đã sử dụng 512 giá trị histogram, bao gồm 256 giá trị cho màu xanh lá và 256 cho màu xanh dương, để so sánh độ chính xác và thời gian thực hiện của phương pháp Phân tích tương tự cũng được áp dụng cho các mạng nơ ron với 3 lớp và 4 lớp.
Phương pháp huấn luyện mạng sử dụng thuật toán lan truyền ngược (backpropagation) là một kỹ thuật học có giám sát, trong đó mỗi dữ liệu đầu vào được gán một giá trị đầu ra mong muốn Cụ thể, đối với trường hợp trứng còn nguyên, giá trị đầu ra tương ứng là 1, trong khi trứng có vết nứt sẽ có giá trị đầu ra là -1.
Sau khi hoàn tất quá trình huấn luyện, bộ giá trị trọng số của mạng nơ ron được lưu trữ dưới dạng file txt Khi cần sử dụng lại, chỉ cần nạp bộ trọng số này mà không cần thực hiện lại bước huấn luyện.