1. Trang chủ
  2. » Luận Văn - Báo Cáo

ỨNG DỤNG CÔNG NGHỆ học sâu để PHÂN LOẠI và KIỂM TRA CHẤT LƯỢNG THUỐC CHỮA BỆNH

123 186 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 123
Dung lượng 5,18 MB

Cấu trúc

  • Chương 2

  • Chương 3

  • Chương 4

  • Chương 5

  • LƯỢNG SẢN PHẨM ỨNG DỤNG XỬ LÝ ẢNH

    • 1.1. Giới thiệu chung về hệ thống phân loại sản phẩm

    • 1.2. Ý nghĩa và ứng dụng của hệ thống

    • 2.1. Yêu cầu thiết kế

    • 2.2. Mô hình đề xuất

    • 2.3. Lựa chọn, tính toán thiết kế các bộ phận của hệ thống cơ khí

    • Kết luận chương 2

    • 3.1. Các thành phần cơ bản của hệ thống điều khiển

    • 3.2. Thiết kế trên TIA Portal V14

    • Kết luận chương 3

    • 4.1. Tổng quan về công nghệ xử lý ảnh

    • 4.2. Học máy, Học sâu

    • 4.3. Mạng Nơ-ron tích chập

    • 4.4. Ứng dụng Convolutional Neural Network để giải quyết bài toán

    • Kết luận chương 4

    • 5.1. Xây dựng mô hình thực nghiệm

    • 5.2. Kết quả thực nghiệm

  • KẾT LUẬN

  • TÀI LIỆU THAM KHẢO

  • PHỤ LỤC

Nội dung

Giới thiệu chung về hệ thống phân loại sản phẩm

Phân loại sản phẩm theo kích thước sử dụng cảm biến quang

Hệ thống hoạt động dựa trên nguyên lý sử dụng các cảm biến quang được xếp chồng theo chiều dọc Các cảm biến này giúp phân biệt chiều cao của sản phẩm, tương ứng với số lượng cảm biến đã được cài đặt.

Khi sản phẩm di chuyển qua băng chuyền, nếu chỉ kích hoạt cảm biến quang thứ nhất mà chưa kích hoạt cảm biến thứ hai, sản phẩm sẽ được phân loại là vật thấp Ngược lại, khi sản phẩm kích hoạt đồng thời cả hai cảm biến, nó sẽ được phân loại là vật cao.

Càng nhiều cảm biến quan được đặt thì hệ thống phân biệt được càng nhiều mức cao thấp.

Cảm biến quang nhiều mức mang lại nhiều ưu điểm, bao gồm khả năng hoạt động với tốc độ cao, dễ dàng trong việc vận hành và bảo trì, cùng với chi phí đầu tư tương đối thấp.

Nhược điểm: do sử dụng mức không liên tục nên hệ thống này không thể dùng để đo đạc chiều cao chính xác của sản phẩm.

Phân loại sản phẩm theo màu sắc sử dụng cảm biến màu sắc

Nguyên lý hoạt động của sản phẩm trên băng chuyền dựa vào cảm biến nhận diện thông qua khuyếch tán ánh sáng Khi sản phẩm di chuyển qua cảm biến, ánh sáng trắng chiếu lên bề mặt sản phẩm, và cảm biến sẽ thu nhận ánh sáng khuyếch tán để tiến hành phân loại sản phẩm.

Có nhiều loại cảm biến màu sắc khác nhau, được lựa chọn dựa trên độ phức tạp của sản phẩm cần phân loại Hình 1.2 minh họa ba loại cảm biến: cảm biến màu sắc đơn giản, cảm biến màu sắc công nghiệp và cảm biến thông minh.

Hệ thống nhận biết màu sắc phụ thuộc vào ánh sáng môi trường, do đó việc cách ly ánh sáng bên ngoài là cần thiết để giảm thiểu sai số trong quá trình phân loại sản phẩm.

Phân loại sản phẩm bằng xử lý ảnh

Hệ thống camera thu nhận hình ảnh sản phẩm và xử lý chúng theo yêu cầu của nhà sản xuất, bao gồm kiểm tra kích thước, màu sắc và vết nứt Với tính linh hoạt cao, hệ thống phân loại sản phẩm này có thể áp dụng cho nhiều lĩnh vực công nghiệp Tuy nhiên, nó cũng có độ phức tạp và chi phí đầu tư tương đối cao.

Hệ thống phân loại sản phẩm dựa trên ứng dụng của việc xử lý ảnh Hệ thống bao gồm ba phần chính :

Bộ phận thu thập thông tin ảnh bao gồm hệ thống camera và đèn chiếu sáng chuyên dụng, được lắp đặt trong buồng chắn sáng trên giá đỡ Buồng chắn sáng có chức năng ngăn chặn ánh sáng tự nhiên từ bên ngoài, chỉ giữ lại ánh sáng do hệ thống chiếu sáng cung cấp, đảm bảo điều kiện ánh sáng ổn định cho quá trình xử lý và ra quyết định.

Khi sản phẩm đi qua buồng chắn sáng, camera sẽ chụp ảnh bề mặt sản phẩm và gửi thông tin về phần mềm nhận dạng và phân loại Phần mềm này sẽ đối chiếu với dữ liệu ảnh đã được nạp sẵn để xác định loại sản phẩm và đánh giá chất lượng của nó.

Bộ phận xử lý tín hiệu hồi đáp đóng vai trò quan trọng trong việc điều khiển và giao tiếp giữa người và máy, bao gồm các nút bấm trên màn hình và các phím điều khiển.

Hệ thống cơ khí bao gồm băng tải và các thiết bị phụ trợ để phân loại sản phẩm Khi sản phẩm được nhận diện, hệ thống sẽ nhận lệnh và thực hiện phản hồi tương ứng Các thiết bị phụ trợ sử dụng xi lanh để đẩy sản phẩm vào các khu vực đã được xác định trước.

Một số ưu điểm của ứng dụng xử lý ảnh trong việc phân loại sản phẩm so với một số ứng dụng khác có thể ra như sau:

+ Linh hoạt trong việc thay đổi mẫu mã sản phẩm phân loại;

+ Có khả năng phân loại được nhiều loại sản phẩm khác nhau;

+ Phân loại được những sản phẩm phức tạp mà các phương pháp thông thường không thể phân loại được.

Bên cạnh đó ứng dụng cũng có một số nhược điểm:

Hệ thống này có chi phí đầu tư cao, nhưng rất phù hợp cho dây chuyền sản xuất các sản phẩm phức tạp mà công nghệ thông thường không thể áp dụng Để vận hành hiệu quả, đội ngũ kỹ sư bảo trì cần có kiến thức cơ bản về xử lý ảnh.

TÍNH TOÁN THIẾT KẾ HỆ THỐNG CƠ KHÍ

Yêu cầu thiết kế

Các yêu cầu thiết kế hệ thống cơ khí cần đạt thỏa mãn các điều kiện sau:

 Kiểm tra, phân loại được hai loại thuốc có hình dáng, kích thước nhỏ khác nhau.

 Hệ thống cần đảm bảo độ cứng vững và rung động ít.

 Có khả năng phân loại, loại bỏ các sản phẩm lỗi.

 Có hệ thống chiếu sáng giảm tối đa các yếu tố nhiễu;

 Thiết kế thuận tiện cho tháo lắp, bố trí bộ điều khiển, các bộ phận khác.

 Có hệ thống cấp phôi tự động.

Hình 2 1 Sản phẩm tiến hành kiểm tra

Từ các yêu cầu cần đáp ứng ở trên nhóm tiến hành thảo luận, nghiên cứu và đề xuất mô hình cơ khí như phần dưới.

Mô hình đề xuất

Hiện nay, hệ thống cơ khí phân loại sản phẩm chủ yếu sử dụng hai cơ cấu chính: băng tải và đĩa quay để thực hiện kiểm tra Quá trình phân loại dựa trên kích thước và hình dáng của sản phẩm, thường gồm hai loại thuốc có kích thước nhỏ, khác nhau về hình thức.

Hình 2 2 Mô hình đề xuất

Mô hình đề xuất có cấu tạo gồm:

- Phần khung nhôm bằng nhôm định hình;

- Hệ thống cấp phôi tự động (phễu rung),…

Với mô hình đã đề xuất, nhóm tiến hành thiết kế, chọn lựa và tính toán các bộ phận chính của kết cấu ở phần tiếp theo dưới đây.

HỆ THỐNG ĐIỆN – ĐIỀU KHIỂN

Các thành phần cơ bản của hệ thống điều khiển

3.1.1 Cảm biến Đây chính là hệ thống thu nhận thông tin từ phôi cho bộ điều khiển Các loại cảm biến thường được sử dụng là cảm biến màu, cảm biến quang, cảm biến tiệm cận… Cảm biến thực hiện chức năng biến đổi các đại lượng không điện (các đại lượng vật lí, hóa học…) thành các đại lượng điện Ví dụ: áp suất, nhiệt độ, lưu lượng, vận tốc…thành tín hiệu điện (mV, mA…).

Hình 3 1 Cảm biến tiệm cận

Trên thị trường hiện có nhiều loại cảm biến, nhưng trong đồ án này, nhóm đã chọn sử dụng cảm biến tiệm cận để phân loại sản phẩm trên băng tải Hệ thống cấp phôi tự động sẽ đưa phôi vào băng chuyền, và cảm biến sẽ phát hiện sự xuất hiện của đối tượng, tính toán thời gian dừng lại tại vị trí có camera để tiến hành chụp và xử lý ảnh.

Nhóm đã quyết định chọn cảm biến Omron E3F – DS30B4 (PNP) sau khi khảo sát các sản phẩm cảm biến trên thị trường Đây là cảm biến khoảng cách hồng ngoại, có khả năng phát hiện vật cản thông qua tia hồng ngoại trong khoảng cách nhất định.

0 - 30 cm Cảm biến vật cản hồng ngoại dùng ánh sáng hồng ngoại để phát hiện vật cản với độ phản hồi nhanh, độ chính xác cao.

Hình 3 2 Cảm biến Omron E3F-DS30B4 (PNP)

Hình 3 3 Bộ phận cơ bản của hệ thống xử lý ảnh công nghiệp

Camera đóng vai trò quan trọng trong hệ thống phân loại nhờ xử lý ảnh, ảnh hưởng trực tiếp đến chất lượng hình ảnh thu được Chất lượng hình ảnh quyết định độ chính xác của quá trình huấn luyện mạng neural.

Một số thông số cơ bản của hệ thấu kính và Camera được thể hiện trong hình dưới đây:

Để lựa chọn một camera phù hợp với đề tài, nhóm đã nghiên cứu các loại camera trên thị trường và quyết định chọn camera Webcam C270 HD của Logitech vì các thông số cơ bản của lens và camera đáp ứng tốt nhu cầu sử dụng.

Hình 3 5 Logitech C270 HD Webcam Thông số kỹ thuật:

- Độ phân giải tối đa: 720p/30fps

- Loại tiêu cự: Lấy nét cố định

- Công nghệ thấu kính: tiêu chuẩn

- Micrô tích hợp: đơn âm

- Là loại camera lấy nét cố định, phải tháo ra để điều chỉnh lại tiêu cự cho phù hợp với khoảng cách đến đối tượng mong muốn.

 Cấu trúc phần cứng Siemens PLC S7-1200:

- 3 bộ điều khiển nhỏ gọn với sự phân loại trong các phiên bản khác nhau giống như điều khiển AC hoặc DC phạm vi rộng.

- 2 mạch tương tự và số mở rộng điều khiển mô-đun trực tiếp trên CPU làm giảm chi phí sản phẩm

- 13 module tín hiệu số và tương tự khác nhau.

- 2 module giao tiếp RS232/RS485 để giao tiếp thông qua kết nối PTP.

- Module nguồn PS 1207 ổn định, dòng điện áp 115/230 VAC và điện áp 24 VDC.

Hình 3 6 Thành phần của PLC S7-1200

Hình 3 7 Các tích hợp trên PLC S7-1200

 Các chuẩn giao tiếp: PROFINET, MODBUS, PROFIBUS, Point-to-Point

Communication, Universal Serial Interface (USS), Modbus RTU, Modbus TCP/IP, Telecontrol Communication.

- Giao tiếp các thiết bị lập trình;

- Các dòng PLC như S7-CPU;

- Các thiết bị có PROFINET I/O (như ET200 và SINAMICS);

- Và các thiết bị sử dụng chuẩn giao tiếp TCP/IP.

PHẦN MỀM XỬ LÝ ẢNH

Tổng quan về công nghệ xử lý ảnh

Xử lý ảnh là một lĩnh vực quan trọng trong kỹ thuật thị giác máy tính, đóng vai trò nền tảng cho nhiều nghiên cứu liên quan Hai nhiệm vụ chính của xử lý ảnh bao gồm nâng cao chất lượng thông tin hình ảnh và cung cấp dữ liệu cho các quá trình khác, trong đó có ứng dụng thị giác vào điều khiển.

Quá trình xử lý ảnh bắt đầu bằng việc thu nhận hình ảnh từ các thiết bị số hoặc tương tự và gửi đến máy tính Dữ liệu ảnh sẽ được lưu trữ ở định dạng phù hợp để dễ dàng xử lý Các lập trình viên sẽ áp dụng các thuật toán tương ứng lên dữ liệu ảnh nhằm điều chỉnh cấu trúc ảnh cho phù hợp với các ứng dụng khác nhau.

Quá trình xử lý nhận dạng ảnh là thao tác trên ảnh đầu vào để đạt được kết quả mong muốn Kết quả của quá trình này có thể là một bức ảnh đã được xử lý hoặc một kết luận cụ thể.

4.1.1 Điểm ảnh và dữ liệu Ảnh số xám có thể được biểu diễn như một hàm f(x,y) Nó có hai chiều: x và y, có nghĩa là mỗi điểm sẽ có một tọa độ (x, y) và có một cấp xám f tại điểm đó Ảnh màu được tạo thành từ các hình ảnh thành phần khác nhau Như chúng ta biết, từ màu đỏ, xanh lục, xanh lam có thể tạo nên tất cả các màu sắc chúng ta muốn Từ 3 lớp màu sẽ có thể biểu diễn được hình ảnh màu sắc đa dạng.

Hình 4 1 Biểu diễn ảnh xám dưới dạng số

Máy tính chỉ có khả năng tải và lưu trữ một mạng lưới các con số thay vì hình ảnh tự nhiên Sau khi lấy mẫu và lượng tử hóa, mỗi điểm (x, y) được ghi lại bằng một số nguyên, gọi là pixel Mỗi pixel bao gồm tọa độ không gian và độ sâu màu sắc, cho thấy cách giá trị dữ liệu kỹ thuật số được lưu trữ tại từng vị trí cụ thể.

4.1.2 Độ sâu màu sắc Độ sâu màu sắc là thước đo số lượng màu sắc có thể thể hiện mà một bức ảnh có thể dùng để hiển thị Độ sâu màu là số lượng bit (0 và 1) được dùng để định danh cho màu sắc của 1 điểm ảnh (pixel) Ví dụ, với ảnh đen trắng (monochrome), nếu sử dụng 4 bit thì bức ảnh sẽ có thể hiển thị 16 cấp độ sáng tối khác nhau trải từ màu đen tới màu trắng.

Đối với ảnh màu, độ sâu màu sắc được mô tả bằng n bit màu Ví dụ, với độ sâu màu 16 bit, có 5 bit cho màu đỏ, 6 bit cho màu lục và 5 bit cho màu lam, cho phép hiển thị tối đa 65,536 màu khác nhau Trong khi đó, ảnh RGB thực tế hỗ trợ 24 bit, với mỗi màu được biểu diễn bằng 8 bit cho màu đỏ, 8 bit cho màu lục và 8 bit cho màu lam, dẫn đến khả năng hiển thị hơn 1,6 triệu màu khác nhau.

Bức ảnh với độ sâu màu lớn có khả năng thể hiện dải màu rộng hơn, mang lại màu sắc phong phú hơn, nhưng đồng thời cũng dẫn đến dung lượng ảnh lớn hơn.

Học máy, Học sâu

Trong thời gian gần đây, trí tuệ nhân tạo (AI) đã trở thành một xu hướng công nghệ toàn cầu, xâm nhập vào nhiều lĩnh vực trong cuộc sống như dịch thuật tự động, nhận dạng giọng nói và điều khiển tự động Nhiều người tin rằng sự phát triển này đánh dấu cuộc cách mạng công nghiệp lần thứ 4.

Trong bối cảnh hiện nay, việc tìm hiểu về trí tuệ nhân tạo (AI) trở thành nhu cầu thiết yếu Báo cáo này được biên soạn nhằm cung cấp cái nhìn tổng quan về lĩnh vực AI.

Trí tuệ nhân tạo (AI) là các công nghệ cho phép máy tính thực hiện các nhiệm vụ mà trước đây chỉ có con người làm được Chẳng hạn, một chương trình chơi cờ vua tự động được coi là ứng dụng của AI, thể hiện khả năng của máy tính trong việc xử lý và ra quyết định.

Trong lĩnh vực trí tuệ nhân tạo, học máy (machine learning) là một nhánh nghiên cứu về khả năng tự học của máy tính mà không cần cài đặt các quy tắc quyết định Thay vì phải lập trình các quy tắc cụ thể như phân loại email là thư rác dựa trên từ khóa, học máy cho phép máy tính tự động phân loại mà không cần hướng dẫn trước Điều này giúp máy tính có khả năng cảm nhận và suy nghĩ tương tự như con người Nói một cách đơn giản, học máy là phương pháp vẽ các đường thể hiện mối quan hệ giữa các tập dữ liệu, chẳng hạn như phân loại dữ liệu hoặc thể hiện xu hướng giá nhà dựa trên diện tích.

Một nhánh nhỏ trong học máy gần đây rất được ưu chuộng là Học sâu (Deep

Học sâu là một kỹ thuật sử dụng mạng nơ-ron giống như nơ-ron trong não người để phát triển hệ thống học máy, kết hợp giữa toán học và khoa học thần kinh Kỹ thuật này đã tạo ra những kết quả to lớn, đánh dấu sự khởi đầu của một ngành công nghiệp mới Hiện nay, nhiều công ty lớn trong lĩnh vực công nghệ và các ngành khác như ô tô và điện tử đang tập trung vào việc phát triển và ứng dụng học sâu Một ví dụ nổi bật là AlphaGo của Google, đã đánh bại nhà vô địch cờ vây Lee Sedol vào tháng 3 năm 2016, cùng với tính năng nhận diện khuôn mặt chính xác của Facebook.

2016 Trợ lý ảo Siri của Apple được giới thiệu từ năm 2006 Xe tự lái của Google được thử nghiệm chính thức trên đường phố vào năm 2015,…

4.2.2 Mạng nơ-ron nhân tạo

Mạng nơ-ron nhân tạo (Neural Network - NN) là một mô hình lập trình độc đáo, được phát triển dựa trên cấu trúc của mạng nơ-ron thần kinh Mô hình này kết hợp với các kỹ thuật học sâu (Deep Learning) để xử lý và phân tích dữ liệu một cách hiệu quả, mở ra nhiều ứng dụng trong lĩnh vực trí tuệ nhân tạo.

Học sâu (Deep Learning - DL) và mạng nơ-ron (NN) đang trở thành những công cụ mạnh mẽ, mang lại hiệu quả cao trong nhiều bài toán phức tạp như nhận diện hình ảnh, giọng nói và xử lý ngôn ngữ tự nhiên.

Một mạng nơ-ron được cấu thành bởi các nơ-ron đơn lẻ được gọi là các

Perceptron là một mô hình cơ bản trong mạng nơ-ron nhân tạo, được phát triển dựa trên nguyên lý hoạt động của nơ-ron sinh học Để hiểu rõ hơn về perceptron, chúng ta cần khám phá cấu trúc và chức năng của nó trước khi đi sâu vào các mô hình mạng nơ-ron phức tạp hơn.

Hình 4 4 Nơ-ron sinh học

 Kiến trúc mạng Neural Networks:

Mạng Neural Network là sự kết hợp của của các tầng perceptron hay còn được gọi là perceptron đa tầng (multilayer perceptron) như hình vẽ bên dưới:

Một mạng Neural Network sẽ có 3 kiểu tầng:

 Tầng vào (input layer): Là tầng bên trái cùng của mạng thể hiện cho các đầu vào của mạng.

 Tầng ra (output layer): Là tầng bên phải cùng của mạng thể hiện cho các đầu ra của mạng.

 Tầng ẩn (hidden layer): Là tầng nằm giữa tầng vào và tầng ra thể hiện cho việc suy luận logic của mạng.

Lưu ý rằng, một NN chỉ có 1 tầng vào và 1 tầng ra nhưng có thể có nhiều tầng ẩn:

Hình 4 6 Neural Network – 2 hidden layer

Trong mạng nơ-ron, mỗi nút mạng hoạt động như một nơ-ron sigmoid với hàm kích hoạt có thể khác nhau, nhưng thường được chuẩn hóa để thuận tiện trong tính toán Số lượng nơ-ron ở mỗi tầng có thể thay đổi tùy thuộc vào bài toán cụ thể, nhưng thường các tầng ẩn sẽ có số nơ-ron bằng nhau Các nơ-ron giữa các tầng thường được liên kết đầy đủ, tạo thành mạng kết nối hoàn chỉnh, cho phép tính toán kích thước của mạng dựa trên số tầng và số nơ-ron.

 Học với mạng Neural Networks:

Quá trình học trong các bài toán học máy tương tự như việc tìm kiếm một hàm lỗi để đánh giá và tối ưu hóa hàm lỗi đó nhằm đạt được kết quả tốt nhất Mỗi nút mạng của mạng nơ-ron (NN) có thể được xem như một bộ phân loại (hồi quy logistic) với hàm lỗi riêng.

Trong đó, m là số lượng dữ liệu huấn luyện; y (i) là đầu ra thực tế của dữ liệu thứ i trong tập huấn luyện; 

(i) là kết quả ước lượng được ứng với dữ liệu thứ i.

Hàm lỗi của mạng nơ-ron (NN) tương tự như các hàm lỗi khác, nhưng với đặc điểm là đầu ra có thể có nhiều nút Khi tính toán đầu ra, cần xem xét từng nút một Giả sử có K nút ra, với y_k là đầu ra thực tế của nút thứ k và σ_k là đầu ra ước lượng cho nút đó Do đó, công thức tính hàm lỗi sẽ được điều chỉnh để phản ánh các giá trị này.

Các tham số trong mạng nơ-ron không chỉ đơn thuần là một ma trận mà là một tập hợp của tất cả các ma trận tham số của các tầng mạng, được biểu diễn dưới dạng tập hợp 𝕎 Để tối ưu hàm lỗi, chúng ta vẫn áp dụng các phương pháp đạo hàm, nhưng việc tính đạo hàm trở nên phức tạp hơn so với hồi quy logistic, vì để ước lượng đầu ra, cần trải qua quá trình lan truyền tiến Điều này có nghĩa là để tính toán giá trị  k, cần thực hiện một loạt các phép tính liên hợp.

4.2.3 Thuật toán tối ưu hàm mất mát (Loss Function Optimization Algorithms)

Mặc dù công thức chuẩn có thể được sử dụng để tìm tham số, nhưng khi đối mặt với tập dữ liệu lớn và đa chiều, việc áp dụng trên máy tính thường gặp khó khăn do hạn chế về bộ nhớ và khả năng tính toán Hơn nữa, trong nhiều bài toán, việc giải đạo hàm để tìm công thức chuẩn là rất phức tạp Do đó, trong thực tế, thuật toán Gradient Descent thường được lựa chọn làm giải pháp thay thế hiệu quả.

Trong lĩnh vực Machine Learning và Toán tối ưu, việc xác định giá trị nhỏ nhất hoặc lớn nhất của một hàm số là rất quan trọng, đặc biệt là trong các hàm mất mát như trong Linear Regression và K-means Clustering Tuy nhiên, việc tìm kiếm cực tiểu toàn cục (global minimum) cho các hàm mất mát trong Machine Learning thường rất phức tạp và đôi khi không thể thực hiện được Do đó, các nhà nghiên cứu thường tập trung vào việc tìm kiếm các điểm cực tiểu địa phương (local minimum) và coi chúng là nghiệm gần đúng cho bài toán cần giải quyết.

Gradient Descent là một thuật toán tối ưu hóa quan trọng trong học máy, giúp tìm giá trị tối ưu của một hàm Để minh họa, chúng ta sẽ xem xét hàm một biến f(x) = 1 Ý tưởng chính của Gradient Descent là điều chỉnh các tham số theo hướng giảm dần độ dốc của hàm, từ đó tiến gần hơn đến giá trị tối ưu Việc hiểu rõ nguyên lý hoạt động của thuật toán này sẽ giúp ứng dụng hiệu quả trong nhiều bài toán khác nhau.

Mạng Nơ-ron tích chập

Hình 4 8 Mô hình của mạng nơ-ron tích chập

Thuật toán học sâu đã mở ra một kỷ nguyên công nghệ mới, đặc biệt thông qua việc ứng dụng các Mạng Nơ-ron Tích chập (Convolutional Neural Networks) Những mạng nơ-ron này cho phép xử lý và phân tích dữ liệu hình ảnh một cách hiệu quả, từ đó nâng cao khả năng nhận diện và phân loại Sự phát triển này không chỉ cải thiện các ứng dụng trong lĩnh vực trí tuệ nhân tạo mà còn tạo ra nhiều cơ hội mới trong các ngành công nghiệp khác nhau.

Mạng nơ-ron tích chập (CNNs hay ConvNets) là nền tảng quan trọng trong lĩnh vực học sâu Chúng có khả năng phân loại hình ảnh với độ chính xác vượt trội so với con người trong nhiều tình huống.

Mạng nơ-ron tích chập (Convolutional Neural Networks - CNN) tương tự như mạng nơ-ron thông thường, với cấu trúc gồm nhiều nơ-ron nhằm học các tham số như trọng số (weights) và độ lệch (biases) Mạng này nhận đầu vào là các bức ảnh dưới dạng pixel và cho ra đầu ra là các lớp phân loại cần thiết.

Quá trình mạng nhận diện ảnh (Inference) bắt đầu bằng việc chuyển đổi ảnh thành ma trận các pixel Khi ma trận này đi qua các lớp ẩn, các đặc trưng của ảnh sẽ được trích xuất và biến đổi phi tuyến, tạo ra một ma trận nhỏ hơn nhưng chứa nhiều đặc trưng hơn Cuối cùng, ma trận được biến đổi sẽ được đưa qua lớp nơ-ron cuối cùng, nơi mỗi nơ-ron đại diện cho xác suất của ảnh đầu vào.

 Tại sao lại cần dùng Convolutional Neural Network?

Mạng kết nối đầy đủ (Fully Connected Network) có nhược điểm lớn là dễ bị overfit do số lượng tham số cần học quá lớn so với kích thước dữ liệu nhỏ Hơn nữa, mạng này không thể phân loại chính xác cùng một đối tượng khi chúng xuất hiện ở các vị trí khác nhau trong ảnh.

Mạng Convolutional Neural Networks (CNN) có nhiều ưu điểm nổi bật, trong đó lượng tham số cần học ít hơn đáng kể so với mạng kết nối đầy đủ nhờ vào các lớp tích chập (CONV) và lớp Pooling, giúp trích xuất đặc trưng của ảnh và làm giảm kích thước ma trận ảnh qua từng lớp Bên cạnh đó, mạng CNN còn có khả năng kháng dịch chuyển, cho phép nhận diện chính xác các đối tượng ở nhiều vị trí khác nhau trong ảnh bằng cách loại bỏ những dữ liệu thừa có thể ảnh hưởng đến vị trí của chúng.

Vector và ma trận trượt được sử dụng để trích xuất dữ liệu đặc trưng từ ma trận khác, đồng thời loại bỏ các dữ liệu không cần thiết Các bộ lọc này thường được gọi bằng nhiều tên khác nhau như Kernel, Filter, Window Mask và Filter Mask.

Hình 4 9 Minh họa bộ lọc kích thước 4x4

 Lớp tích chập (Conv Layer):

Mục tiêu của các lớp tích chập là trích chọn các đặc trưng của ảnh đầu vào.

Trong ví dụ về lớp Conv, ảnh đầu vào được xử lý qua bộ lọc có kích thước 3x3 hoặc 5x5 Bộ lọc này thực hiện phép tích vô hướng để tạo ra một giá trị duy nhất cho mỗi vùng ảnh Kết quả của quá trình này là một tập hợp các giá trị ảnh, được gọi là mạng đặc trưng (features map).

Layer ReLU áp dụng hàm kích hoạt max(0,x) cho đầu ra của lớp Conv, giúp loại bỏ các giá trị âm bằng cách đưa chúng về 0 Layer này không làm thay đổi kích thước của ảnh và không bổ sung thêm tham số nào.

Lớp ReLu có mục đích thiết lập một ngưỡng, cụ thể là 0, nhằm loại bỏ các giá trị âm không cần thiết Việc này giúp tránh ảnh hưởng tiêu cực đến quá trình tính toán ở các lớp tiếp theo trong mạng nơ-ron.

Tầng pooling, hay còn gọi là subsampling hoặc downsample, là thành phần quan trọng trong cấu trúc Convolutional Neural Networks (CNN) Về mặt toán học, pooling là quá trình tính toán trên ma trận nhằm giảm kích thước mà vẫn giữ lại các đặc trưng quan trọng Trong CNN, toán tử pooling được áp dụng độc lập cho từng kênh màu của ma trận ảnh đầu vào Một dạng pooling phổ biến là Max-Pooling, sử dụng filter để trả về giá trị lớn nhất trong vùng mà filter đang trượt qua.

Hình 4 11 Max-pooling o Average-Pooling: Là một dạng filter trả về giá trị trung bình của các phần tử trong ma trận mà filter đang trượt qua.

Fully-connected là phương pháp kết nối toàn bộ các nơ-ron giữa hai lớp trong mạng nơ-ron, trong đó mỗi nơ-ron ở lớp sau đều liên kết với tất cả các nơ-ron ở lớp trước Phương pháp này thường được áp dụng sau các lớp khác trong kiến trúc mạng.

In Convolutional Neural Networks (CNNs), the Conv and Pooling layers are followed by two fully connected layers The first layer consolidates the identified feature layers, transforming the data from 3D or 2D into a 1D vector The second layer serves as the output layer, with the number of neurons determined by the desired output This structure is commonly found in Artificial Neural Networks (ANNs) and is typically utilized in the final stages of the network architecture.

Hình 4 13 Cấu trúc của Convolutional Neural Networks

XÂY DỰNG MÔ HÌNH HỆ THỐNG VÀ THỰC NGHIỆM

Xây dựng mô hình thực nghiệm

Sau khi tính toán và lựa chọn, nhóm đã điều chỉnh mô hình thực nghiệm dựa trên thời gian thực hiện đồ án và tình hình kinh tế Toàn bộ chi tiết và hệ thống điện được lắp đặt trực tiếp trên tấm đế bằng gỗ, trong khi hệ thống khí nén được tách rời để giảm rung động ảnh hưởng đến hoạt động Việc sử dụng thiết bị thủy khí làm tăng chi phí linh kiện, vì vậy nhóm đã nhờ sự hỗ trợ từ phòng Lab T-204 để sử dụng bình khí nén.

Các cổng kết đầu vào bao gồm dây nguồn kết nối với nguồn AC 220V, sau đó được chuyển đổi thành nguồn 24V DC qua bộ nguồn tổ ong để phù hợp với điện áp của linh kiện Động cơ băng tải sử dụng nguồn 12V DC, được cấp riêng và điều chỉnh tốc độ qua mạch điều khiển động cơ với triết áp núm xoay Camera kết nối với PC qua cổng USB, trong khi PLC kết nối tới PC qua cổng Ethernet và kết nối với các rơle theo sơ đồ điện đi kèm trong báo cáo đồ án.

Hình 5 1 Mô hình thực nghiệm

Sau khi kết nối các cổng vào ra và cấp nguồn cho hệ thống, nhóm đã chuẩn bị phôi và nạp code cho PLC để thực hiện thử nghiệm Nguyên lý hoạt động của hệ thống bắt đầu với bước đầu tiên, trong đó cơ cấu cấp phôi, thay thế cho thiết kế phễu rung, sẽ được xi lanh đẩy vào vị trí giữa và gần điểm giữa của băng tải.

Các viên nén sẽ được di chuyển trên băng tải nhờ động cơ DC tại đầu băng tải Khi chúng đi qua cảm biến tiệm cận, viên nén sẽ được đưa đến vị trí camera và dừng lại.

Bước 3 trong quy trình chụp ảnh và xử lý là camera thực hiện việc chụp ảnh và phân tích hình ảnh, từ đó đưa ra dự đoán và phân loại tín hiệu Các tín hiệu này sẽ được gửi ngược xuống PLC để xác định xi lanh nào sẽ hoạt động nhằm đẩy sản phẩm ra khỏi băng tải.

Hình 5 4 Đẩy sản phẩm ra khỏi băng tải

Ngày đăng: 18/03/2022, 11:47

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. PGS. TS. Trần Văn Địch, PGS. TS. Trần Xuân Việt, TS. Nguyễn Trọng Doanh, ThS. Lưu Văn Nhang, “Tự động hóa quá trình sản xuất”, Nhà xuất bản Khoa học và Kỹ thuật Hà Nội, 2001 Sách, tạp chí
Tiêu đề: Tự động hóa quá trình sản xuất
Nhà XB: Nhà xuất bản Khoa học vàKỹ thuật Hà Nội
[2]. Hồ Viết Bình, “Tự Động Hóa Quá Trình Sản Xuất”, Nhà xuất bản Khoa học và Kỹ thuật, 2009 Sách, tạp chí
Tiêu đề: Tự Động Hóa Quá Trình Sản Xuất
Nhà XB: Nhà xuất bản Khoa học vàKỹ thuật
[3]. Võ Anh Huy, “Cơ sở lý thuyết tính toán máng rung”, Bài giảng môn tự động hóa trường Đại học Bách Khoa TP.HCM Sách, tạp chí
Tiêu đề: Cơ sở lý thuyết tính toán máng rung
[4]. Phan Công Bình, “Nghiên cứu sự ảnh hưởng của các thông số kỹ thuật trong thiết bị cấp rung đến năng suất”, Luận văn thạc sĩ chuyên ngành công nghệ chế tạo máy, trường Đại học Bách Khoa TP.HCM, 2009 Sách, tạp chí
Tiêu đề: Nghiên cứu sự ảnh hưởng của các thông số kỹ thuật trongthiết bị cấp rung đến năng suất
[5]. Bùi Tiến Hoàng, Nguyễn Đình Mạnh, “Hệ thống phân loại và kiểm tra chất lượng đai ốc ứng dụng trí tuệ nhân tạo trong xử lý ảnh”, Đồ án tốt nghiệp chuyên ngành Cơ điện tử, trường Đại học Bách Khoa Hà Nội, 2018 Sách, tạp chí
Tiêu đề: Hệ thống phân loại và kiểm tra chấtlượng đai ốc ứng dụng trí tuệ nhân tạo trong xử lý ảnh
[7]. Công ty TNHH Kỹ thuật Ftech Việt Nam, http://kythuatthuykhi.com/xy-lanh-cdj2b16-50-b, truy cập lần cuối 1/2019 Link
[8]. Github darkflow library, https://github.com/thtrieu/darkflow, truy cập lần cuối 11/2018 Link
[9]. Ngoc Nguyen Ba, learn-machine-learning-in-two-months, https://github.com/bangoc123/learn-machine-learning-in-two-months, truy cập lần cuối 1/2019 Link
[10]. Do Minh Hai, [NN] Mạng nơ-ron nhân tạo - Neural Networks, https://dominhhai.github.io/vi/2018/04/nn-intro, truy cập lần cuối 1/2019 Link
[11]. Puzzledqs, BBox-Label-Tool, https://github.com/puzzledqs/BBox-Label-Tool,truy cập lần cuối 1/2019 Link
[12]. Markjay4k, YOLO-series, https://github.com/markjay4k/YOLO-series, truy cập lần cuối 1/2019 Link
[13]. Joseph Redmon, Ali Farhadi, YOLOv3: An Incremental Improvement, https://pjreddie.com/media/files/papers/YOLOv3.pdf, truy cập lần cuối 1/2019 Link
[14]. Joseph Redmon, How computers learn to recognize objects instantly, https://www.youtube.com/watch?v=Cgxsv1riJhI, truy cập lần cuối 1/2019 Link
[15]. Mark Jay, Image Detection with YOLO-v2, https://www.youtube.com/watch?v=PyjBd7IDYZs, truy cập lần cuối 1/2019 Link
[16]. Arden Dertat, Applied Deep Learning - Part 4: Convolutional Neural Networks, https://towardsdatascience.com/applied-deep-learning-part-4-convolutional-neural- networks-584bc134c1e2, truy cập lần cuối 1/2019 Link
[17]. Adam Geitgey, Machine Learning is Fun! Part 3: Deep Learning and Convolutional Neural Networks, https://medium.com/@ageitgey/machine-learning-is-fun-part-3-deep-learning-and-convolutional-neural-networks-f40359318721, truy cập lần cuối 1/2019 Link
[18]. Tales Lima Fonseca, What’s happening inside the Convolutional Neural Network? The answer is Convolution, https://buzzrobot.com/whats-happening-inside-the-convolutional-neural-network-the-answer-is-convolution-2c22075dc68d,truy cập lần cuối 1/2019 Link
[19]. Karpathy, CS231n Convolutional Neural Networks for Visual Recognition, http://cs231n.github.io, truy cập lần cuối 1/2019 Link
[6]. Elham Pishyar, Mehran Emadi, Investigation of Different Algorithms for Surface Defects of Steel Sheet for Quality, IJCA, 2016 Khác

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w