GIỚI THIỆU HỆ THỐNG GIÁM SÁT MẠNG
Giám sát mạng
a Các khái niệm cơ bản
Giám sát mạng là quá trình theo dõi và ghi nhận các luồng dữ liệu trong mạng, nhằm phân tích và xử lý khi có sự cố xảy ra.
Hệ thống giám sát mạng (Network Monitoring) là công cụ quan trọng để theo dõi sự cố, hiệu năng và tình trạng của các thiết bị cũng như máy tính trong mạng.
Hệ thống bao gồm phần mềm ghi nhận thông tin, giúp người quản trị theo dõi và quản lý dữ liệu hiệu quả Phần mềm này có khả năng gửi thông báo và cảnh báo qua SMS, email và các dịch vụ nhắn tin trực tuyến khi có nguy cơ xảy ra sự cố.
Phần mềm giám sát hệ thống mạng phổ biến hiện nay.
- Nagios, Cati, OpenNMS, Icinga, Netdata, …
- Các công cụ trả phí khác như: Paessler PRTG, NetCrunch, Site24x7, Atera, …. b Chức năng
- Cảnh báo qua Web, Email và SMS khi phát hiện tấn công vào hệ thống mạng.
- Báo động bằng âm thanh và SMS khi một host (Server, Router, Switch…) hoặc một dịch vụ mạng ngưng hoạt động.
Giám sát lưu lượng mạng qua các cổng giao tiếp trên Router, Switch và Server giúp hiển thị dữ liệu qua các đồ thị trực quan và thời gian thực Việc giám sát lưu lượng giữa các thiết bị kết nối với nhau một cách trực quan là rất quan trọng Để đạt hiệu quả cao trong việc giám sát hệ thống mạng, cần xác định các yếu tố cốt lõi của giám sát mạng.
- Các đơn vị, hệ thống, thiết bị, dịch vụ cần giám sát.
- Các trang thiết bị, giải pháp, phần mềm thương mại phục vụ giám sát.
- Xác định các phần mềm nội bộ và phần mềm mã nguồn mở phục vụ giám sát.
- Xác định các thiết bị, công cụ, giải pháp hỗ trợ phân tích kết quả giám sát: công cụ NMAP, TCPDUMP, Wireshark, Nessus
Yếu tố con người và quy trình phục vụ giám sát đóng vai trò vô cùng quan trọng bên cạnh các trang thiết bị và công cụ hỗ trợ Để đảm bảo hiệu quả giám sát, cần chú trọng đến các thành phần và thiết bị cần được theo dõi một cách chặt chẽ.
Giám sát mạng là quá trình theo dõi các thiết bị trong hệ thống như server, switch, router, firewall, tổng đài, điện thoại VoIP và máy in để đảm bảo hiệu suất và an ninh Việc giám sát này giúp phát hiện sớm các vấn đề, tối ưu hóa hoạt động của mạng và bảo vệ dữ liệu khỏi các mối đe dọa.
Hiện nay, việc tích hợp công nghệ vào doanh nghiệp đã trở thành xu hướng phổ biến Đảm bảo rằng các thiết bị, mạng và hệ thống hoạt động trơn tru là yếu tố then chốt giúp doanh nghiệp vận hành hiệu quả.
Mặc dù công nghệ là yếu tố quan trọng trong hoạt động của công ty, nhưng không phải lúc nào nó cũng hoạt động an toàn và hiệu quả Các lỗi có thể gây ra sự cố nghiêm trọng bất cứ lúc nào, vì vậy việc kiểm soát hoạt động của cơ sở hạ tầng máy tính là rất cần thiết Để ngăn chặn và xử lý các sự cố khi xảy ra lỗi, việc sử dụng hệ thống giám sát là điều quan trọng Hệ thống giám sát sẽ theo dõi và kiểm soát toàn bộ công nghệ mà công ty sử dụng, bao gồm phần cứng, mạng, thông tin liên lạc, hệ điều hành và ứng dụng Nó cũng có khả năng phân tích hiệu suất và hoạt động của công nghệ, đồng thời phát hiện và cảnh báo về các lỗi tiềm ẩn.
Một hệ thống giám sát tốt giúp tăng năng suất Điều này được thể hiện thông qua một số khía cạnh sau đây:
- Cải thiện việc sử dụng phần cứng thông qua việc kiểm soát hoạt động
Nếu một máy tính gặp sự cố, hệ thống giám sát sẽ phát hiện vấn đề, thông báo cho người dùng và đưa ra quyết định sửa chữa hoặc thay thế thiết bị.
- Ngăn ngừa sự cố và khi những sự cố này xảy ra, chúng được phát hiện nhanh hơn, giúp tiết kiệm thời gian và tiền bạc.
- Bạn không cần dành quá nhiều thời gian để quản lý bởi vì đã có hệ thống giám sát chịu trách nhiệm theo dõi hệ thống
Giám sát là một hoạt động rất rộng và phức tạp, tuy nhiên, hệ thống giám sát thường có một số tính năng phổ biến như sau:
- Phân tích trong thời gian thực: một hệ thống tốt sẽ cung cấp việc giám sát liên tục, không có độ trễ, hoặc độ trễ tối thiểu.
Hệ thống cảnh báo tự động gửi thông báo đến người nhận khi xảy ra sự cố cụ thể, với khả năng cấu hình các điều kiện kích hoạt, chẳng hạn như khi đĩa cứng đạt dung lượng tối đa.
- Thông báo bằng nhiều cách khác nhau (email, SMS, ) đến đúng người.
Để hỗ trợ việc phân tích dữ liệu hiệu quả, công cụ giám sát sẽ tạo ra các biểu đồ trực quan hóa đồ họa, giúp người dùng dễ dàng hiểu và tương tác với thông tin.
- Sản xuất báo cáo: hệ thống giám sát cho phép bạn tạo báo cáo, các dữ liệu phục vụ cho hoạt động của doanh nghiệp.
Việc có sẵn bản ghi các giám sát trước đây sẽ giúp doanh nghiệp so sánh hiệu quả hoạt động của hệ thống một cách dễ dàng Điều này hỗ trợ doanh nghiệp trong việc đưa ra quyết định chính xác hơn.
- Khả năng cài đặt các plug-in: Cài đặt thêm các plug-in nhằm đáp ứng tối đa các nhu cầu của doanh nghiệp.
- Phân biệt theo loại người dùng: dữ liệu được truy cập bởi mỗi người dùng sẽ khác nhau tùy thuộc vào các quyền có sẵn. f Lợi ích
-Dự đoán và ngăn chặn sự cố từ mạng
-Giảm thời gian sửa chữa khi gặp sự cố mạng
-Phát hiện các mối đe dọa bảo mật
-Quản lý các vấn đề kỹ thuật một cách dễ dàng g Tầm quan trọng của giám sát mạng
Giám sát mạng là một yếu tố thiết yếu trong hoạt động của doanh nghiệp, không chỉ đảm bảo an toàn và bảo mật dữ liệu mà còn giúp tiết kiệm chi phí sửa chữa và giảm thiểu thời gian chết của hệ thống khi gặp sự cố Việc này đảm bảo tính thông suốt trong toàn bộ hệ thống, từ đó nâng cao hiệu quả làm việc Những tiêu chí dưới đây sẽ làm rõ tầm quan trọng của giám sát mạng đối với các doanh nghiệp.
Tính bảo mật là yếu tố quan trọng trong giám sát mạng, giúp bảo vệ thông tin khỏi việc bị lộ ra ngoài Tính năng này theo dõi biến động trong hệ thống mạng và kịp thời cảnh báo cho quản trị viên khi có sự cố xảy ra Qua màn hình giám sát, quản trị viên có thể nhanh chóng xác định vấn đề khả nghi và tìm ra giải pháp phù hợp nhất để xử lý.
Khả năng xử lý sự cố là một trong những lợi thế nổi bật của giám sát mạng Nhờ vào tính năng này, giám sát viên có thể nhanh chóng xác định thiết bị gặp vấn đề, tiết kiệm thời gian chẩn đoán và xử lý sự cố trước khi người dùng mạng nhận thấy bất kỳ trục trặc nào.
Quy tắc xây dựng hệ thống giám sát mạng
Mô Hình FCAPS (Fault Configuration Accounting Performance Security)
When designing a monitoring system, it is essential to adhere to the FCAPS model, as defined by the International Organization for Standardization (ISO) This model encompasses five key functions: Fault Management, Configuration Management, Accounting Management, Performance Management, and Security Management.
Quản lý lỗi là quá trình ghi nhận, cô lập và xử lý các lỗi xảy ra trên mạng, đồng thời xác định những vấn đề tiềm ẩn trong hệ thống mạng.
Quản lý cấu hình đóng vai trò quan trọng trong việc thu thập và lưu trữ cấu hình của nhiều thiết bị, đồng thời theo dõi các thay đổi cấu hình trên từng thiết bị Điều này giúp nâng cao khả năng quản trị và giám sát mạng một cách chủ động và hiệu quả.
Quản lý kế toán thường được áp dụng cho các nhà cung cấp dịch vụ mạng, trong đó công việc này được thay thế bằng quản lý người dùng mạng Cụ thể, quản trị viên sẽ cấp phát mật khẩu và quyền truy cập cho người dùng để họ có thể vào mạng một cách an toàn và hiệu quả.
Quản lý hiệu năng mạng là quá trình giám sát và tối ưu hóa toàn bộ hiệu suất, bao gồm tốc độ truyền, thông lượng, tỷ lệ gói tin bị mất và thời gian phản hồi Để thực hiện việc này, các chuyên gia thường sử dụng giao thức SNMP, giúp theo dõi và cải thiện các chỉ số quan trọng của mạng một cách hiệu quả.
Quản lý bảo mật là một hoạt động thiết yếu trong quản trị mạng, đóng vai trò quan trọng trong việc bảo vệ thông tin người dùng Trong khuôn khổ FCAPS, quản lý bảo mật bao gồm việc kiểm soát truy cập tài nguyên mạng, cũng như quản lý dữ liệu và cấu hình để đảm bảo an toàn cho hệ thống.
Báo Cáo và cảnh báo
Công việc của giám sát mạng bao gồm thu thập và xử lý dữ liệu từ các thành phần mạng để tạo ra báo cáo dễ hiểu cho quản trị viên Những báo cáo này cung cấp thông tin về hiệu suất của các nút mạng và trạng thái hiện tại của mạng Dựa trên dữ liệu trong báo cáo, quản trị viên có thể đưa ra quyết định về quản lý dung lượng, bảo trì, xử lý sự cố và bảo mật mạng.
Việc tạo các cảnh báo dựa trên ngưỡng và điểm kích hoạt là rất cần thiết để giúp các quản trị viên mạng phát hiện sớm các vấn đề tiềm ẩn, từ đó ngăn chặn sự cố có thể dẫn đến sụp đổ toàn hệ thống.
Tích hợp lưu trữ dữ liệu
Hệ thống giám sát thu thập dữ liệu từ các thành phần mạng để đảm bảo phát hiện vấn đề trước khi mạng gặp sự cố Tuy nhiên, việc này có thể dẫn đến tích lũy dữ liệu lớn, ảnh hưởng đến hiệu suất và không gian lưu trữ Giải pháp là sử dụng dữ liệu tích hợp, giúp giảm thiểu tình trạng này Tích hợp dữ liệu là quá trình thu thập và tổng hợp thông tin theo thời gian, tạo ra các báo cáo chi tiết Mức độ chi tiết của báo cáo phụ thuộc vào mô hình tích hợp của hệ thống Dữ liệu sẽ được trung bình theo thời gian và đưa vào bảng chi tiết, giúp hệ thống giám sát tạo ra các báo cáo mà không làm giảm hiệu suất hay chiếm quá nhiều không gian lưu trữ.
Các giải pháp và ứng dụng của các công cụ giám sát mạng phổ biến
Hệ thống giám sát mạng có thể được xây dựng theo một trong ba giải pháp sau:
Giải pháp quản lý thông tin an ninh: tập trung thu thập, lưu trữ và biểu diễn nhật ký.
Giải pháp quản lý sự kiện an ninh: tập trung xử lý, phân tích các nhật ký đã được thu thập để đưa ra cảnh báo cho người dùng.
Giải pháp quản lý và phân tích sự kiện an ninh: là sự kết hợp của hai giải pháp trên nhằm khắc phục những hạn chế vốn có.
Mô hình của giải pháp quản lý và phân tích sự kiện an ninh gồm 3 thành phần:
Thu thập nhật ký an toàn mạng bao gồm việc thu thập dữ liệu từ các thiết bị, ứng dụng và dịch vụ thông qua các giao diện trực tiếp Thành phần này đảm bảo việc quản lý và phân tích thông tin an ninh mạng một cách hiệu quả.
Thu thập toàn bộ dữ liệu toàn bộ nhật ký từ các nguồn thiết bị, ứng dụng.
Kiểm soát băng thông và không gian lưu trữ thông qua khả năng lưu giữ và chọn lọc dữ liệu nhật ký.
Phân tách từng sự kiện và chuẩn hóa các sự kiện vào một lược đồ chung.
Tích hợp các sự kiện để giảm thiểu số lượng các sự kiện gửi về thành phần phân tích và lưu trữ.
Chuyển toàn bộ các sự kiện đã thu thập về thành phần phân tích và lưu trữ.
Thành phần phân tích và lưu trữ bao gồm các thiết bị lưu trữ dung lượng lớn, cung cấp khả năng tổng hợp và phân tích tự động, giúp tối ưu hóa quá trình xử lý dữ liệu.
Kết nối với các thành phần thu thập nhật ký để tập hợp nhật ký tập trung và tiến hành phân tích, so sánh tương quan.
Module phân tích sẽ được hỗ trợ bởi các luật (định nghĩa trước) cũng như khả năng tùy biến, nhằm đưa ra kết quả phân tích chính xác nhất.
Các nhật ký an toàn mạng được tiến hành phân tích, so sánh tương quan
Hỗ trợ kết nối đến các hệ thống lưu trữ dữ liệu.
Thành phần quản trị mạng tập trung:
Cung cấp giao diện quản trị tập trung cho toàn bộ hệ thống giám sát an toàn mạng.
Hỗ trợ sẵn hàng nghìn mẫu báo cáo, các giao diện theo dõi, điều kiện lọc.
Hỗ trợ các công cụ cho việc xử lý các sự kiện an toàn mạng xảy ra trong hệ thống.
Hệ thống bao gồm các thành phần cảnh báo, một dashboard theo dõi thông tin, các báo cáo đáp ứng tiêu chuẩn quản lý, cùng với thành phần lưu trữ dữ liệu lâu dài.
Chi phí sử dụng phần mềm giám sát phụ thuộc vào chính sách và hạ tầng mạng của từng doanh nghiệp Đối với doanh nghiệp lớn, nên ưu tiên sử dụng các giải pháp phần mềm giám sát từ các nhà cung cấp lớn như Cisco và HP để nhận được hỗ trợ tốt nhất Trong khi đó, doanh nghiệp vừa và nhỏ với ngân sách hạn chế nên lựa chọn phần mềm giám sát mã nguồn mở, được phát triển bởi cộng đồng, với tính năng giám sát mạnh mẽ, khả năng nhận diện vấn đề sớm và hoàn toàn miễn phí.
PROTOCOL MONITORING NETWORK
Phương thức Poll và Alert [1]
Có hai phương thức cơ bản trong kỹ thuật giám sát hệ thống, là phương thức Polling và phương thức khác Nhiều phần mềm và giao thức được phát triển dựa trên hai phương thức này, trong đó phương thức Polling đóng vai trò quan trọng trong việc thu thập dữ liệu.
Trung tâm giám sát (manager) hoạt động bằng cách thường xuyên yêu cầu thông tin từ thiết bị cần giám sát (device) Nếu không có yêu cầu từ Manager, Device sẽ không phản hồi Tuy nhiên, khi Manager đặt câu hỏi, Device bắt buộc phải cung cấp thông tin Nhờ vào việc hỏi liên tục, Manager luôn nhận được những cập nhật mới nhất từ Device.
Người quản lý cần giám sát tiến độ công việc của thợ, thường xuyên hỏi “Anh đã làm xong chưa?” để nắm bắt tình hình và đảm bảo công việc được hoàn thành đúng hạn.
“Xong” hoặc “Chưa” b Phương thức Alert
Nguyên tắc hoạt động của hệ thống là khi có sự kiện xảy ra trong thiết bị (Device), thiết bị sẽ tự động gửi thông báo đến quản lý (Manager) dưới dạng cảnh báo (Alert) Quản lý không thực hiện việc truy vấn thông tin định kỳ từ thiết bị.
Người quản lý cần theo dõi tình hình làm việc của thợ và yêu cầu họ thông báo khi có vấn đề xảy ra Thợ sẽ cập nhật các sự kiện như "Tiến độ đã hoàn thành 50%", "Mất điện lúc 10h", "Có điện lại lúc 11h", và "Mới có tai nạn xảy ra".
Thiết bị chỉ gửi thông báo khi có sự kiện xảy ra, như khi một cổng (port) bị ngắt hoặc hoạt động trở lại, nhưng không cung cấp thông tin thay đổi thường xuyên như tổng số byte truyền qua cổng Để lấy thông tin thường xuyên thay đổi, quản lý (Manager) cần chủ động thực hiện phương thức Poll để yêu cầu dữ liệu từ thiết bị So với phương thức Alert, phương thức Poll yêu cầu sự chủ động từ phía quản lý để thu thập thông tin.
Hai phương thức Poll và Alert có cơ chế hoạt động hoàn toàn khác nhau Một ứng dụng giám sát có thể lựa chọn sử dụng Poll, Alert, hoặc kết hợp cả hai, tùy thuộc vào yêu cầu cụ thể trong thực tế.
Bạn có thể chủ động thu thập thông tin cần thiết từ các đối tượng quan tâm mà không cần phải lấy thông tin không cần thiết từ những nguồn không liên quan.
Tất cả các sự kiện diễn ra đều được gửi tới Manager, vì vậy Manager cần có cơ chế để lọc ra những sự kiện quan trọng Ngoài ra, thiết bị cũng cần thiết lập cơ chế chỉ gửi những sự kiện cần thiết.
Có thể lập bảng trạng thái tất cả các thông tin của Device sau khi poll qua một lượt các thông tin đó VD
Device có một port down và
Manager được khởi động sau đó, thì
Manager sẽ biết được port đang down sau khi poll qua một lượt tất cả
Nếu không có sự kiện nào xảy ra, Manager sẽ không thể nắm bắt trạng thái của thiết bị Chẳng hạn, nếu một cổng của thiết bị bị ngắt kết nối và Manager được khởi động sau đó, thì Manager sẽ không nhận biết được cổng đó đang gặp sự cố.
Trong trường hợp đường truyền giữa
Manager và Device xảy ra gián đoạn và Device có sự thay đổi, thì
Khi đường truyền thông suốt trở lại, Manager sẽ tự động cập nhật thông tin mới nhất nhờ vào cơ chế poll định kỳ.
Khi đường truyền bị gián đoạn và thiết bị có sự thay đổi, hệ thống vẫn gửi thông báo cho quản lý, nhưng thông báo này không đến được tay quản lý Mặc dù sau đó đường truyền đã thông suốt trở lại, quản lý vẫn không nắm bắt được những sự cố đã xảy ra.
Chỉ cần cài đặt tại Manager để trỏ đến tất cả các Device Có thể dễ dàng thay đổi một Manager khác.
Phải cài đặt tại từng Device để trỏ đến Manager Khi thay đổi Manager thì phải cài đặt lại trên tất cả Device để trỏ về Manager mới.
Nếu tần suất poll thấp, thời gian chờ giữa các chu kỳ poll dài sẽ khiến Manager chậm cập nhật các thay đổi của thiết bị Điều này có nghĩa là nếu thông tin của thiết bị đã thay đổi nhưng chưa đến lượt poll tiếp theo, Manager vẫn sẽ giữ lại những thông tin cũ.
Ngay khi có sự kiện xảy ra thì Device sẽ gửi Alert đến Manager, do đó Manager luôn luôn có thông tin mới nhất tức thời.
Có thể bỏ sót các sự kiện : khi
Device có thay đổi, sau đó thay đổi trở lại như ban đầu trước khi đến lượt poll kế tiếp thì Manager sẽ không phát hiện được.
Manager sẽ được thông báo mỗi khi có sự kiện xảy ra ở Device, do đó Manager không bỏ sót bất kỳ sự kiện nào.
Vậy Nên Chọn Poll hay Alert?
Phương thức Poll và Alert có những ưu điểm và nhược điểm trái ngược nhau, vì vậy trong nhiều trường hợp, việc kết hợp cả hai phương thức này sẽ mang lại hiệu quả tối ưu hơn.
Các ví dụ ứng dụng cơ chế Poll & Alert:
+ Giao thức Syslog: mỗi khi có sự kiện xảy ra thì thiết bị sẽ gửi bản tin syslog đến Syslog Server
Phần mềm NetworkView cho phép giám sát tình trạng của các server thông qua việc thực hiện ping liên tục Đồng thời, giao thức STP giúp phát hiện các vòng lặp trong mạng bằng cách gửi và nhận các gói BPDU, cũng như thông báo về sự thay đổi trong cấu trúc mạng mỗi khi có sự thay đổi xảy ra.
Giao thức SNMP [2]
SNMP (Simple Network Management Protocol) là giao thức quản lý mạng được thiết kế để hoạt động trên nền tảng TCP/IP, cho phép quản lý các thiết bị kết nối mạng như switch, router, firewall, và ADSL gateway Không chỉ giới hạn ở máy tính, SNMP còn có thể quản lý nhiều loại thiết bị khác, ví dụ như máy giặt hỗ trợ kết nối IP, giúp người dùng có thể quản lý và giám sát từ xa một cách hiệu quả.
SNMP, hay Giao thức Quản lý Mạng Đơn giản, được thiết kế với cấu trúc bản tin và quy trình hoạt động đơn giản, cùng với mức độ bảo mật thấp (trừ phiên bản SNMP 3) Nhờ vào phần mềm SNMP, quản trị viên mạng có khả năng quản lý và giám sát toàn bộ mạng từ xa một cách tập trung.
Theo RFC1157, kiến trúc của SNMP bao gồm 2 thành phần: các trạm quản lý mạng (network management station) và các thành tố mạng (network element).
Network management station thường là một máy tính chạy phần mềm quản lý SNMP (SNMP management application), dùng để giám sát và điều khiển tập trung các network element.
Hình b.1 minh họa giao thức snmp
Network elements are devices, computers, or software compatible with SNMP and managed by a network management station These elements encompass devices, hosts, and applications.
Một management station có khả năng quản lý nhiều element, và ngược lại, một element cũng có thể được quản lý bởi nhiều management station Khi một element được quản lý bởi hai station, nếu cả hai lấy thông tin từ element, chúng sẽ nhận được thông tin giống nhau Tuy nhiên, nếu cả hai station cùng tác động đến một element, element sẽ phản hồi theo thứ tự tác động của chúng, ưu tiên cái nào đến trước.
In addition, there is the concept of an SNMP agent, which is a process running on a network element that provides information about the element to a management station This allows the station to effectively manage the element More specifically, it is the application running on the station and the agent running on the element that directly interact with each other in the SNMP framework The following examples will further clarify these concepts.
+ Để dùng một máy chủ
To manage Windows-based client machines through SNMP, you need to install SNMP management software on the server and enable the SNMP service on the client machines.
To monitor the traffic of a router using a server, you need to install SNMP management software on the server and enable the SNMP feature on the router.
Một thiết bị hỗ trợ SNMP có thể cung cấp nhiều thông tin khác nhau, mỗi thông tin đó gọi là một object.
Máy tính cung cấp thông tin quan trọng như tổng số ổ cứng, tổng số cổng mạng, tổng số byte đã truyền và nhận, tên máy tính, cũng như danh sách các tiến trình đang chạy.
+ Router có thể cung cấp các thông tin : tổng số card, tổng số port, tổng số byte đã truyền/nhận, tên router, tình trạng các port của router, …
Mỗi object có một tên gọi và một mã số để nhận dạng object đó, mã số gọi là Object ID (OID) VD:
+ Tên thiết bị được gọi là sysName, OID là 1.3.6.1.2.1.1.5 4
+ Tổng số port giao tiếp (interface) được gọi là ifNumber, OID là
+ Địa chỉ Mac Address của một port được gọi là ifPhysAddress, OID là
+ Số byte đã nhận trên một port được gọi là ifInOctets, OID là
Mỗi object chỉ có một OID, ví dụ như tên của thiết bị Tuy nhiên, khi một thiết bị có nhiều tên, để phân biệt chúng, người ta sử dụng thêm chỉ số “scalar instance index” (hay còn gọi là “sub-id”) đặt sau OID.
+ Tên thiết bị được gọi là sysName, OID là 1.3.6.1.2.1.1.5; nếu thiết bị có 2 tên thì chúng sẽ được gọi là sysName.0 & sysName.1 và có OID lần lượt là
Địa chỉ MAC, hay còn gọi là ifPhysAddress, được xác định bởi OID 1.3.6.1.2.1.2.2.1.6 Nếu thiết bị có hai địa chỉ MAC, chúng sẽ được phân biệt là ifPhysAddress.0 và ifPhysAddress.1, với OID tương ứng là 1.3.6.1.2.1.2.2.1.6.0 và 1.3.6.1.2.1.2.2.1.6.1.
Tổng số port được gọi là ifNumber, có giá trị duy nhất là 1, vì vậy OID của nó không có phân cấp con và được định danh là 1.3.6.1.2.1.2.1 Trong hầu hết các thiết bị, các object có nhiều giá trị thường được biểu diễn dưới dạng có sub-id, ví dụ như một thiết bị dù chỉ có một tên vẫn phải có OID là sysName.0 hay 1.3.6.1.2.1.1.5.0 Bạn cần ghi nhớ quy tắc này khi lập trình phần mềm SNMP manager.
Sub-id không nhất thiết phải liên tục hay bắt đầu từ 0 VD một thiết bị có 2 mac address thì có thể chúng được gọi là ifPhysAddress.23 và ifPhysAddress.125645
OID của các đối tượng phổ biến có thể được chuẩn hóa, trong khi OID của các đối tượng do người dùng tạo ra cần được tự mô tả Để truy xuất thông tin từ một OID đã chuẩn hóa, ứng dụng SNMP phải gửi một thông điệp SNMP chứa OID tương ứng đến SNMP agent Khi nhận được thông điệp, SNMP agent sẽ phản hồi bằng thông tin tương ứng với OID đó.
Có 2 nhân tố chính trong SNMP: Manager và Agent Các SNMP agent sẽ giữ một sơ sở dữ liệu, được gọi là Management Information Base (MIB), trong đó chứa các thông tin khác nhau về hoạt động của thiết bị mà agent đang giám sát.Phần mềm quản trị SNMP Manager sẽ thu thập thông tin này qua giao thức SNMP. d Cơ chế bảo mật
Một trạm quản lý SNMP có khả năng giám sát nhiều thành phần SNMP thông qua việc gửi yêu cầu và nhận thông báo trap Tuy nhiên, mỗi thành phần SNMP có thể được cấu hình để chỉ cho phép một số trạm quản lý SNMP nhất định thực hiện việc giám sát và quản lý.
Các cơ chế bảo mật đơn giản này gồm có: community string, view và SNMP access control list.
Community string là chuỗi ký tự giống nhau được cài đặt trên SNMP manager và SNMP agent, hoạt động như "mật khẩu" trong việc trao đổi dữ liệu Có ba loại community string: Read-community, Write-community và Trap-community.
Một view phải gắn liền với một community string Tùy vào community string nhận được là gì mà agent xử lý trên view tương ứng.
Giao thức Netflow
NetFlow là một tính năng quan trọng giúp thu thập lưu lượng mạng IP khi nó di chuyển vào hoặc ra khỏi một giao diện Thông qua việc phân tích dữ liệu từ NetFlow, quản trị viên mạng có thể xác định nguồn và đích của lưu lượng, loại dịch vụ, cũng như nguyên nhân gây ra tắc nghẽn mạng Một thiết lập giám sát dòng chảy điển hình sử dụng NetFlow bao gồm các thành phần thiết yếu để tối ưu hóa hiệu suất mạng.
-Thành phần chính của NetFlow:
+ Flow exporter: tổng hợp các gói thành các luồng và xuất các bản ghi luồng tới một hoặc nhiều bộ thu luồng.
+ Flow collector: chịu trách nhiệm tiếp nhận, lưu trữ và xử lý trước dữ liệu dòng nhận được từ bộ xuất dòng.
Ứng dụng phân tích dữ liệu luồng Netflow đóng vai trò quan trọng trong việc phát hiện xâm nhập và lập hồ sơ lưu lượng mạng Cơ chế hoạt động của Netflow cho phép thu thập, phân tích và báo cáo thông tin về lưu lượng mạng, giúp các chuyên gia bảo mật nhận diện các mối đe dọa và tối ưu hóa hiệu suất mạng.
Luồng "flow" là phương pháp kết hợp nhiều gói tin một chiều thành một gói tin lớn hơn Các gói tin này có thể được cấu hình dựa trên các thuộc tính phù hợp trong từng gói, đảm bảo tính hiệu quả và tối ưu trong quá trình truyền tải dữ liệu.
IP Destination: IP đích Source Port: Cổng nguồn Destination Port: Cổng đích Class of Service: Loại dịch vụ Layer 3 Protocol Type: Loại giao thức 3 lớp Interface: Giao diện
Khi một gói dữ liệu được chuyển tiếp, các thuộc tính của nó sẽ được kiểm tra Luồng dữ liệu bắt đầu từ gói đầu tiên (first packet) đi qua đường chuyển mạch tiêu chuẩn Các gói bổ sung (additional packet) với các tham số giống nhau như địa chỉ IP nguồn và đích, cổng nguồn và đích, cùng loại dịch vụ sẽ được nhóm lại thành một luồng duy nhất Bất kỳ sự thay đổi nào về giá trị của các tham số này sẽ dẫn đến việc tạo ra một luồng mới.
Các bộ định tuyến Cisco cao cấp hỗ trợ NetFlow lấy mẫu, cho phép kiểm tra một số gói nhất định trong bối cảnh lưu lượng truy cập lớn Việc lấy mẫu này giúp giảm thiểu tác động đến hiệu suất khi gửi thông tin về luồng, đảm bảo hoạt động mượt mà cho hệ thống mạng.
+ NetFlow cache (Bộ nhớ đệm NetFlow)
Việc giám sát và nhóm các gói tin qua bộ định tuyến hoặc bộ chuyển mạch tạo ra lượng dữ liệu lớn, được lưu trữ trong bộ đệm NetFlow Cache Mỗi luồng hoạt động được ghi lại trong một bản ghi luồng, và dữ liệu sẽ hết hạn theo thời gian Sau đó, dữ liệu này được xuất từ bộ nhớ cache sang máy chủ thu thập NetFlow theo các khoảng thời gian định kỳ, dựa trên bộ đếm thời gian của luồng Mặc định, bộ đệm NetFlow Cache được kiểm tra mỗi giây.
Các luồng được nhóm lại để xuất thành một khối dữ liệu gọi là “NetFlow
Mỗi khối dữ liệu Datagram trong xuất NetFlow có thể chứa tối đa 30 luồng Theo Cisco, việc sử dụng NetFlow Export tiêu chuẩn chỉ chiếm khoảng 1,5% tổng lưu lượng truy cập chuyển mạch được phân tích.
+ NetFlow Record (bản ghi Netflow):
Bản ghi Flow Record của NetFlow Version 9 được xây dựng dựa trên mẫu, cho phép cải tiến trong tương lai mà không cần thay đổi cấu trúc cơ bản Định dạng bản ghi được xác định bởi tiêu đề gói, theo sau là ít nhất một template FlowSet và data FlowSet Template FlowSet mô tả nội dung của Data FlowSets, tạo điều kiện cho khả năng mở rộng của bản ghi Thay vì xác định trước dữ liệu sẽ đến và vị trí của nó, định nghĩa này được thực hiện trong chính gói tin.
Gói "packet header" trong phiên bản này tương tự như trong Phiên bản 5, nhưng bổ sung thêm thông tin về số phiên bản gói, thời gian hoạt động của hệ thống tính bằng mili giây, cùng với số thứ tự và Source ID.
+ NetFlow collector (Bộ thu thập dữ liệu Netflow)
Dữ liệu NetFlow được gửi định kỳ đến bộ thu thập dữ liệu NetFlow collector, là máy chủ chạy phần mềm NetFlow Receiver Software để thu thập, ghi lại, lọc và phân tích các luồng dữ liệu Phần mềm thu thập dữ liệu cần hỗ trợ phiên bản NetFlow tương ứng với máy chủ xuất Chẳng hạn, để giám sát bộ định tuyến Cisco sử dụng NetFlow version 5, cần sử dụng cảm biến NetFlow V5 Sensor trong PRTG Network Monitor; trong khi đó, bộ định tuyến sử dụng NetFlow version 9 cần cảm biến NetFlow V9 Sensor Cả hai cảm biến có thể hoạt động đồng thời trên cùng một máy, cho phép bộ thu thập nhận và báo cáo dữ liệu từ cả hai phiên bản NetFlow.
Khối dữ liệu NetFlow datagrams được truyền qua Giao thức UDP, yêu cầu cấu hình địa chỉ IP của bộ thu dữ liệu và cổng đích trên bộ định tuyến hoặc bộ chuyển mạch Ngoài ra, trong một số trường hợp, SNMP có thể được sử dụng để kích hoạt NetFlow và thiết lập địa chỉ IP của người thu thập dữ liệu.
Trong Cisco IOS, lệnh “ip flow-export command” có thể được sử dụng để định cấu hình IP đích từ dòng lệnh.
Một trong những cổng phổ biến nhất cho việc xuất NetFlow là cổng được sử dụng trong bộ thu dữ liệu NetFlow receiver Khi xuất NetFlow được gửi đến bộ thu, không cần thực hiện quy trình kéo “Polling” Tuy nhiên, không có quy trình tự động phát hiện cho NetFlow giống như với SNMP.
Có thể truy cập dữ liệu NetFlow thông qua SNMP bằng cách sử dụng NetFlow MIB, mặc dù không thay thế cho NetFlow export Dữ liệu bao gồm số lượng luồng, luồng mỗi giây và gói hoặc byte trên mỗi luồng Ngoài ra, khả năng truy cập danh sách những người nói nhiều nhất cũng có thể hữu ích, tuy nhiên, dữ liệu này vẫn có thể được thu thập khi theo dõi các luồng.
Có nhiều loại lưu lượng có thể được theo dõi bằng NetFlow, và cảm biến NetFlow V9 Sensor của PRTG cho phép phân loại các loại lưu lượng này theo mặc định.
Infrastructure (DHCP, DNS, ICMP, SNMP)
CHƯƠNG III CÁC PHẦM MỀM GIÁM SÁT MẠNG MÃ NGUỒN MỞ PHỔ BIẾN
Nagios
Nagios là một công cụ giám sát mạng và dịch vụ mạnh mẽ, giúp các doanh nghiệp phát hiện và khắc phục sự cố hạ tầng Công Nghệ Thông Tin trước khi chúng ảnh hưởng đến hoạt động kinh doanh và quy trình nội bộ.
Nagios là phần mềm mã nguồn mở miễn phí, chuyên giám sát hệ thống, mạng và cơ sở hạ tầng Hiện tại, Nagios chỉ được hỗ trợ triển khai trên hệ điều hành Linux.
Nagios có khả năng cung cấp một số dịch vụ cho bạn như sau:
Quản lý các dịch vụ mạng như là: SMTP, POP2,
HTTP, NNTP, ICMP SNMP, FTP, SSH.
Giám sát tài nguyên máy chủ là một phần quan trọng trong quản lý hệ thống, bao gồm việc theo dõi tải CPU, dung lượng đĩa đã sử dụng và các nhật ký hệ thống Hệ thống giám sát này được áp dụng trên hầu hết các hệ điều hành mạng, trong đó có Microsoft Windows, thông qua việc sử dụng các agent monitor.
Giám sát mọi phần cứng như nhiệt độ, báo động, v.v có khả năng gửi dữ liệu thu thập được qua mạng tới các plugin cụ thể.
Giám sát từ xa bằng cách sử dụng Nagios Remote
Plugin Executor hoặc thông qua SSH hoặc đường hầm SSL được mã hóa Kiểm tra dịch vụ song song và nhật ký xoay vòng log tự động.
Nagios hỗ trợ triển khai máy chủ giám sát dự phòng, cung cấp biểu đồ dữ liệu hiệu suất và phần phụ trợ cơ sở dữ liệu Giao diện web cho phép người dùng theo dõi trạng thái mạng hiện tại, nhận thông báo, xem lịch sử sự cố và các file log Với khả năng mở rộng và tính linh hoạt, Nagios là giải pháp lý tưởng cho việc giám sát hệ thống.
Lên kế hoạch nâng cấp cơ sở hạ tầng trước khi nó trở nên lỗi thời và thường xuyên gặp lỗi.
Tự động sửa lỗi khi phát hiện lỗi.
Phối hợp các với các hoạt động của nhóm kỹ thuật.
Đảm bảo SLA (Service-Level Agreement) của tổ chức đang áp dụng.
Đảm bảo sự cố cơ sở hạ tầng CNTT có tác động tối thiểu đến quá trình vận hành của tổ chức.
Giám sát toàn bộ cơ sở hạ tầng kinh doanh của bạn.
Người dùng có thể dễ dàng phát triển các plug-in riêng để giám sát nhu cầu sử dụng, nhờ vào khả năng hỗ trợ nhiều ngôn ngữ lập trình như shell script, C++, Perl, Ruby, Python, PHP, và C#.
Việc giám sát các dịch vụ là song song.
Có khả năng phát hiện và phân biệt được host nào là down và host nào là unreachable.
Thông tin cảnh báo (khi host và các dịch vụ xảy ra xự cố) bằngemail, SMS sử dụng 3G, …
Sử dụng giao diện Web để theo dõi trạng thái của mạng, xem lịch sử các cảnh báo và các sự cố xảy ra.
Nagios hoạt động như thế nào?
Cấu hình Nagios cho phép giám sát các thành phần quan trọng của hạ tầng CNTT, bao gồm các chỉ số hệ thống, giao thức mạng, ứng dụng, dịch vụ, máy chủ và hạ tầng mạng.
Xác nhận tình trạng xử lý các cảnh báo và khởi động quá trình giải quyết sự cố ngừng hoạt động là rất quan trọng Đồng thời, cần tiến hành điều tra các cảnh báo bảo mật ngay lập tức Nếu không được công nhận kịp thời, các cảnh báo có thể được chuyển giao cho các nhóm khác nhau để xử lý.
Nagios cung cấp khả năng báo cáo chi tiết, cho phép người dùng xem lại hồ sơ lịch sử về sự cố ngừng hoạt động, các sự kiện, thông báo và phản hồi cảnh báo.
Thiết lập thời gian ngừng hoạt động (bảo trì) theo lịch trình giúp ngăn cảnh báo nhận được trong thời gian này.
Biểu đồ và báo cáo về xu hướng cùng khả năng lập kế hoạch giúp bạn xác định các đối tượng cần nâng cấp cơ sở hạ tầng, từ đó phòng ngừa lỗi xảy ra.
Cacti
Cacti là phần mềm mã nguồn mở, giám sát mạng và công cụ đồ họa viết trên PHP/
Cacti là một công cụ mạnh mẽ sử dụng MySQL và RRDTool (Round-robin database tool) để lưu trữ dữ liệu và tạo đồ họa Nó thu thập dữ liệu định kỳ thông qua Net-SNMP, giúp người dùng theo dõi và phân tích hiệu suất hệ thống một cách hiệu quả.
Để thu thập dữ liệu hiệu quả, người dùng cần cung cấp các đường dẫn tới dữ liệu mong muốn, sau đó Cacti sẽ tự động thu thập và lưu trữ vào cơ sở dữ liệu MySQL hoặc kho lưu trữ vòng robin Ngoài ra, nguồn dữ liệu cũng có thể được tạo ra để phản ánh chính xác dữ liệu hiển thị trên biểu đồ.
Hệ thống thu thập dữ liệu cung cấp cơ chế "đầu vào dữ liệu" cho phép người dùng xác định các tập lệnh tùy chỉnh để thu thập dữ liệu hiệu quả Mỗi tập lệnh yêu cầu nhập các đối số cụ thể cho từng nguồn dữ liệu, chẳng hạn như địa chỉ IP Người dùng có thể truy xuất dữ liệu thông qua SNMP hoặc các tập lệnh có đường dẫn Đặc biệt, một poller dựa trên PHP được tích hợp sẵn để thực thi các lệnh, thu thập dữ liệu SNMP và cập nhật các tệp RRD một cách tự động.
Cacti cho phép tạo ra đồ thị RRDTool từ nhiều nguồn dữ liệu khác nhau, hỗ trợ người dùng thiết kế các biểu đồ phong phú với nhiều loại hình và hàm tổng hợp Quy trình tạo đồ thị trở nên dễ dàng hơn với tính năng chọn màu sắc và văn bản tự động Ngoài việc tạo đồ thị RRDTool, Cacti còn cung cấp nhiều cách hiển thị khác nhau, bao gồm chế độ xem dạng danh sách và chế độ xem dạng cây, giúp sắp xếp đồ thị theo cấu trúc phân cấp Người dùng có thể tạo số lượng đồ thị không giới hạn và tùy chọn nguồn dữ liệu hoặc CDEF cho mỗi đồ thị.
Cacti là một công cụ quản lý người dùng mạnh mẽ, cho phép thêm người dùng và phân quyền truy cập vào các chức năng cụ thể Điều này giúp quản lý tạo ra nhiều người dùng với quyền hạn khác nhau, cho phép một số người thay đổi thông số của đồ thị, trong khi những người khác chỉ có thể xem Mỗi người dùng còn có thể lưu giữ cài đặt cá nhân khi xem biểu đồ, mang lại trải nghiệm tùy chỉnh và linh hoạt.
Icinga
Phần mềm Icinga là một hệ thống mã nguồn mở chuyên giám sát mạng, máy chủ và dịch vụ, cung cấp thông báo kịp thời khi có sự cố xảy ra Được phát triển từ mã nguồn của Nagios, Icinga kế thừa nhiều tính năng quan trọng, giúp người dùng dễ dàng quản lý và theo dõi hiệu suất hệ thống.
Phần mềm "Người tiền nhiệm" Nagios hoàn toàn tương thích với các phần mềm hỗ trợ của Nagios, đồng thời cung cấp nhiều tính năng tùy biến mới Nó sở hữu giao diện người dùng Web 2.0 và hỗ trợ các hệ quản trị cơ sở dữ liệu phổ biến như MySQL, Oracle và PostgreSQL Phần mềm này có khả năng chạy trên nhiều phiên bản của Linux, bao gồm Fedora, Ubuntu và OpenSuSE, cũng như một số nền tảng của Unix như Solaris và HP.
- Chính sách bản quyền: Phần mềm cung cấp phiên bản miễn phí, hỗ trợ các hệ thống nhỏ và cả các hệ thống doanh nghiệp.
Phần mềm này có nhiều ưu điểm nổi bật, bao gồm việc cung cấp miễn phí và hỗ trợ nhiều tùy chọn giao diện quản trị Web Nó dễ dàng cài đặt và tương thích tốt với hệ điều hành Linux, đồng thời sở hữu giao diện quản trị Web thân thiện, dễ sử dụng cho người dùng mới Ngoài ra, phần mềm còn tương thích với các công cụ hỗ trợ của Nagios.
- Nhược điểm: Phần mềm không cung cấp nhiều tùy chọn hiển thị thông tin giám sát bằng đồ thị.
OpenNMS
OpenNMS là phần mềm mã nguồn mở cấp doanh nghiệp, được phân phối miễn phí và đã nhận nhiều giải thưởng Đây là nền tảng ứng dụng dựa trên web đầu tiên trên thế giới, chuyên xử lý giao diện mạng trên hệ điều hành GNU/Linux.
Tính năng trong nháy mắt
Dự án này bao gồm các tính năng nổi bật như hỗ trợ bỏ phiếu dịch vụ, thu thập dữ liệu từ các hệ thống từ xa, và quản lý sự kiện hiệu quả Ngoài ra, hệ thống còn tích hợp tính năng cấp phép và phát hiện tự động, đảm bảo dịch vụ ổn định, cùng với chức năng đo lường hiệu suất tối ưu.
Giám sát hàng chục nghìn thiết bị
Phần mềm OpenNMS được phát triển để giám sát hàng chục nghìn thiết bị thông qua một cá thể duy nhất, mang lại giải pháp mạng mạnh mẽ, linh hoạt và có khả năng mở rộng Đây là lựa chọn lý tưởng cho các công ty và nhà cung cấp đang tìm kiếm các công cụ giám sát hiệu quả và miễn phí.
Hệ thống quản lý mạng thực sự miễn phí
OpenNMS là phần mềm mã nguồn mở hoàn toàn miễn phí, không yêu cầu khóa cấp phép và không có chi phí ẩn cho việc nâng cấp hoặc duy trì Người dùng có thể tự do tải xuống, sửa đổi, kiểm tra và phân phối mã nguồn Bên cạnh đó, các nhà phát triển của OpenNMS cũng cung cấp hỗ trợ và đào tạo thương mại cho người dùng.
OpenNMS cung cấp tính năng tùy biến cao, cho phép người dùng tạo ra giải pháp quản lý mạng độc đáo và tích hợp Ứng dụng này đã được thử nghiệm thành công trên nhiều bản phân phối Linux phổ biến như Ubuntu, Debian, Arch Linux, Fedora, Red Hat Enterprise Linux, CentOS, SUSE Linux Enterprise Server và openSUSE.
Dự án được phát triển chủ yếu bằng ngôn ngữ lập trình Java, cho phép ứng dụng hoạt động độc lập trên tất cả các hệ điều hành chính như Linux, BSD, Solaris, Microsoft Windows, Mac OS X và bất kỳ hệ điều hành nào khác có cài đặt môi trường chạy Java (JRE) Hiện tại, cả kiến trúc bộ lệnh 32 bit và 64 bit đều được hỗ trợ.
Nó được thiết kế đặc biệt cho Linux, nhưng Windows, Solaris và OSX cũng được hỗ trợ
Giám sát nhiệt độ thiết bị
Bảng điều khiển quản trị viên có thể tùy chỉnh
Giám sát cung cấp điện
Hỗ trợ IPv4 và IPv6
Sự kiện có thể tạo thông báo qua email, SMS, XMPP và nhiều phương thức khác
Bản đồ nút địa lý để hiển thị các nút và ngừng dịch vụ bằng Bản đồ đường phố mở, Google Maps hoặc Mapquest
PHẦN MỀM GIÁM SÁT ZABBIX MÃ NGUỒN MỞ [3]
Zabbix là gì?
Zabbix là một giải pháp giám sát mã nguồn mở nổi tiếng, cung cấp nhiều tính năng độc đáo và khả năng tùy biến cao Phần mềm này phù hợp cho việc giám sát hệ thống mạng phân tán của các doanh nghiệp tầm trung và lớn, với chi phí đầu tư hợp lý.
Zabbix, được sáng lập bởi Alexei Vladishev và hiện được phát triển bởi tổ chức Zabbix SIA, là một phần mềm mã nguồn mở được cấp phép theo General Public License GPL phiên bản 2 Phần mềm này cung cấp các cơ chế thông báo linh hoạt cho quản trị viên qua email, SMS, và ứng dụng OTT Ngoài ra, Zabbix còn mang đến báo cáo và dữ liệu chính xác dựa trên thông tin thu thập từ các thiết bị mạng.
Zabbix hỗ trợ cả phương pháp thăm dò và đặt bẫy, cho phép người dùng truy cập tất cả báo cáo, thống kê và thông số cấu hình qua giao diện web Giao diện này giúp người quản trị dễ dàng đánh giá trạng thái mạng và máy chủ từ bất kỳ đâu Khi được cấu hình đúng cách, Zabbix đóng vai trò quan trọng trong việc giám sát hạ tầng CNTT, phù hợp cho cả tổ chức nhỏ với vài máy chủ lẫn các công ty lớn sở hữu hàng ngàn máy chủ.
Thành phần kiến trúc của Zabbix
Zabbix Server là thành phần trung tâm của phần mềm Zabbix, có khả năng kiểm tra các dịch vụ mạng từ xa thông qua báo cáo từ Agent Nó lưu trữ tất cả các cấu hình và số liệu thống kê, giúp quản lý và giám sát hiệu quả hệ thống mạng.
Zabbix Proxy là một phần mở rộng quan trọng của Zabbix, có chức năng thu thập và lưu trữ dữ liệu tạm thời trước khi chuyển đến Zabbix Server Giải pháp này rất phù hợp cho việc giám sát tập trung các địa điểm từ xa, chi nhánh công ty hoặc các mạng lưới không có quản trị viên nội bộ Ngoài ra, Zabbix Proxy còn giúp phân phối tải cho Zabbix Server, nâng cao hiệu suất giám sát.
Zabbix Agent là công cụ giám sát chủ động các thiết bị cục bộ và ứng dụng trên hệ thống mạng, bao gồm ổ cứng và bộ nhớ Khi được cài đặt trên Server, Zabbix Agent sẽ thu thập thông tin hoạt động của Server và gửi dữ liệu này về Zabbix Server để xử lý.
Giao diện web của Zabbix Server cho phép người dùng dễ dàng truy cập và theo dõi dữ liệu, đồng thời thực hiện cấu hình trực tiếp từ giao diện này Giao diện này thường được triển khai trên các máy chủ, giúp tối ưu hóa quá trình quản lý và giám sát hệ thống.
Ưu điểm
- Tự động tìm phát hiện server và hệ thống mạng
- Hỗ trợ server cài đặt trên dòng hệ điều hành Unix/Linux.
- Hỗ trợ máy trạm client nhiều hệ điều hành.
- Giao diện web cực kì tinh tế và đẹp mắt.
- Có thông báo sự cố qua email hoặc OTP App.
- Có báo cáo, biểu đồ qua giao diện web đẹp mắt.
- Kiểm tra theo dõi việc đăng nhập.
- Linh động trong việc phân quyền người sử dụng.
- Mã nguồn mở, chi phí đầu tư thấp.
- Nhiều plugin hỗ trợ cho các dịch vụ hệ thống khác nhau.
Nhược điểm
Không có giao diện web mobile hỗ trợ.
Không phù hợp với hệ thống mạng lớn hơn 1000+ node thiết bị client cần giám sát Lúc này phát sinh vấn đề hiệu suất về PHP và Database.
Thiết kế template/alerting rule đôi khi khá phức tạp.
Tính năng của Zabbix
Zabbix là một giải pháp giám sát mạng được tích hợp nhiều tính năng:
+ Kiểm tra tính khả dụng và hiệu suất+ Hỗ trợ SNMP (cả theo dõi và bỏ phiếu), IPMI, JMX, giám sát VMware
+ Thu thập dữ liệu mong muốn ở các khoảng thời gian tùy chỉnh
+ Được thực hiện bởi máy chủ / proxy và bởi các đại lý
- Xác định ngưỡng linh hoạt
Bạn có thể linh hoạt xác định các ngưỡng sự cố, được gọi là trình kích hoạt, bằng cách tham chiếu các giá trị từ cơ sở dữ liệu phụ trợ.
- Cảnh báo có thể cấu hình cao
+ Gửi thông báo có thể được tùy chỉnh cho lịch trình báo cáo, người nhận, loại phương tiện
+ Các thông báo có thể trở nên có ý nghĩa và hữu ích bằng cách sử dụng các biến macro
+ Các hành động tự động bao gồm các lệnh từ xa
- Vẽ đồ thị thời gian thực
+ Các mục được giám sát ngay lập tức được lập biểu đồ bằng chức năng vẽ đồ thị tích hợp
- Khả năng giám sát web
+ Zabbix có thể theo dõi đường dẫn của những cú nhấp chuột mô phỏng trên một trang web và kiểm tra chức năng cũng như thời gian phản hồi
- Các tùy chọn hình ảnh hóa mở rộng
+ Khả năng tạo các biểu đồ tùy chỉnh có thể kết hợp nhiều mục vào một chế độ xem duy nhất
+ Màn hình tùy chỉnh và trình chiếu để có tổng quan kiểu bảng điều khiển báo cáo
Chế độ xem cấp cao (kinh doanh) của các tài nguyên được giám sát
- Lưu trữ dữ liệu và lịch sử
+ Dữ liệu được lưu trữ trong cơ sở dữ liệu
+ Lịch sử có thể định cấu hình
+ Quy trình dọn phòng tích hợp sẵn
+ Nhóm kiểm tra các mẫu
+ Các mẫu có thể kế thừa các mẫu khác
+ Tự động khám phá các thiết bị mạng
+ Tự động đăng ký đại lý
+ Khám phá hệ thống tệp, giao diện mạng và snmp oid
+ Một giao diện người dùng dựa trên web trong php
+ Có thể truy cập từ mọi nơi
+ Có mục ghi chép đánh giá
API Zabbix cung cấp một giao diện lập trình mạnh mẽ, cho phép thực hiện các thao tác hàng loạt, tích hợp với phần mềm bên thứ ba và phục vụ nhiều mục đích khác nhau.
+ Xác thực người dùng an toàn
+ Một số người dùng nhất định có thể bị giới hạn ở một số lượt xem nhất định
- Agent có đầy đủ tính năng và dễ dàng mở rộng
+ Triển khai trên các mục tiêu giám sát
+ Có thể được triển khai trên cả linux và windows
- Có thể sử dụng cho các môi trường phức tạp
+ Giám sát từ xa dễ dàng bằng cách sử dụng proxy zabbix
Cơ chế hoạt động
Zabbix server giám sát thiết bị thông qua Zabbix agent hoặc các giao thức như SNMP và Netflow Các thiết bị mạng hoặc server đã cài đặt SNMP hoặc Zabbix agent sẽ gửi thông số đến Zabbix server Sau khi thu thập, Zabbix server phân tích dữ liệu và dựa vào các trigger do quản trị viên thiết lập để đưa ra cảnh báo với các mức độ khác nhau như Critical, Warning, và Information, gửi thông báo qua Gmail, SMS, và Email cho quản trị viên.
Cấu trúc thư mục
- docs: Thư mục chứa file hướng dẫn pdf
- src: Thư mục chứa tất cả source cho các tiến trình Zabbix.
src/zabbix_server: Thư mục chứa file tạo và source cho zabbix_server.
src/zabbix_agent: Thư mục chứa file tạo và source cho zabbix_agent và zabbix_agentd.
src/zabbix_get: Thư mục chứa file tạo và source cho zabbix_get.
src/zabbix_sender: Thư mục chứa file tạo và source cho zabbix_sender.
- include: Thư mục chứa các thư viện Zabbix.
misc/init.d: Thư mục chứa các tập lệnh khởi động trên các nền khác nhau.
frontends/php: Thư mục chứa các file PHP.
- create: Thư mục chứa các tập lệnh SQL để tạo cơ sở dữ liệu ban đầu.
create/schema: Thư mục tạo biểu đồ cơ sở dữ liệu.
create/data: Thư mục chứa dữ liệu cho việc tạo cơ sở dữ liệu ban đầu.
- upgrades: thư mục chứa các thủ tục nâng cấp cho phiên bản khác nhau của Zabbix.
Mô hình triển khai
Zabbix là một ứng dụng giám sát mạnh mẽ, có khả năng theo dõi hàng trăm đối tượng trong một cài đặt single server Tuy nhiên, khi hệ thống mở rộng với hàng nghìn máy chủ và thiết bị mạng trong một mô hình mạng phức tạp, việc sử dụng single server sẽ gặp hạn chế, đặc biệt khi các máy chủ nằm ở nhiều vị trí địa lý khác nhau.
Trong nhiều doanh nghiệp, hệ thống Zabbix thường đã được cài đặt sẵn, mang lại tính linh hoạt cho việc nâng cấp mô hình giám sát lên dạng proxy-based monitoring (giám sát phân tán) Mô hình này bao gồm một Zabbix server và nhiều Zabbix proxies, với mỗi proxy có thể được đặt tại các chi nhánh hoặc một trung tâm dữ liệu Cấu hình này không chỉ dễ duy trì mà còn có nhiều lợi ích trong việc giám sát tập trung, đặc biệt là cho các mạng phức tạp.
Kiến trúc giám sát phân tán là mô hình triển khai phức tạp nhất của Zabbix Hệ thống này sử dụng phương pháp giám sát dựa trên proxy, như được mô tả trong hình ảnh dưới đây, để tối ưu hóa khả năng giám sát.
Hình a.1 mô hình phân tán b Mô hình tập trung
Mô hình cài đặt Zabbix trên một máy chủ không được khuyến cáo cho các hệ thống giám sát lớn, nhưng phù hợp với doanh nghiệp nhỏ có ít thiết bị cần giám sát Trong mô hình này, tất cả các thành phần như Zabbix server, Zabbix Database và Zabbix web frontend được cài đặt trên một node duy nhất Đối với doanh nghiệp vừa và nhỏ, triển khai trên một server vật lý giúp tiết kiệm chi phí đầu tư phần cứng Tuy nhiên, đối với doanh nghiệp lớn, cần đảm bảo tính dự phòng cho hệ thống, nên cài đặt thêm các node dự phòng để chia tải và đảm bảo tính sẵn sàng cao (HA).
Các khái niệm tùy chọn trong zabbix
Host là một thiết bị trong hệ thống mạng, có thể là máy tính, server hoặc VPS, chạy trên các hệ điều hành khác nhau Nó cũng có thể là các thực thể như máy in, máy chấm công, máy photo, hoặc camera, miễn là chúng hỗ trợ các giao thức mà Zabbix monitor cung cấp.
Templates: Là một bố cục hay một thành phần được tạo ra sẳn để không cần phải lặp đi lặp lại khi gặp đúng 1 trường hợp.
Items: Đơn giản là một nơi chứa các key như là key memory, key cpu, key hdd… Items được đưa vào trong một templates.
Triggers: Là một điều kiện khi thỏa mãn điều kiện của Triggers mà người lập trình đặt ra thì sẽ thực hiện một hành động nào đó tiếp theo.
Graphs: Là một sơ đồ giám sát trực quan để người quản trị nhìn các thông tin một cách dễ dàng hơn.