GIỚI THIỆU CHUNG
ĐẶT VẤN ĐỀ
1.1.1 Bài toán tích hợp dữ liệu:
Việc tổng hợp thông tin và đồng bộ dữ liệu từ các nguồn dữ liệu hiện có là một nhu cầu thiết yếu cho mọi hệ thống thông tin, đặc biệt là trong lĩnh vực Bộ Giao thông.
Vận tải thì điều này rất quan trọng và cần triển khai càng sớm càng tốt
Bài toán tích hợp dữ liệu từ các Cục quản lý chuyên ngành thuộc
Bộ Giao thông Vận tải nhấn mạnh tầm quan trọng của việc tích hợp dữ liệu từ các Cục quản lý chuyên ngành vào Trung tâm tích hợp dữ liệu của Bộ Mục tiêu là xây dựng giải pháp để sử dụng hiệu quả thông tin hiện có, phục vụ công tác tham mưu cho các Vụ chức năng và hỗ trợ lãnh đạo Bộ trong việc chỉ đạo điều hành.
Để đáp ứng yêu cầu của luận văn, tôi đã nghiên cứu các công nghệ phù hợp trong bối cảnh phát triển công nghệ thông tin tại Việt Nam Mỗi cơ quan thường đầu tư vào hạ tầng viễn thông và phần mềm ứng dụng theo nhu cầu riêng, ban đầu đáp ứng tốt nhưng khi cần chia sẻ thông tin, các hệ thống lại không đủ khả năng Việc đầu tư mới từ đầu sẽ gây lãng phí và khó khăn trong việc khai thác thông tin đã tích lũy Do đó, cần tìm giải pháp cho phép các hệ thống hiện có hoạt động bình thường đồng thời hỗ trợ trao đổi thông tin với các hệ thống cũ và mới.
Bài toán này đã được giải quyết ở nhiều mức độ khác nhau, tùy thuộc vào mô hình và công nghệ hiện tại Mỗi công nghệ chỉ hỗ trợ một lớp bài toán nhất định và sau một thời gian, chúng có thể trở nên lạc hậu, không đáp ứng được yêu cầu công việc Do đó, cần xác định tiêu chí bổ sung để lựa chọn giải pháp phù hợp, đảm bảo tính ổn định theo thời gian và giảm thiểu sự phụ thuộc vào thay đổi của hạ tầng viễn thông.
Qua tổng hợp các công nghệ hiện có, ta cần dựa vào một số tiêu chí chính như sau:
• Yêu cầu thực tế của tổ chức
• Các công nghệ hiện thời có thể dùng để giải quyết bài toán
• Tài chính của tổ chức
• Các chuẩn trao đổi thông tin được chuẩn hóa thành chuẩn quốc tế, được nhiều hãng hỗ trợ
• Chọn lựa giao thức truyền thông không phụ thuộc vào nền tảng cơ sở viễn thông và các phần mềm nền
Khi nhắc đến tích hợp dữ liệu, chúng ta nghĩ ngay đến việc tổng hợp thông tin từ các nguồn dữ liệu khác nhau, có thể là từ các hệ thống khác nhau hoặc từ cùng một hệ thống, nhằm tạo ra một nguồn dữ liệu mới Nguồn dữ liệu này có thể được sử dụng cho một hệ thống mới hoặc chỉ đơn giản là để lưu trữ.
Các công việc được thực hiện theo một trình tự rõ ràng, bao gồm các vấn đề nghiên cứu chính trong nội dung luận văn này.
Nghiên cứu nhằm kết nối hệ thống thông tin của Trung tâm tích hợp dữ liệu Bộ Giao thông Vận tải với các hệ thống thông tin của các Cục quản lý chuyên ngành Mục tiêu là tối ưu hóa việc chia sẻ dữ liệu và nâng cao hiệu quả quản lý trong lĩnh vực giao thông vận tải.
Để khai thác và vận chuyển thông tin từ các cơ sở dữ liệu của các Cục quản lý chuyên ngành về Trung tâm tích hợp dữ liệu Bộ Giao thông Vận tải, cần thực hiện các bước như xác định nguồn dữ liệu, sử dụng các công cụ phân tích phù hợp và đảm bảo quy trình bảo mật thông tin Việc tối ưu hóa quy trình này không chỉ giúp nâng cao hiệu quả quản lý mà còn tạo điều kiện thuận lợi cho việc ra quyết định trong lĩnh vực giao thông vận tải.
• Xây dựng kho lưu trữ thông tin
• Sử dụng thông tin đã khai thác được.
HIỆN TRẠNG CƠ SỞ HẠ TẦNG KỸ THUẬT TIN HỌC
Phần này sẽ tổng hợp và đánh giá tình hình cơ sở hạ tầng kỹ thuật tin học hiện tại của Bộ Giao thông Vận tải cùng với các Cục quản lý chuyên ngành, nhằm cung cấp cái nhìn tổng quát về sự phát triển và hiệu quả của hệ thống công nghệ thông tin trong ngành.
1.2.1 Cơ quan Bộ Giao thông Vận tải
Hình 1: Mô hình mạng cơ quan Bộ Giao thông Vận tải
Mạng LAN: Tất cả máy tính cơ quan Bộ đều đã nối mạng, hiện có 200 máy tính nối mạng, hiện đang được nghiên cứu để chia thành VLAN
Hệ thống cáp nối UTP Cat5, tối độ 10/100Mbps Kiểu kết nối mạng hình sao (FastEthernet, Wireless)
Hệ thống mạng bao gồm một Switch trung tâm 3550-12G và mười Switch 2950 Đường truyền được thiết lập với một đường Leased line 512 Kb từ FPT, một đường ADSL (IP động) từ Bưu điện Hà Nội, một đường SHDSL (có một IP tĩnh) từ Cục Bưu điện Trung ương, và một đường ISDN kết nối với CPNet.
Trung tâm tích hợp dữ liệu: 12 máy chủ, 02 Firewall, 01 router
Có 5 máy chủ sử dụng Windows Server 2003, 02 máy sử dụng Linux,
03 máy trạm cài chương trình máy chủ Linux làm Gateway
Các máy trạm: Windows XP, Windows Vista và Office XP, Office 2003, Office 2007
Hình 2: Mô hình mạng cơ quan Cục Đường sông
Mạng LAN: Tại cơ quan Cục đã hình thành mạng LAN gồm 31 máy tính nối mạng Hệ thống cáp nối UTP Cat5, tối độ 10/100Mbps
Thiết bị mạng: 02 Switch 2950 và 3 hub Đường truyền: Kết nối ra Internet thông qua đường truyền của cơ quan Bộ
Máy chủ: có 1 máy chủ Compaq ML370
Máy chủ sử dụng Windows Server 2000
Các máy trạm: Windows XP, Windows Vista và Office XP, Office 2000, Office 2007
Hình 3: Mô hình mạng cơ quan Cục Đường Sắt
Mạng LAN: Tại cơ quan Cục đã hình thành mạng LAN gồm
37 máy tính nối mạng Hệ thống cáp nối UTP Cat5, tối độ 10/100Mbps
Thiết bị mạng: Switch SureCom (EP-8240R-FS) 24 port 10/100Mbps, modem ADSL Đường truyền: có 01 đường MEGA VNN Nhà cung cấp dịch vụ VNN
Máy chủ: có 01 máy chủ
Phần mềm ứng dụng: Hiện đang sử dụng hệ thống thư điện tử của
Bộ Giao thông Vận tải với trên 30 tài khoản
Máy chủ sử dụng Windows Server 2000
Các máy trạm: Windows XP, Windows Vista và Office XP, Office 2000, Office 2007
Hình 4: Mô hình mạng Cục đường bộ
Mạng LAN: Tại cơ quan Cục đã hình thành mạng LAN gồm
80 máy tính nối mạng Hệ thống cáp nối UTP Cat5, tối độ 10/100Mbps
Thiết bị mạng: Hub, Router Đường truyền: Có 01 đường Lease line 128 Kbps, ADSL Nhà cung cấp dịch vụ Viettel
Mạng diện rộng: nối với 64 sở Giao thông công chính thông qua Internet
Máy chủ: có 04 máy chủ
Máy chủ sử dụng Windows Server 2000, Windows Server 2003
Các máy trạm: Windows XP, Windows Vista và Office XP, Office 2000, Office 2007
Hình 5: Mô hình mạng Cục Hàng không
Mạng LAN: gồm 100 máy tính nối mạng Hệ thống cáp nối UTP Cat5, tối độ 10/100Mbps Kiểu kết nối mạng hình sao (FastEthernet, Wireless)
Thiết bị mạng: Switch trung tâm 6509, và các switch 2950 Đường truyền: Có 01 đường ADSL (IP động) Nhà cung cấp dịch vụ VDC
Trung tâm tích hợp dữ liệu: có 04 máy chủ
Máy chủ sử dụng Windows Server 2000, Windows Server 2003
Các máy trạm: Windows XP, Windows Vista và Office XP, Office 2000, Office 2007
Hình 6 : Mô hình mạng Cục Đăng kiểm
Có 630 máy PC đang sử dụng
Mạng LAN: Tại cơ quan Cục đã có mạng LAN kết nối 250 máy tính
Hệ thống cáp nối UTP Cat5, tối độ 10/100Mbps
Thiết bị mạng: Switch trung tâm Cisco 4506, và các switch thường Đường truyền: Có 01 đường Lease line 256 Kbps, có IP tĩnh
02 đường ADSL, Nhà cung cấp dịch vụ VDC
Mạng diện rộng VPN thông qua Internet, sử dụng giải pháp Checkpoint và Web browse
Trung tâm Tích hợp dữ liệu: có 4 máy chủ
Máy chủ sử dụng Windows Server 2000, Windows Server 2003
Các máy trạm: Windows XP, Windows Vista và Office XP, Office 2000, Office 2007
Hình 7: Mô hình mạng Cục Hàng hải
Mạng LAN: Tại cơ quan Cục đã hình thành mạng LAN gồm 80 máy tính nối mạng Hệ thống cáp nối UTP Cat5, tối độ 10/100Mbps
The network infrastructure includes a central Cisco 3550 switch, a 3600 router, a 525 firewall, and additional standard switches Connectivity features a primary backbone link connecting the two centers in Hanoi and Ho Chi Minh City, along with two 512kbps Internet lines and several ADSL connections, all utilizing static IP addresses Major ports utilize 128kbps Frame Relay and ADSL services, provided by VDC.
Mạng diện rộng VPN thông qua nhà cung cấp dịch vụ VDC
Trung tâm Tích hợp dữ liệu: có 6 máy chủ
Máy chủ sử dụng Windows Server 2000, Windows Server 2003
Các máy trạm: Windows XP, Windows Vista và Office XP, Office 2000, Office 2007
Hiện đang sử dụng khoảng 60 máy tính
Các máy trạm: Windows XP, Windows Vista và Office XP, Office 2000, Office 2007
Phần mềm ứng dụng: Chưa có.
GIẢI PHÁP TÍCH HỢP DỮ LIỆU CỦA BỘ GIAO THÔNG VẬN TẢI
MỘT SỐ CÔNG NGHỆ XỬ LÝ CƠ S Ở DỮ LIỆU TRÊN MÔI TRƯỜNG MẠNG
Hiện nay, việc trao đổi thông tin đã vượt qua giới hạn về không gian và thời gian, nhờ vào sự phát triển của khoa học và chính sách của các quốc gia cũng như tổ chức Hệ thống mạng, đặc biệt là Internet, trở thành yếu tố thiết yếu cho mọi quốc gia và tổ chức Đồng thời, việc xử lý cơ sở dữ liệu trên môi trường mạng là một thách thức lớn và cũng là mục tiêu quan trọng của ngành công nghệ thông tin Bộ Giao thông Vận tải đã triển khai thành công hệ thống mạng WAN dựa trên công nghệ mạng riêng ảo (VPN - Virtual Private Network).
VPN (Mạng riêng ảo) cho phép mở rộng phạm vi mạng nội bộ qua Internet, kết nối máy chủ xa với mạng LAN của tổ chức Kỹ thuật này biến máy chủ xa thành một phần của mạng LAN, đồng thời đảm bảo kết nối giữa các máy tính trong mạng VPN an toàn như trong cùng một mạng LAN.
Các kênh truyền riêng ảo sẽ được thiết lập giữa các thiết bị đầu cuối thông qua Internet, cho phép nhân viên truy cập mạng LAN của đơn vị mọi lúc, mọi nơi, chỉ cần có kết nối Internet.
Trước đây, việc truy cập từ xa chủ yếu dựa vào giải pháp quay số (dial-up) hoặc thuê các đường truyền và kênh riêng trong dịch vụ truyền dữ liệu gói Tuy nhiên, những phương pháp này gặp phải nhiều hạn chế nhất định.
Thuê kênh riêng hoặc đường truyền riêng:
• Chi phí cho việc thuê đường truyền riêng hoặc kênh truyền riêng hiện nay là rất đắt
• Không thể đáp ứng việc kết nối từ mọi nơi, mọi lúc
• Khi số điểm kết nối tăng thì số kết nối cần thuê tăng lên rất nhiều
Giải pháp quay số từ xa:
• Giá thành khi thực hiện các cuộc quay số ngoại hạt cao
• Hạn chế bởi tốc độ đường truyền điện thoại thông thường 56Kbps
• Số lượng kết nối đồng thời hạn chế
VPN đem lại cho chúng ta rất nhiều lợi ích:
• Khả năng linh hoạt cao, có thể kết nối bất cứ khi nào, bất cứ nơi đâu, chỉ cần ở đó có thể truy cập Internet
• Giá thành rẻ, chỉ mất chi phí cho việc truy cập Internet thông thường
• Băng thông không bị hạn chế, chỉ phụ thuộc vào tốc độ đường truyền Internet
• Số lượng kết nối cùng lúc lớn
• Đảm bảo khả năng bảo mật cao với các cơ chế mã hóa
• Quản lý các kết nối dễ dàng thông qua các tài khoản người dùng
Hình 8: Sơ đồ mạng VPN điển hình
VPN mã hóa dữ liệu và truyền tải gói tin từ một hệ thống đến hệ thống khác qua Internet, mang lại sự riêng tư cho người dùng Nó tạo ra một kênh an toàn, cho phép các đơn vị và nhân viên làm việc từ xa truy cập tài nguyên của trung tâm một cách bảo mật, giống như đang sử dụng máy tính cục bộ trong mạng của cơ quan.
2.1.1.2 Các lo ạ i hình d ị ch v ụ VPN trên th ị tr ườ ng
Hai loại hình VPN được sử dụng là: VPN tin cậy (trusted VPN) và VPN an toàn (secure VPN)
Mạng VPN tin cậy do các nhà cung cấp dịch vụ viễn thông quản lý, đảm bảo thông tin của người dùng được định tuyến an toàn mà không đi qua mạng đối thủ Khách hàng không cần đầu tư thiết bị, vì nhà cung cấp sẽ quản lý toàn bộ, nhưng điều này đồng nghĩa với việc họ phải trả phí dịch vụ cao và phụ thuộc hoàn toàn vào nhà cung cấp Hơn nữa, khách hàng có rất ít lựa chọn về cấu hình thiết bị và không thể chủ động trong việc triển khai VPN Mặc dù chi phí đầu tư ban đầu thấp, nhưng tổng chi phí sẽ cao hơn theo thời gian, dẫn đến việc ngày càng ít cơ quan lựa chọn dịch vụ này.
Mạng VPN an toàn giúp bảo vệ sự lưu thông và riêng tư của người dùng trên internet, đồng thời đảm bảo tính toàn vẹn dữ liệu thông qua các thuật toán mã hóa Người dùng có thể tự quản lý hoặc sử dụng dịch vụ từ nhà cung cấp Giao thức IPSec (IP Security) là tiêu chuẩn công nghiệp cho các mạng VPN an toàn và được hầu hết các nhà cung cấp hỗ trợ hiện nay.
2.1.1.3 Các hình th ứ c thông d ụ ng c ủ a VPN
Cấu hình phổ biến của mạng VPN bao gồm một mạng nội bộ trung tâm và các điểm truy cập từ xa, như văn phòng hoặc nhân viên làm việc tại nhà, để truy cập vào mạng trung tâm Ngoài ra, VPN cũng có thể kết nối hai mạng ở hai địa điểm khác nhau nhưng thuộc cùng một tổ chức thành một mạng logic Có ba khả năng thiết lập mạng VPN.
Hình 9: Ba loại mạng riêng ảo
Trạm tới trạm (Site to site) là giải pháp lý tưởng cho các tổ chức có nhiều văn phòng chi nhánh, cho phép các văn phòng trao đổi dữ liệu một cách an toàn và hiệu quả Giải pháp này tạo ra một đường truyền riêng trên mạng Internet, hỗ trợ tối ưu cho quá trình truyền thông giữa các chi nhánh.
Hình 10: Mô hình kết nối VPN trạm tới trạm
Truy cập từ xa (Remote-Access)
Hay còn được gọi là mạng riêng ảo quay số (VPDN - Virtual Private Dial-up Network), là một hình thức kết nối VPN cho phép nhân viên từ xa truy cập vào mạng riêng của cơ quan Đây là một phương pháp giảm cấp so với mô hình kết nối site to site, phục vụ nhu cầu kết nối an toàn từ bên ngoài.
Kiểu thiết lập này cho phép một máy tính truy cập vào mạng được mã hóa và xác thực, hỗ trợ người làm việc từ xa, làm việc tại nhà, hoặc khi nhân viên cần kết nối an toàn vào mạng của cơ quan trong quá trình công tác Nhà cung cấp dịch vụ sẽ cài đặt công nghệ NAS (Network Access Server) và cung cấp phần mềm cho người dùng ở xa trên mỗi máy tính của họ.
Hình 11: Mô hình kết nối VPN kiểu Remote Access
Trong một số tổ chức, việc bảo mật dữ liệu giữa các bộ phận là rất quan trọng, và hệ thống Intranet VPN chính là giải pháp hiệu quả cho tình huống này Hệ thống này cho phép truyền thông tin giữa hai máy chủ thuộc hai mạng khác nhau một cách an toàn thông qua việc mã hóa dữ liệu Khác với các mô hình truyền thông khác, chỉ có hai máy chủ được phép trao đổi thông tin đã được mã hóa, đảm bảo tính riêng tư và bảo mật cao cho thông tin nội bộ.
Hình 12: Mô hình hai máy chủ trao đổi thông tin qua VPN
2.1.2 Một số phương pháp truyền thống khai thác dữ liệu dựa trên Web
2.1.2.1 Ph ươ ng pháp Java Socket
Hình 13: Mô hình truy nhập cơ sở dữ liệu Web bằng Java Socket
Ngôn ngữ lập trình Java hỗ trợ hai loại ứng dụng chính: ứng dụng độc lập và ứng dụng nhúng (Java applet) Java applet có thể được tải xuống từ máy chủ qua trình duyệt và thực thi trên máy khách Tuy nhiên, do tính bảo mật của Java, máy ảo Java hạn chế quyền truy cập của applet vào tài nguyên cục bộ như cơ sở dữ liệu trên máy chủ Để truy cập cơ sở dữ liệu từ xa qua trình duyệt và nhận kết quả, cần có một thành phần trung gian giữa máy khách và cơ sở dữ liệu Thành phần trung gian này là một chương trình ứng dụng độc lập trong phương pháp Java socket.
Hoạt động của mô hình truy nhập cơ sở dữ liệu thông qua Web bằng phương pháp Java socket thực hiện qua những bước sau :
1 Máy khách truy nhập vào máy chủ Web thông qua trình duyệt Web, trang Web và ứng dụng Java applet có chức năng truy nhập cơ sở dữ liệu từ máy chủ Web được tải về máy khách
2 Ứng dụng Java applet truy cập cơ sở dữ liệu được khởi động tại máy khách bởi người dùng và kết nối tới thành phần trung gian trên máy chủ Web, khi kết nối thành công thì máy khách gửi yêu cầu truy cập dữ liệu cho thành phần trung gian trên máy chủ Web
XÂY DỰNG KHO DỮ LIỆU
Dựa trên lịch sử tính toán của người dùng cuối, người ta đã đưa ra định nghĩa về những thành phần hợp nên kho dữ liệu
Kho dữ liệu là một hệ thống lưu trữ duy nhất, cung cấp dữ liệu đầy đủ và nhất quán, được thu thập từ nhiều nguồn khác nhau để phục vụ nhu cầu của người dùng trong các hoạt động nghiệp vụ của họ.
Đạt được sự đầy đủ và nhất quán của dữ liệu trong hệ thống thông tin hiện nay là một thách thức lớn Để hỗ trợ và kiểm soát quá trình thực hiện, cần hiểu rõ chiến lược nghiệp vụ và các dữ liệu thiết yếu Lập mô hình công ty, với sự tham gia tích cực của người dùng, là bước khởi đầu quan trọng trong các dự án kho dữ liệu Việc xác định dữ liệu cần thiết chỉ là bước đầu; dữ liệu đến từ nhiều nguồn và dạng khác nhau, cần được kết hợp theo mô hình tổ chức Để chuyển đổi dữ liệu thành thông tin có thể sử dụng, các phân tích sẽ được thực hiện trong bước mô hình hóa Cuối cùng, yêu cầu của người dùng là lập chỉ mục và chú giải để hỗ trợ quá trình tìm kiếm và sử dụng thông tin hiệu quả.
Người dùng cần một bộ công cụ phân tích để khai thác và sử dụng thông tin có sẵn Công cụ này tạo ra giao diện giữa người dùng và dữ liệu, giúp chuyển đổi dữ liệu thô thành thông tin hữu ích.
Một số định hướng quản lý dựa trên thông tin:
Nguồn thông tin duy nhất
Thông tin thô được thu thập từ nhiều nguồn khác nhau, bao gồm cả bên ngoài tổ chức, dưới nhiều hình thức từ dữ liệu có cấu trúc đến phi cấu trúc Trước khi cung cấp cho người dùng, dữ liệu này cần được xử lý để loại bỏ lỗi và đảm bảo tính tương thích, nhằm duy trì tính tích hợp của thông tin Sau khi được xử lý, thông tin này trở thành nguồn duy nhất cho hệ quản lý dựa trên thông tin.
Khả năng phân tán thông tin
Hệ quản lý thông tin hiện đại không chỉ hoạt động tại trụ sở chính mà còn được phân bổ rộng rãi trong tổ chức và khu vực Đòi hỏi về việc lưu trữ thông tin là phải độc lập nhưng vẫn kết nối logic, nhằm nâng cao khả năng lưu động, hiệu quả và bảo mật Điều này cho thấy rằng các địa điểm lưu trữ không nhất thiết phải liên kết trực tiếp với nguồn dữ liệu thô.
Thông tin trong phạm vi nghiệp vụ
Người dùng có thể hiểu và sử dụng thông tin khi nó nằm trong phạm vi nghiệp vụ của họ Định nghĩa dữ liệu do chuyên gia cung cấp cần trở thành tiêu chuẩn, cùng với các chỉ mục thông tin chứa những định nghĩa này, nhằm hướng đến người dùng và biến họ thành nguồn cung cấp định nghĩa dữ liệu, kể cả cho bộ phận hệ thống thông tin.
Tự động hóa truyền dữ liệu
Khi dữ liệu được chuyển đổi thành thông tin và truyền giữa các tổ chức qua những phương thức ngày càng phức tạp, cần thiết phải có một cơ chế tự động hóa quá trình này Yêu cầu tự động không chỉ áp dụng cho việc chuyển tin mà còn cho việc định nghĩa các phương thức chuyển và biến đổi dữ liệu Đặc biệt, cơ chế tự động hóa cần phải đảm bảo khả năng tương thích với các hệ thống thông tin phân tán.
Chất lượng và sở hữu thông tin
Thông tin là tài sản quý giá của công ty, vì vậy cần phải được quản lý và bảo vệ cẩn thận như các tài sản khác Quyền sở hữu thông tin đóng vai trò then chốt trong việc nhận thức và đánh giá giá trị của nó.
Dữ liệu được hiểu là sự biểu diễn thông tin nghiệp vụ trên máy tính và có thể được phân loại theo nhiều cách khác nhau Khi xác định phạm vi của kho dữ liệu, ba điểm quan trọng cần lưu ý là ý nghĩa (meaning).
Dữ liệu có thể mang ý nghĩa hoặc đại diện cho điều gì đó có giá trị, và sự phân biệt này là nguyên tắc cơ bản nhưng cũng rất phức tạp Giá trị của dữ liệu nằm trong nội dung của nó hơn là những gì nó thể hiện, do đó, chúng được gọi là dữ liệu thành phẩm, được tạo ra và trao đổi như sản phẩm, ví dụ như phim, ảnh và sách dưới dạng số hóa Cuối cùng, siêu dữ liệu mô tả ý nghĩa của dữ liệu, định nghĩa hoặc mô tả dữ liệu nghiệp vụ hoặc dữ liệu thành phẩm.
Dữ liệu có thể có cấu trúc ở mức độ cao (trường và các bản ghi) hoặc phi cấu trúc
Dữ liệu có thể được phân loại thành hai loại: dữ liệu cá nhân, nơi chủ sở hữu có quyền thay đổi tùy ý, và dữ liệu công cộng, được chia sẻ giữa một nhóm người, yêu cầu giám sát chặt chẽ cho bất kỳ sự thay đổi nào.
Ba mô ựa trên kinh ên lý thuy
Các tầng dữ hực hiện nà ủa nó [10].
Quan đ ưu trữ một ược đối xử
Hình kiến trúc dữ liệu là một yếu tố quan trọng trong việc thiết kế hệ thống thông tin Ba loại dữ liệu chính bao gồm dữ liệu thực tế, dữ liệu ảo và dữ liệu mức độ trừu tượng Các dữ liệu này đóng vai trò quan trọng trong việc xác định cấu trúc của hệ thống, giúp đảm bảo tính chính xác và hiệu quả trong việc xử lý thông tin.
Hình 21 kiểu dữ liệu hiệp vụ u mô tả dướ phát triển từ ợc đặt tên hái niệm hơ nh bởi kiểu kiến trúc m có sự phân
1: Kiến trúc u và phạm v ới đây có m ừ thực tế, ch n theo số l ơn là mức u dữ liệu c một tầng l n biệt giữa c dữ liệu mộ vi kho dữ liệ một điểm chu húng không ượng tầng vật lý Do chứ không là phần tử a các kiểu d ệu ung: Chúng g rõ ràng nh g dữ liệu c o đó trong phải bởi v g hoàn toàn hư kiến trúc của chúng. bất kỳ sự vị trí vật lý n c ự ý dữ liệu bấ dữ liệu, tất ất kỳ được cả dữ liệu c u ột tầng b Kiến trúc dữ liệu hai tầng:
Cải tiến kiến trúc một tầng dựa trên hai nhu cầu sử dụng dữ liệu khác nhau: tác nghiệp và thông tin Dữ liệu được phân chia thành hai tầng, với tầng thấp phục vụ cho các ứng dụng tác nghiệp trong chế độ đọc/ghi, sử dụng dữ liệu thời gian thực Trong khi đó, tầng cao cung cấp dữ liệu dẫn xuất cho các ứng dụng thông tin.
Dữ liệu dẫn xuất đơn giản có thể là bản sao trực tiếp của dữ liệu thời gian thực hoặc được tạo ra từ dữ liệu thời gian thực thông qua một số phép tính toán.
MÔ HÌNH TÍCH HỢP DỮ LIỆU BỘ GIAO THÔNG VẬN TẢI
Hiện nay, có nhiều giải pháp cho bài toán công nghệ thông tin, nhưng việc lựa chọn phương pháp phù hợp phụ thuộc vào hạ tầng kỹ thuật, quy định pháp lý và định hướng của từng cơ quan Đối với các cục quản lý chuyên ngành thuộc Bộ Giao thông Vận tải, những đơn vị đã được trang bị hệ thống thông tin hiện đại và hoạt động hiệu quả, việc phát triển các ứng dụng sử dụng Web service để trao đổi thông tin là giải pháp tối ưu Để triển khai Web service cho các ứng dụng, cần xem xét nền tảng công nghệ mà Web service đó dựa trên.
Dựa trên hạ tầng viễn thông hiện có, Bộ Giao thông Vận tải đã thiết lập mạng WAN thông qua các kết nối VPN từ Trung tâm tích hợp dữ liệu tới các Cục quản lý chuyên ngành Hệ thống kết nối này tạo điều kiện cho việc phát triển ứng dụng tích hợp dữ liệu, giúp quản lý hiệu quả hơn bằng cách tập trung thông tin từ các cục chuyên ngành về Trung tâm tích hợp dữ liệu của Bộ.
Trong hệ thống WAN của Bộ Giao thông Vận tải, các Cục quản lý chuyên ngành đã thiết lập kết nối Internet và VPN Tuy nhiên, hệ thống máy chủ cơ sở dữ liệu tại mỗi địa điểm lại khác nhau, với thiết kế mạng đa dạng về quy mô và đường truyền vật lý Nhiệm vụ đặt ra là thiết kế một phương thức thu thập thông tin từ các máy chủ cơ sở dữ liệu, đảm bảo khả năng truy xuất dữ liệu mà không phụ thuộc vào hệ quản trị cơ sở dữ liệu hay hệ điều hành cụ thể nào.
Dịch vụ web cho phép trao đổi thông tin qua giao thức HTTP và SOAP, giúp kết nối các trung tâm thông qua Internet hoặc VPN một cách dễ dàng Điều này mang lại sự linh hoạt, không phụ thuộc vào hạ tầng kỹ thuật hay công nghệ thông tin của từng đơn vị.
Hình 24: Mô hình kết nối mạng từ trung tâm Tích hợp dữ liệu của Bộ Giao thông vận tải đến các cục quản lý chuyên ngành.
TRUY CẬP CƠ SỞ DỮ LIỆU TẠI CÁC CỤC CHUYÊN NGÀNH
Mỗi Cục quản lý chuyên ngành sẽ thiết lập một Web service để truy cập cơ sở dữ liệu cục bộ nhằm lấy thông tin Việc trao đổi dữ liệu giữa các trung tâm diễn ra qua HTTP và SOAP, chỉ cần có một định danh cho Web service đó.
- IP tĩnh, động do ta chọn kiểu kết nối qua VPN;
- Tên miền Internet nếu dùng đường Leased line
Hình 25: Mô hình truy cập dữ liệu tại các đơn vị cơ sở
Web service xây dựng các phương thức để truy cập và lấy thông tin từ máy chủ cơ sở dữ liệu Mỗi loại hệ quản trị cơ sở dữ liệu có cách thức truy cập riêng, và mọi hoạt động này diễn ra trong phạm vi tổ chức (mạng LAN) Dữ liệu mà Web service nhận được là kết quả của các truy vấn vào cơ sở dữ liệu nội bộ, sau đó được trả về qua giao thức HTTP hoặc SOAP.
Để tổng hợp thông tin về tàu biển theo số IMO hoặc số hiệu tàu, cần truy cập cơ sở dữ liệu tại Cục Hàng hải và Cục Đăng kiểm.
Tại Web service của Cục Hàng hải ta xây dựng một số các phương thức như:
Getportlist(): Để lấy danh sách cảng
GetMasterofVessel(): Lấy danh sách các chủ tàu
GetVesselList(): Lấy danh sách tàu
GetSailorList(): Lấy danh sách thuyền viên
GetVesselToPort(): Lấy danh sách tàu ra vào cảng
GetGoods(): Lấy số lượng hàng qua cảng
Tại Web service ở Cục Đăng Kiểm
GetVesselRegisterList(): Lấy thông tin đăng kiểm của tàu
Toàn bộ thông tin lấy được tích hợp thành cơ sở dữ liệu Tàu biển đặt tại Trung tâm tích hợp dữ liệu của Bộ
Hình 26: Mô hình trao đổi thông tin từ Web service với CSDL cục bộ
Vậy, ta thấy có một số ưu nhược điểm sau: Ưu điểm:
1 Bên yêu cầu lấy thông tin thông qua giao thức chung HTTP, SOAP nên không phụ thuộc vào hạ tầng hệ thống thông tin của các trung tâm cơ sở (bao gồm hệ quản trị cơ sở dữ liệu và hệ điều hành)
2 Bên yêu cầu chỉ nhận được thông tin do Web service trả về nên ta có thể tinh giản được lượng dữ liệu trước khi truyền trên Internet
3 Sự an toàn của máy chủ cơ sở dữ liệu được đảm bảo do bên yêu cầu không phải kết nối trực tiếp vào máy chủ cơ sở dữ liệu, dữ liệu đi qua tầng trung gian là Web service và có thêm chế độ bảo mật của chính Web service
4 Web service được xây dựng dễ dàng bằng nhiều ngôn ngữ lập trình như: PHP, ASP.NET, C#, VB.NET,…
1 Phụ thuộc vào tốc độ đường truyền Internet
2 Nếu thay đổi yêu cầu nghiệp vụ thì phải thay đổi các phương thức của Web service.