Cài đặt chương trình

Một phần của tài liệu Nghiên cứu khai phá luật kết hợp trong cơ sở dữ liệu địa l (Trang 68 - 75)

LUẬT KẾT HỢP KHÔNG GIAN

CHƯƠNG 3: CÀI ĐẶT CHƯƠNG TRÌNH THỬ NGHIỆM

3.5. Cài đặt chương trình

Lược đồ CSDL lưu trữ quan hệ CSDL gọi là geometry_columns được tạo ra trong quá trình tạo CSDL và tự động thể hiện khi dữ liệu địa lý được nạp vào lần đầu. Quan hệ này lưu trữ tất cả các đặc trưng của CSDL địa lý bao gồm: tên lược đồ, tên các bảng quan hệ, tên các cột dữ liệu hình học và kiểu tương ứng của chúng theo chuẩn OGC như hình 3.2.

d) GEOMETRY_COLUMNS

F_table_schema F_table_name F_geometry_column Type SRID

Public Duong Shape Multiline -1

Public NguonNuoc Shape Multiline -1

Public SieuThi Shape Point -1

Hình 3.3: Cấu trúc lưu trữ dữ liệu địa lý trong OGC 3.5.2. Mô đun tiền xử lý dữ liệu không gian

Trong môi trường Weka Explorer, nút OpenDB cho phép người dùng thực hiện kết nối tới CSDL OGC bằng phương pháp JDBC. Nút Dữ liệu địa lý được bổ xung để thực hiện tiền xử lý dữ liệu địa lý, tạo ra các file định dạng .arff.

Hình 3.4: Giao diện kết nối CSDL

a) Duong

Gid Name Shape

1 Trần Duy Hưng Multiline[(x1,y1),(x2,y2),...]

2 Bưởi Multiline[(x1,y1),(x2,y2),...]

b) NguonNuoc

Gid Name Shape

1 Hồ Hoàn Kiếm Multiline[(x1,y1),(x2,y2),...]

2 Sông Tô Lịch Multiline[(x1,y1),(x2,y2),...]

c) SieuThi

Gid Name Shape

1 Big C Thăng Long Point[(x1,y1)]

2 Plaza Tràng Tiền Point[(x1,y1)]

Khi người dung bấm vào nút Dữ liệu địa lý thì giao diện của mô đun tiền xử lý dữ liệu địa lý xuất hiện.

Hình 3.5: Giao diện tiền xử lý dữ liệu địa lý

Người dùng bấm vào nút tải... để tải lược đồ CSDL, sau đó chọn đối tượng đích và các đối tượng liên quan. Weka-geo cho phép người dùng tạo các phụ thuộc địa lý giữa đối tượng đích và các đối tượng liên quan hoặc giữa các đối tượng liên quan với nhau bằng cách tíc vào ô checkbox để kích hoạt nút Tạo phụ thuộc.

Khi người dùng bấm vào nút Tạo phụ thuộc thì giao diện tạo phụ thuộc xuất hiện cho phép thêm và xóa bỏ các phụ thuộc giữa các cặp đối tượng địa lý. Các cặp đối tượng địa lý có phụ thuộc sẽ được lưu lại trong file văn bản (dependences.txt)

trong thư mục data khi người dùng bấm vào nút Lưu. Nếu các phụ thuộc đã được tạo lần trước thì có thể được sử dụng cho các lần sau bằng cách bấm vào nút Tải...

Hình 3.6: Giao diện tạo các cặp phụ thuộc địa lý

Nếu người dùng không chọn phân cấp khái niệm thì hai mức khái niệm đối tượng địa lý và các trường hợp của nó sẽ tự động được tạo ra cho các quan hệ không gian: topo, giao và khoảng cách. Nếu phân cấp khái niệm được chọn thì chương trình sẽ quan tâm đến tất cả các phân cấp khái niệm được đưa ra trong CSDL.

Khi xét quan hệ khoảng cách chương trình cho phép người dùng nhập vào các giá trị cho khoảng cách rất gần và khoảng cách gần vì các thông số này chỉ mang tính chất tương đối và phụ thuộc vào từng ngữ cảnh.

Các quan hệ không gian đã được chọn giữa đối tượng đích và tất cả các đối tượng liên quan không có phụ thuộc với đối tượng đích sẽ được tính toán và lưu trữ trong các bảng tạm thời được tạo ra trong CSDL địa lý. Nếu không có quan hệ không gian nào giữa đối tượng đích và các đối tượng liên quan thì một message thông báo sẽ được đưa ra.

Hình 3.7: Message khi không tìm thấy quan hệ không gian

Nếu các kết nối không gian đã được thực hiện thì chương trình sẽ thực hiện chuyển đổi dữ liệu và tạo ra một file .arff tên là *_geographic_data.arff trong thư mục data. Trong đó, * là tên đối tượng đích. Các file .arff có thể có rất nhiều các cột thuộc tính đặc biệt là trong trường hợp sử dụng phân cấp khái niệm. Để tránh xảy ra lỗi trong file .arff tất cả các thuộc tính cũng như giá trị đều phải được tạo thành từ tập [A-Z, a-z, 0-9] và dấu “_”. Khi file .arff được tạo thì một message thông báo được đưa ra.

Hình 3.8: Message khi file .arff đã được tạo

3.5.3. Các thuật toán khai phá luật kết hợp không gian

Sau khi thực hiện tiền xử lý dữ liệu, dữ liệu địa lý sẽ được chuyển đổi thành các file *.arff là file dữ liệu đầu vào cho khai phá dữ liệu nên có thể áp dụng các thuật toán khai phá dữ liệu có trong Weka để khai phá các dữ liệu địa lý này. Ngoài ra, Weka-geo còn thêm vào thẻ Associate của Weka một thuật toán khai phá luật kết hợp không gian.

Hình 3.9: Giao diện thẻ Association các thuật toán khai phá luật kết hợp

Hình 3.10: Giao diện xuất kết quả của thuật toán khai phá luật kết hợp không gian

Một phần của tài liệu Nghiên cứu khai phá luật kết hợp trong cơ sở dữ liệu địa l (Trang 68 - 75)

Tải bản đầy đủ (DOC)

(86 trang)
w