Mô hình dữ liệu: Raster và Vector

Chương II GIS VÀ THẾ GIỚI THỰC

2.5. Mô hình dữ liệu: Raster và Vector

Con người nhận thức hiện tượng thực tế qua hình dáng bên ngoài, để chuyển chúng vào máy tính người ta cấu trúc hình dạng đó theo một trong 2 cách: Raster và Vector (Bernhardsen,1999).

Hình 2.3: Mô hình Raster và mô hình Vector 2.5.1 Mô hình Raster

Trong mô hình raster, chúng ta chia thế giới thực ra làm những điểm lưới. Các điểm lưới có thể mang một giá trị thuộc tính nào đó dựa trên một hoặc vài hệ thống mã hoá. Trường hợp mã hoá đơn giản nhất là nhị phân (binary encoding), ví dụ như việc xuất hiện (1) hay không xuất hiện (0) thảm thực vật; nhưng ở ví dụ khác thì hệ thống điểm nổi (floating points) sẽ được sử dung, ví dụ như độ cao của điểm lưới so với mặt biển. Trong model này, mỗi một loại thông tin chủ đề được lưu như một lưới (grid) riêng.

Hãy xét một lớp thông tin có cấu trúc raster. Trên hình vẽ 2.4 là một thể hiện bản đồ đất.

mỗi vùng được đánh dấu bằng các ô theo các giá trị khác nhau. Ta có được một lưới các ô có giá trị khác nhau. Nếu gắn nước giá trị = 1, rừng = 2, đất nông nghiệp = 3 ta sẽ có một mảng số liệu từ các giá trị 1,2,3:

Hình 2.4: Biểu diễn raster dữ liệu theo lưới điểm

Hai cấu trúc lưu trữ raster cơ bản là cấu trúc lưu mã chi tiết (exhaustive enumeration) và cấu trúc lưu mã chạy dài (run-length encoding). Đối với cấu trúc lưu mã chi tiết, mỗi một điểm lưới được gắn với 1 giá trị duy nhất, vì vậy ở đây dữ liệu không được nén gọn. Còn cấu trúc lưu mã chạy dài có ý nghĩa như là một kỹ thuật nén dữ liệu nếu raster chứa các nhóm điểm lưới có cùng một giá trị. Khi đó thay vì phải lưu trữ riêng cho từng điểm lưới, cấu trúc này lưu trữ theo từng thành phần có một giá trị duy nhất và số lượng điểm lưới chứa đựng giá trị đó. Nếu tất cả các điểm lưới đều có các giá trị khác nhau thì cấu trúc này làm tăng gấp đôi bộ nhớ, tuy nhiên nếu có 2 hoặc hơn số điểm lưới trùng giá trị thì cấu trúc này làm giảm bộ nhớ. Nếu càng có nhiều điểm lưới liên tục có giá trị giống nhau thì mức độ nén càng đạt được cao. Cấu trúc này đặc biệt thích hợp cho việc mã hoá ảnh đơn sắc hoặc ảnh nhị phân (Zerger, 2000).

Hình 2.5: Cấu trúc Raster – Lưu mã chi tiết (Exhaustive representation)

Hình 2.6: Cấu trúc Raster – Lưu mã chạy dài ( Run-length encoding)

2.5.2. Mô hình Vector

Trong mô hình Vector, dữ liệu được thể hiện bởi các đường hoặc cung định vị bởi các điểm đầu và cuối và giao nhau tại các điểm nút (node). Vị trí của các điểm nút này và mối quan hệ topo được lưu trữ một cách rõ ràng. Các đối tượng được xác định bởi ranh giới của chúng và các đường cong được thể hiện như là một chuỗi các cung nối nhau. Trong vector GIS các đối tượng địa lý được thể hiện một cách rõ ràng và kèm theo chúng là các thuộc tính chủ đề.

Có những phương pháp khác nhau để tổ chức cơ sở dữ liệu 2 mặt này (mặt không gian và mặt thuộc tính chủ đề). Thông thường, hệ thống vector bao gồm 2 thành phần: thành phần quản

lý dữ liệu không gian và thành phần quản lý dữ liệu chuyên đề. Hệ thống này được gọi là hệ thống tổ chức hybrid.

Hình 3.7: Mô hình Vector

Trong mô hình vector, dữ liệu địa lý được thể hiện dưới dạng các toạ độ. Các đơn vị cơ bản của thông tin không gian là điểm, đường (cung) và vùng. Mỗi một đơn vị này được cấu thành bởi một chuỗi một hoặc nhiều điểm có toạ độ, ví dụ như đường là một tập hợp các điểm có liên quan đến nhau, còn vùng là tập hợp các đường có liên quan đến nhau.

Toạ độ là cặp số thể hiện khoảng cách nằm ngang theo dọc theo trục trực giao, hoặc là bộ ba số thể hiện các khoảng cách nằm ngang và thẳng đứng. Toạ độ thường thể hiện vị trí của bề mặt trái đất tương đối với các vị trí khác.

Điểm dùng để khái quát cho một đối tượng bởi toạ độ x/y của chúng. Điểm dùng để thể hiện cho đối tượng quá nhỏ không đủ để có thể hiện bằng đường hoặc vùng (ví dụ như vị trí của công trình trên một bản đồ tỷ lệ nhỏ).

Đường là tập hợp các toạ độ thể hiện hình dạng đối tượng địa lý mà quá hẹp để có thể được hiển thị như là một vùng tại mức tỷ lệ cho trước (ví dụ như đường đồng mức, tâm điểm đường giao thông, sông rạch,v.v…), hoặc là các đối tượng đường không gắn liền với diện tích (ví dụ như ranh giới vùng hành chính). Khái niệm đường và cung (arc) trong GIS là một.

Vùng được dùng để thể hiện đối tượng có diện tích. Vùng được xác định bởi các đường tạo thành đường bao của nó và một điểm bên trong để làm nhiệm vụ nhận dạng. Vùng thường đi

kèm với thuộc tính mô tả đối tượng địa lý mà nó thể hiện.

Điểm Đường Vùng

Hinh 2.8: Minh hoạ đối tượng địa lý trong GIS

Có vài mô hình lưu trữ và quản lý thông tin vector. Mỗi một mô hình đều có các ưu điểm và nhược điểm riêng. Các mô hình lưu trữ điển hình gồm (Burrough & McDonnell, 1998):

a) Cấu trúc liệt kê toạ độ 'spaghetti' b) Cấu trúc từ điển vertex

c) Cấu trúc mã hoá đôi độc lập bản đồ DIME d) Cấu trúc cung/nút ARC/NODE

Hình 2.9: Cấu trúc liệt kê toạ độ a) Cấu trúc liệt kê toạ độ 'spaghetti':

• Đơn giản

• Dễ quản lý

• Không chứa đựng được quan hệ topo

• Nhiều trùng lặp, vì vậy chiếm nhiều bộ nhớ

• Thường dùng trong CAC (bản đồ học vi tính)

Hình 2.10: Cấu truc từ điển vertex b) Cấu trúc từ điển vertex (Vertex dictionary):

• tránh được trùng lắp, nhưng vẫn không có quan hệ topo

Hình 2.11: Cấu trúc mã hoá đôi

c) Cấu trúc mã hoá đôi độc lập bản đồ (Dual Independent Map Encoding- DIME):

Hình 2.12: Cấu trúc cung/nút (ARC/NODE)

. d) Cấu trúc cung/nút (ARC/NODE)

Cấu trúc cung/nút (Arc/Node) lần đầu tiên được phát triển đề dùng trong tổng điều tra dân số Hoa Kỳ năm 1980 dưới dạng khởi điểm là cấu trúc mã hoá đôi độc lập bản đồ DIME. Trong cấu trúc này cung (acr) là đơn vị cơ bản nhất trên bản đồ. Hình dạng và chiều dài của cung được xác định bởi vị trí của các nút (node) và điểm rẽ (vertice).

Điểm nút khác biệt với điểm rẽ ở chỗ điểm nút là một đối tượng chứa quan hệ topo còn điểm rẽ chỉ là một đối tượng điểm đơn giản xác định bởi toạ đô x/y mà không chứa đựng mối quan hệ topo nào.

Hướng của cung được ghi rõ ràng theo thứ tự của những điểm nút đầu và cuối. Với hướng xác định thì hai bên (phải, trái) cũng được xác định.

Tệp thông tin lưu trữ tất cả các thông tin cần thiết về cung, bao gồm:

1. Mã khoá cung

2. Mã khoá điểm nút đầu 3. Mã khoá điểm nút cuối

4. Mã khóa vùng ở phía bên phải của cung 5. Mã khoá vùng ở phía bên trái của cung 6. Toạ độ X/Y của điểm nút đầu, điểm nút cuối 7. Toạ độ X/Y của tất cả các điểm rẽ

Điểm nút chứa đựng thông tin topo quan trọng vì nó là điểm giao nhau của các đối tượng đường. Trong cấu trúc dữ liệu Arc/Node thì đối tượng điểm cũng có thể được coi như một đường với điểm nút đầu và cuối có cùng một toạ độ X/Y.

Quan hệ topo có ý nghĩ quan trọng sau đây (Demers,1997):

a) Cho phép thực hiện các phép phân tích mà đòi hỏi thông tin về sự kết nối giữa các phần tử đường;

b) Cho phép thực hiện các quá trình cần sử dụng dữ liệu về tính thứ tự của các đối tượng đường;

c) Cho phép xác định tính chất của các đơn vị vùng kề sát;

d) Cho phép tự động hoá một số quá trình phát hiện lỗi;

e) Làm thuận tiện hơn các phép tìm kiếm trong các bài toán vùng lân cận (neighbourhood);

f) Làm thuận tiện hơn việc truy cập các phần tử thuộc tính gắn liền với dữ liệu;

g) Làm thuận tiện cho quá trình liên kết các đơn vị không gian nhỏ thành các đơn vị lớn hơn;

h) Làm nền tảng cho việc tự động hoá các phép ghép mảnh và chuyển đổi bản đồ.

Các hệ thống thu nhận

Các phương pháp biến đổi ảnh