1. Trang chủ
  2. » Luận Văn - Báo Cáo

nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện

79 686 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Tác giả Phạm Thị Hương
Người hướng dẫn PGS.TS. Đoàn Văn Ban
Trường học Đại học Thái Nguyên
Chuyên ngành Khoa học máy tính
Thể loại Luận văn thạc sĩ
Năm xuất bản 2012
Thành phố Thái Nguyên
Định dạng
Số trang 79
Dung lượng 2,27 MB

Cấu trúc

  • 1. Lý do chọn đề tài (9)
  • 2. Mục tiêu nghiên cứu (9)
  • 3. Phương pháp nghiên cứu (10)
  • 4. Tổng quan luận văn (10)
  • Chương 1: Tổng quan về XML và cơ sở dữ liệu quan hệ (11)
    • 1.1. Tổng quan về XML (11)
      • 1.1.1. Giới thiệu về XML (11)
      • 1.1.2. Mục tiêu ra đời của tài liệu XML (11)
      • 1.1.3. Các lợi ích khi sử dụng XML (11)
    • 1.2. Cấu trúc tài liệu XML (12)
      • 1.2.1. Định nghĩa tài liệu XML (12)
      • 1.2.2. Cấu trúc tài liệu XML (12)
      • 1.2.3. Các tài liệu cơ bản của tài liệu XML (0)
      • 1.2.4. Cấu trúc một tài liệu XML hợp khuôn dạng (22)
      • 1.2.5. Định nghĩa kiểu DTD (0)
      • 1.2.6. Lược đồ XML (0)
      • 1.2.7. Bảng định nghĩa kiểu CSS (0)
    • 1.3. Phân tích tài liệu XML theo DOM (28)
      • 1.3.1. Mô hình đối tượng tài liệu (0)
      • 1.3.2. Phân tích tài liệu XML theo mô hình đối tượng dữ liệu DOM (0)
    • 1.4. Cơ sở dữ liệu quan hệ (32)
      • 1.4.1. Hệ quản trị cơ sở dữ liệu (32)
      • 1.4.2. Mô hình dữ liệu quan hệ (33)
      • 1.4.3. Kiến trúc cơ sở dữ liệu quan hệ (34)
      • 1.4.4. Ràng buộc toàn vẹn cơ sở dữ liệu quan hệ (34)
    • 1.5. Kết luận chương 1 (36)
  • Chương 2: Chuyển đổi giữa cơ sở dữ liệu quan hệ và XML (37)
    • 2.1. Phương pháp luận (37)
      • 2.1.1. Cấu trúc, kiểu cơ chế của XML và lược đồ CSDL quan hệ (0)
      • 2.1.2. Mối quan hệ giữa một CSDL quan hệ và một tài liệu XML (41)
      • 2.1.3. Tên kiểu phần tử (41)
      • 2.1.4. Giá trị rỗng và giá trị mặc định (42)
      • 2.1.5. So sánh các quan hệ trong CSDL quan hệ và XML (43)
      • 2.1.6. Thứ tự kiểu phần tử trong lược đồ XML (0)
    • 2.2. Cơ chế chuyển một CSDL quan hệ thành một tài liệu XML (47)
      • 2.2.1. Phi chuẩn hóa các lược đồ quan hệ (0)
      • 2.2.2. Kết nối các CSDL đã phi chuẩn hóa (49)
      • 2.2.3. Ánh xạ một CSDL quan hệ thành một tài liệu XML (50)
    • 2.3. Chuyển một tài liệu XML sang một CSDL quan hệ (53)
      • 2.3.1. Phương pháp ánh xạ một tài liệu XML thành CSDL quan hệ (54)
      • 2.3.2. Phương pháp băm nhỏ hay phân tách các tài liệu XML (57)
    • 2.4. Thuật toán chuyển đổi giữa cơ sở dữ liệu quan hệ và XML (58)
      • 2.4.1. Biểu diễn tài liệu XML theo mô hình DOM (59)
      • 2.4.2. Biểu diễn tài liệu XML theo dạng bảng của CSDL quan hệ (60)
      • 2.4.3. Chuyển một CSDL quan hệ sang một tài liệu XML (61)
    • 2.5. Cài đặt thuật toán (61)
      • 2.5.1. Đọc tài liệu XML dưới dạng DOM (62)
      • 2.5.2. Chuyển đổi một tài liệu XML thành CSDL quan hệ (63)
      • 2.5.3. Chuyển một CSDL quan hệ thành một tài liệu XML (64)
    • 2.6. Kết luận chương 2 (68)
  • Chương 3: Thực nghiệm (69)
    • 3.1. Mô tả bài toán và giả thuyết (69)
    • 3.2. Yêu cầu hệ thống (70)
    • 3.3. Giao diện và một số chức năng của chương trình (70)
      • 3.3.1. Màn hình chính của hệ thống (70)
      • 3.3.2. Chức năng đăng nhập hệ thống (71)
      • 3.3.3. Chức năng nhập dữ liệu (71)
      • 3.3.4. Chức năng tìm kiếm thông tin (72)
      • 3.3.5. Chức năng báo cáo thống kê (73)
    • 3.4. Một số kết quả cài đặt thuật toán (73)
      • 3.4.1. Biểu diễn tài liệu XML theo dạng cây (73)
      • 3.4.2. Biểu diễn tài liệu XML dạng bảng (74)
      • 3.4.3. Chuyển CSDL sang tài liệu XML (0)
      • 3.4.4. Chuyển tài liệu XML sang CSDL quan hệ (0)
    • 3.5. Kết luận chương 3 (75)
  • KẾT LUẬN (10)
  • TÀI LIỆU THAM KHẢO (78)

Nội dung

Mục tiêu nghiên cứu

- Tìm hiểu về XML và cách định dạng các tài liệu XML

- Nghiên cứu XML để đơn giản hóa việc chia sẻ dữ liệu giữa các hệ thống khác nhau, đặc biệt là các hệ thống được kết nối với Internet

Nghiên cứu các thuật toán chuyển đổi giữa cơ sở dữ liệu quan hệ và cơ sở dữ liệu XML là một lĩnh vực quan trọng trong công nghệ thông tin Việc chuyển đổi từ cơ sở dữ liệu quan hệ sang XML giúp tối ưu hóa việc lưu trữ và truy xuất dữ liệu, trong khi chuyển đổi ngược lại từ XML về cơ sở dữ liệu quan hệ hỗ trợ cho việc quản lý và xử lý dữ liệu hiệu quả hơn Những thuật toán này đóng vai trò then chốt trong việc cải thiện khả năng tương tác và tích hợp dữ liệu giữa các hệ thống khác nhau.

Phương pháp nghiên cứu

- Nghiên cứu qua các tài liệu như: sách, các bài báo, thông tin trên các website và các tài liệu liên quan

- Phân tích, tổng hợp lý thuyết và giới thiệu các thuật toán chuyển đổi một cơ sở dữ liệu quan hệ sang dạng tài liệu XML và ngược lại

Ứng dụng ngôn ngữ lập trình C# trong môi trường ASP.NET được sử dụng để phát triển một chương trình demo về "Quản lý thư viện" tại Thư viện Trường Cao đẳng Công nghiệp Nam Định Chương trình này nhằm cải thiện quy trình quản lý sách và phục vụ nhu cầu tra cứu thông tin của sinh viên và giảng viên.

Tổng quan luận văn

Luận văn được cấu trúc theo hình thức từ trên xuống, với mỗi phần bắt đầu bằng những khái niệm cơ bản và quy định, giúp người đọc dễ dàng theo dõi Cách trình bày này dần dần đi sâu vào các vấn đề liên quan, tạo điều kiện cho việc thảo luận rõ ràng hơn.

Luận văn được trình bày trong 3 chương và phần kết luận

Chương 1: Tổng quan về XML và cơ sở dữ liệu quan hệ

Tài liệu XML có cấu trúc rõ ràng, bao gồm các thành phần như thẻ mở, thẻ đóng và nội dung giữa chúng Để định nghĩa kiểu tư liệu, DTD (Document Type Definition) được sử dụng nhằm xác định cấu trúc và quy tắc cho tài liệu XML Lược đồ (schema) cung cấp một cách thức chính xác hơn để xác định các thành phần và kiểu dữ liệu Mô hình đối tượng tài liệu (DOM) cho phép truy cập và thao tác với các phần tử trong tài liệu XML một cách linh hoạt Cuối cùng, việc phân tích tài liệu XML theo mô hình DOM giúp hiểu rõ hơn về cấu trúc và nội dung của nó, đồng thời liên kết với các khái niệm cơ bản về cơ sở dữ liệu quan hệ (CSDL) để quản lý và tổ chức dữ liệu hiệu quả.

Chương 2: Chuyển đổi giữa cơ sở dữ liệu quan hệ và XML

Phương pháp luận chuyển đổi tài liệu XML sang cơ sở dữ liệu quan hệ và ngược lại là một lĩnh vực quan trọng trong công nghệ thông tin Bài viết này sẽ trình bày thuật toán chuyển đổi giữa cơ sở dữ liệu quan hệ và XML, giúp tối ưu hóa việc quản lý và truy xuất dữ liệu Việc áp dụng phương pháp này không chỉ nâng cao hiệu quả làm việc mà còn đảm bảo tính linh hoạt trong việc xử lý các định dạng dữ liệu khác nhau.

Bài viết này trình bày quy trình cài đặt thuật toán bằng ngôn ngữ lập trình C# trong môi trường ASP.NET, nhằm phát triển ứng dụng "Quản lý thư viện" tại thư viện trường Cao đẳng Công nghiệp Nam Định.

Kết luận: Tóm tắt các nội dung chính, các kết quả đạt được và hướng nghiên cứu tiếp theo của luận văn.

Tổng quan về XML và cơ sở dữ liệu quan hệ

Tổng quan về XML

XML (Ngôn ngữ Đánh dấu Mở rộng) là một ngôn ngữ đánh dấu đa năng được W3C đề xuất, nhằm tạo ra các ngôn ngữ đánh dấu khác Là một tập con đơn giản của SGML, XML có khả năng mô tả nhiều loại dữ liệu khác nhau Mục tiêu chính của XML là đơn giản hóa việc chia sẻ dữ liệu giữa các hệ thống khác nhau, đặc biệt là trong môi trường Internet Các ngôn ngữ dựa trên XML như RDF, RSS, MathML, XHTML, SVG, GML và cXML được định nghĩa theo cách thông thường, cho phép các chương trình dễ dàng sửa đổi và kiểm tra tính hợp lệ mà không cần hiểu biết sâu về cấu trúc của chúng.

1.1.2 Mục tiêu ra đời của tài liệu XML

XML được phát triển với mục tiêu tương thích với SGML, giúp đơn giản hóa việc viết chương trình xử lý tài liệu XML Các tài liệu XML cần phải rõ ràng, dễ đọc và dễ tạo lập, đồng thời phải được hỗ trợ bởi nhiều ứng dụng khác nhau Tóm lại, XML cho phép chia sẻ dữ liệu một cách dễ dàng với nhiều định dạng khác nhau.

1.1.3 Các lợi ích khi sử dụng XML

Từ khi ra đời, XML đã đối mặt với nhiều thách thức trong việc thuyết phục lập trình viên chọn nó làm ngôn ngữ ưu tiên Với tính dễ đọc, dễ hiểu và dễ thực hiện, XML mang lại nhiều lợi ích nổi bật cho người dùng.

- XML được dùng để chia sẻ dữ liệu với những tập tin văn bản đơn giản dễ hiểu

- XML có thể tách rời dữ liệu, có nghĩa là dữ liệu được chứa trong các tập tin XML riêng biệt

- XML có thể được dùng để chuyển đổi dữ liệu giữa các hệ thống không tương thích với nhau

- XML dùng để mô tả rất tường minh thông tin của các đối tượng phức tạp mà cơ sở dữ liệu không làm được.

Cấu trúc tài liệu XML

1.2.1 Định nghĩa tài liệu XML

Một tài liệu XML phải tuân thủ các quy tắc nhất định để được coi là định dạng đúng, trong khi tài liệu HTML có thể chứa các thẻ không hợp lệ mà trình biên dịch sẽ bỏ qua Nếu một tài liệu XML không đúng định dạng, Internet Explorer sẽ hiển thị thông báo lỗi khi cố gắng nạp tài liệu đó.

Một tài liệu XML định dạng đúng không nhất thiết phải là tài liệu hợp lệ Để được coi là hợp lệ, tài liệu XML phải tuân thủ các quy tắc được xác định trong DTD hoặc giản đồ DTD hoặc schema sẽ xác định cấu trúc dữ liệu, kiểu dữ liệu, các thuộc tính bắt buộc và các ràng buộc liên quan đến thành phần và thuộc tính trong tài liệu.

Tài liệu XML có thể được chỉnh sửa bằng các trình soạn thảo thông dụng như Notepad, EditPlus, hoặc các công cụ chuyên biệt cho XML như XML Notepad, XMLWriter, và XML Spy.

1.2.2 Cấu trúc tài liệu XML

Tài liệu XML chỉ chứa dữ liệu và cách lưu trữ mà không đề cập đến cách trình bày Mỗi tài liệu XML định nghĩa cấu trúc dữ liệu thông qua các phần tử (element), bắt đầu bằng thẻ bắt đầu (Start-tag) và kết thúc bằng thẻ kết thúc (End-tag) Nội dung giữa thẻ bắt đầu và thẻ kết thúc có thể là văn bản hoặc một phần tử khác.

Một tài liệu XML có thể được chia thành 2 thành phần chính, mỗi thành phần có thể có các thành phần theo quy định khác nhau

Phần khởi đầu (PROLOG) trong tài liệu XML bao gồm các khai báo như phiên bản XML, phương thức mã hóa dữ liệu, chỉ thị xử lý, định nghĩa kiểu tư liệu DTD, cùng với các chú thích và khoảng trắng Mặc dù phần mở đầu này rất quan trọng, nhưng chuẩn XML không yêu cầu phải có nó.

Phần thân của tài liệu XML chứa nội dung dữ liệu, bao gồm ít nhất một thành phần, được gọi là phần tử Mỗi phần tử có một cặp thẻ, bao gồm thẻ bắt đầu và thẻ kết thúc Phần tử đầu tiên trong tài liệu được xem là phần tử gốc, và tất cả tài liệu XML phải có duy nhất một phần tử gốc Phần tử gốc này chứa tất cả các phần tử và cặp thẻ khác trong tài liệu.

Hình 1.1: Cấu trúc tài liệu XML

1.2.3 Các thành phần cơ bản của tài liệu XML

1.2.3.1 Định dạng và dữ liệu kí tự

Tài liệu XML bao gồm hai phần chính: định dạng và dữ liệu ký tự Định dạng trong XML giúp phân biệt các thành phần và nút khác nhau trong cấu trúc cây XML, bao gồm thẻ bắt đầu, thẻ kết thúc, các phần tử rỗng, tham chiếu thực thể, tham chiếu ký tự, chú thích, đoạn CDATA, khai báo kiểu tài liệu và chỉ thị xử lý Tất cả dữ liệu không thuộc về định dạng đều được coi là dữ liệu ký tự.

1.2.3.2 Các khai báo trong thẻ XML

Một tài liệu XML có thể bắt đầu bằng khai báo cho biết định dạng và đặc tả XML Khai báo thẻ XML là không bắt buộc, nhưng nếu được sử dụng, nó phải nằm ở dòng đầu tiên của tài liệu Cú pháp của khai báo thẻ XML được định nghĩa rõ ràng.

< ?xml [các thuộc tính của thẻ XML] ? >

Trong đó : [các thuộc tính của thẻ XML] gồm version, encoding, và standalone (tức là bao gồm các phiên bản, mã hoá và thực thể độc lập)

Hoặc có thể được định nghĩa theo cú pháp sau :

Trong đó : Ten_1, Ten_2, … là các tên của các tham số

Gia_tri_1, Gia_tri_2, … là các giá trị tương ứng

Hiện nay có 3 tham số đuợc dùng là version, encoding, và standalone Tham số version bắt buộc phải có nếu các tham số khác đuợc sử dụng

Khai báo phiên bản XML là một phần quan trọng trong tài liệu, giúp xác định phiên bản đặc tả mà tài liệu sử dụng Mặc dù khai báo này là tùy chọn, W3C khuyến cáo nên sử dụng để đảm bảo tính nhất quán và khả năng tương thích của tài liệu.

(Cho biết tài liệu dùng phiên bản XML 1.0)

- Khai báo mã hóa: bộ mã được sử dụng trong tài liệu XML phổ biến nhất là

UTF-8 Ngoài ra có thể sử dụng các bộ mã khác như Unicode, UCS-2, USC-4, (khai báo này là tùy chọn)

Ví dụ 1.2 : Tài liệu XML sử dụng cách mã hóa Unicode ký hiệu utf-8

Khai báo thực thể độc lập là một thuộc tính quan trọng trong tài liệu, được đặt là „yes‟ khi tài liệu không tham chiếu đến bất kỳ thực thể nào bên ngoài Ngược lại, nếu tài liệu có tham chiếu đến các thực thể bên ngoài, thuộc tính này sẽ được đặt là „no‟ Việc khai báo này là tùy chọn nhưng rất cần thiết để xác định tính độc lập của tài liệu.

Ví dụ 1.3: Tài liệu XML dùng phiên bản XML 1.0, sử dụng cách mã hóa

Unicode ký hiệu utf-8 và không có tham chiếu với các tài liệu khác :

< ?xml version=”1.0” encoding=”utf-8” standalone=”yes” ? >

Các chỉ thị xử lý hướng dẫn bộ phân tích cách xử lý tài liệu XML trong quá trình phân tích, thường bắt đầu và kết thúc bằng dấu Ví dụ, để yêu cầu bộ phân tích kết hợp dữ liệu XML với bảng định kiểu CSS, ta cần khai báo như sau: .

- Chỉ thị xử lý có dạng khai báo chung như sau :

Bo_xu_ly : là ký hiệu của bộ xử lý sẽ tiến hành một số xử lý nào đó trên tài liệu XML

Du_lieu : là thông tin được gởi đến Bo_xu_ly

Ví dụ 1.4: Chỉ thị sau kết nối bảng định kiểu Vidu.css vào tài liệu XML

< ?xml-stylesheet type =”text/css” href=”vidu.css”? >

- Thẻ này sẽ có ý nghĩa với một số trình duyệt Web như IE ( phiên bản 5.0 về sau ), Netscape ( phiên bản 6.0 về sau)

Chú thích trong tài liệu XML tương tự như trong tài liệu HTML, và khi trình biên dịch diễn dịch nội dung, nó sẽ bỏ qua các dòng chú thích Chú thích trong XML được đặt trong cặp kí tự .

Ví dụ 1.5:

Khi thêm các dòng chú thích vào trong tài liệu XML cần phải đảm bảo một số quy tắc sau:

- Chú thích không được đặt trước các khai báo

- Không được đặt chú thích vào bên trong phần định dạng

Ví dụ 1.6: cách dùng chú thích sau là không hợp lệ

1.2.3.5 Thẻ và các phần tử

Cấu trúc tài liệu XML được xây dựng từ các thành phần định dạng, trong đó bao gồm nhiều phần tử Mỗi phần tử thường có một cặp thẻ bắt đầu và thẻ kết thúc, ngoại trừ các phần tử rỗng được định nghĩa bằng một thẻ duy nhất Thẻ bắt đầu (thẻ mở) được bắt đầu bằng ký tự < và kết thúc bằng ký tự >, trong khi thẻ kết thúc (thẻ đóng) bắt đầu bằng cặp ký tự .

Tên thẻ phải bắt đầu bằng ký tự chữ, dấu gạch dưới (_) hoặc dấu hai chấm (:) Các ký tự tiếp theo có thể bao gồm số, chữ cái, gạch dưới, dấu chấm và dấu hai chấm, nhưng không được chứa khoảng trắng.

Ví dụ 1.7: Các tên thẻ sau là hợp lệ

Mỗi phần tử trong tài liệu XML là duy nhất và bộ phân tích XML phân biệt chữ hoa và chữ thường Vì vậy, khi đặt tên cho các thẻ và thuộc tính, cần chú ý đến sự khác biệt giữa chữ hoa và chữ thường, ví dụ như không giống với .

Phần tử rỗng: là phần tử mà chỉ có một thẻ duy nhất và được đặt trong cặp dấu < />

Ví dụ 1.8 : Trong tài liệu XML sau thì phần tử là phần tử rỗng :

Phần tử rỗng có thể có thuộc tính :

Ví dụ 1.9 : Trong tài liệu XML sau thì phần tử rỗng có thuộc tính là color:

Phân tích tài liệu XML theo DOM

1.3.1 Mô hình đối tƣợng tài liệu Để xử lý tài liệu XML, W3C định nghĩa tài liệu theo mô hình hướng đối tượng DOM Theo mô hình này tài liệu XML được tổ chức theo cấu trúc hình cây bao gồm các nút đối tượng, nội dung của mỗi nút (node), trên cây có thể chứa phần tử, dữ liệu, thuộc tính,… và các nút con khác Cụ thể, trong mô hình XML có các loại nút:

Bảng 1.2: Các loại nút trong mô hình XML

CDATA section Phân đoạn CDATA

Entity reference Tham chiếu thực thể

Processing Instruction Chỉ thị xử lý

Document Type Kiểu tư liệu Document fragment Đoạn tài liệu

Mô hình DOM được W3C định nghĩa theo nhiều mức khác nhau, cụ thể là các mức sau:

Mức 0: đặc tả XML không chính thức và được áp dụng cho các trình duyệt trước đây như Nestcape Navigator 3.0 và IE 3.0

Mức 1: Tập trung vào kết hợp giữa tài liệu XML và HTML

Mức 2: Hỗ trợ không gian tên gọi XML, khung nhìn có lọc và các sự kiện

Mức 3: Nâng cao các khả năng của DOM với việc cho phép nạp, xử lý, lưu lại mô hình cho nội dung tài liệu

Ví dụ 1.16: Cho một tài liệu XML sau:

Theo mô hình DOM, tài liệu XML ở ví dụ trên được tổ chức lại theo cấu trúc cây, cụ thể như sau:

Hình 1.2: Tài liệu XML được biểu diễn theo cấu trúc cây

1.3.2 Phân tích tài liệu XML theo mô hình đối tƣợng dữ liệu DOM

Theo W3C, tài liệu theo mô hình đối tượng dữ liệu DOM là giao diện API ứng dụng không phụ thuộc vào ngôn ngữ, cho phép chương trình và kịch bản truy cập và cập nhật tự động nội dung, cấu trúc và kiểu của tài liệu XML và HTML.

Mô hình đối tượng dữ liệu DOM cho phép phân tích tài liệu XML bằng cách tạo, duyệt, thêm, loại bỏ và thay đổi các phần tử thông qua các ngôn ngữ lập trình như Java, JavaScript, Visual Studio.NET, C/C++ Dù sử dụng ngôn ngữ nào, người dùng đều cần áp dụng các phương thức mà DOM cung cấp.

Bảng 1.3: Các phương thức trong mô hình DOM

Phương thức Ý nghĩa documentElement Lấy nút gốc của tài liệu DOM

The article discusses various methods for navigating the Document Object Model (DOM) in web development It explains how to access the parent node of the current element using `parentNode`, retrieve the first child with `firstChild`, and find the previous or next siblings with `previousSibling` and `nextSibling`, respectively Additionally, it covers how to access the last child with `lastChild` and the last sibling with `lastSibling` The article also mentions using `getElementsByTagName` to obtain a list of elements by their tag name.

Item(i) Truy cập nút thứ i trong danh sách childeNodes Trả về danh sách các nút trong tài liệu docType Trả về kiểu của nút gốc

Trong lập trình, các phương thức quan trọng bao gồm: `length` để trả về số lượng nút trong danh sách, `nodeName` để lấy tên của một nút, `nodeValue` để xác định giá trị của một nút, và `nodeType` để xác định kiểu dữ liệu của một nút Ngoài ra, `createElement()` được sử dụng để khởi tạo một thành phần mới trong tài liệu, trong khi `createTextNode()` dùng để tạo dữ liệu văn bản cho một nút.

Cơ sở dữ liệu quan hệ

1.4.1 Hệ quản trị cơ sở dữ liệu

Hệ quản trị cơ sở dữ liệu (CSDL) là phần mềm được thiết kế để quản lý và điều hành một CSDL, cung cấp các chức năng lưu trữ, sửa đổi, xóa và truy vấn thông tin hiệu quả.

Hầu hết các hệ quản trị cơ sở dữ liệu (CSDL) đều sử dụng ngôn ngữ truy vấn có cấu trúc (SQL), với những hệ phổ biến như MySQL, Oracle, PostgreSQL, SQL Server, DB2 và Infomix Các hệ thống này thường hoạt động hiệu quả trên nhiều hệ điều hành khác nhau, bao gồm Linux, Unix và MacOS, ngoại trừ SQL Server của Microsoft, chỉ tương thích với hệ điều hành Windows.

* Ưu điểm của việc thiết kế hệ quản trị Cơ sở dữ liệu:

- Cho phép người sử dụng tạo ra và duy trì Cơ sở dữ liệu

- Cho phép định nghĩa, xây dựng và thao tác dữ liệu:

- Định nghĩa một cơ sở dữ liệu là đặc tả các kiểu dữ liệu, các cấu trúc, các ràng buộc cho các dữ liệu sẽ được lưu trữ

- Xây dựng cơ sở dữ liệu là lưu trữ dữ liệu lên các phương tiện lưu trữ được hệ quản trị cơ sở dữ liệu kiểm soát

Thao tác trên cơ sở dữ liệu bao gồm việc truy vấn để lấy thông tin cụ thể, cập nhật dữ liệu và tạo báo cáo từ các thông tin đã có.

1.4.2 Mô hình dữ liệu quan hệ

Gọi R là tập hợp hữu hạn các thuộc tính A1, A2, , An, trong đó mỗi thuộc tính Ai có miền giá trị tương ứng là Dom(Ai) Quan hệ trên tập thuộc tính R được định nghĩa là một tập con của tích đề các, ký hiệu là r ⊆ Dom(A1) × × Dom(An) Do đó, ta có thể ký hiệu quan hệ r trên tập thuộc tính R là r(R).

Ví dụ 1.16: Cho quan hệ DOC_GIA với các thuộc tính như sau:

DOC_GIA (Hoten Namsinh Gioitinh)

(t2) Vương Văn Dự 1992 Nam (t3) Nguyễn Thị Đào 1992 Nữ

Mỗi cột là một thuộc tính: thuộc tính Hoten, Namsinh, Gioitinh

Mỗi hàng là một bộ : bộ t1, t2, t3

1.4.2.2 Định nghĩa khoá của quan hệ

Khoá của một quan hệ r trên tập thuộc tính R   A 1 , , A n  là tập con

K  sao cho bất kỳ hai bộ khác nhau t1, t2 thuộc r luôn thoả mãn t1(K) t2(K)

Bất kỳ tập con thực sự K '  K nào đều không có tính chất đó Tập K là siêu khoá của quan hệ r nếu K là một khoá của quan hệ r

1.4.3 Kiến trúc cơ sở dữ liệu quan hệ

Cơ sở dữ liệu quan hệ là một tập hợp các quan hệ, trong đó mỗi quan hệ được thể hiện dưới dạng bảng hai chiều với các cột và hàng Bảng dữ liệu là hình thức cụ thể của kiểu thực thể trong quá trình xây dựng cơ sở dữ liệu, dùng để lưu trữ thông tin về các thực thể trong lớp thực thể đó.

Bảng dữ liệu là tập hợp các bộ dữ liệu hoặc bản ghi, mỗi bộ có số lượng thuộc tính giống nhau nhưng giá trị có thể khác nhau Trong cơ sở dữ liệu quan hệ, bảng dữ liệu được hiểu là một "quan hệ", bao gồm lược đồ quan hệ và thể hiện quan hệ Thể hiện quan hệ là bảng, trong khi lược đồ quan hệ mô tả tiêu đề các cột của bảng Đặc biệt, trong một quan hệ, không được phép có hai bộ dữ liệu giống nhau ở tất cả các thuộc tính.

Một bảng dữ liệu được xác định bởi một tên quan hệ cụ thể, với mỗi cột đại diện cho một thuộc tính có tên duy nhất Mỗi dòng trong bảng tương ứng với một bộ trong quan hệ, cũng được đặt tên duy nhất Mỗi bộ là một danh sách các giá trị có thứ tự, phản ánh thứ tự các cột trong bảng.

Trong cơ sở dữ liệu, mỗi thuộc tính được gán giá trị trong một miền giá trị cụ thể Miền giá trị không chỉ xác định tập hợp các giá trị cho thuộc tính mà còn quy định các thao tác được phép thực hiện trên dữ liệu trong cơ sở dữ liệu quan hệ.

1.4.4 Ràng buộc toàn vẹn cơ sở dữ liệu quan hệ

Ràng buộc toàn vẹn và kiểm tra vi phạm ràng buộc toàn vẹn đóng vai trò quan trọng trong phân tích, thiết kế và khai thác hệ thống cơ sở dữ liệu.

Ràng buộc toàn vẹn là một điều kiện bất biến không được vi phạm trong một cơ sở dữ liệu

Trong cơ sở dữ liệu, luôn tồn tại các mối quan hệ tương tác giữa các thuộc tính và bộ giá trị trong cùng một quan hệ hoặc giữa các quan hệ khác nhau Những mối quan hệ này là các điều kiện bất biến mà tất cả các bộ dữ liệu liên quan trong cơ sở dữ liệu phải tuân thủ tại mọi thời điểm.

1.4.4.2 Các yếu tố của ràng buộc toàn vẹn

Khi xác định một ràng buộc toàn vẹn cần nêu rõ các yếu tố sau:

- Điều kiện của ràng buộc toàn vẹn và trên cơ sở của điều kiện này cho ta cách biểu diễn dữ liệu

- Bối cảnh xảy ra ràng buộc toàn vẹn: trên một hay nhiều quan hệ và cụ thể là trên quan hệ nào

Ràng buộc toàn vẹn có ảnh hưởng lớn đến tính toàn vẹn của dữ liệu trong hệ thống Khi khả năng tính toàn vẹn bị ảnh hưởng, điều này có thể dẫn đến những sai sót nghiêm trọng trong việc quản lý và xử lý thông tin Do đó, cần có những hành động khẩn cấp để khắc phục tình trạng vi phạm tính ràng buộc toàn vẹn, nhằm đảm bảo rằng dữ liệu luôn chính xác và đáng tin cậy.

Như vậy tính ràng buộc toàn vẹn dữ liệu được biểu diễn thông qua các phụ thuộc hàm và cụ thể là dựa trên ràng buộc khóa

Các khái niệm về khóa: khóa chính, khóa ngoại

Khóa chính (primary key) là một ràng buộc trong cơ sở dữ liệu, đảm bảo rằng không có hai giá trị giống hệt nhau hoặc hai giá trị null được phép xuất hiện trong cột hoặc tập các cột đã được định nghĩa.

Khóa ngoại (foreign key) là một ràng buộc yêu cầu mỗi giá trị trong cột hoặc tập cột phải tương ứng với một giá trị trong quan hệ liên kết, đồng thời cột trong quan hệ đó cũng phải tuân thủ các ràng buộc toàn vẹn như khóa duy nhất hoặc khóa chính Ràng buộc này thường được gọi là ràng buộc tham chiếu và cột được khai báo ràng buộc này có thể nhận giá trị null.

1.4.4.3.Chuẩn hóa một cơ sở dữ liệu quan hệ

Chuẩn hóa cơ sở dữ liệu quan hệ là bước quan trọng giúp loại bỏ sự dư thừa dữ liệu, từ đó nâng cao tính toàn vẹn của dữ liệu.

Chuẩn hóa một CSDL có nghĩa là chúng ta sẽ đưa các lược đồ quan hệ về một trong các dạng chuẩn: 1NF, 2NF, 3NF, BCNF

Chuẩn 1NF yêu cầu rằng một quan hệ chỉ được coi là đạt chuẩn khi tất cả các giá trị thuộc tính của nó là sơ cấp, tức là chỉ chứa các giá trị nguyên tố không thể phân chia nhỏ hơn.

Kết luận chương 1

Chương 1 đã nêu những kiến thức cơ bản về cấu trúc một tài liệu XML, nhận biết được thế nào là một tài liệu XML hợp lệ, hợp khuôn dạng, cách tạo một tài liệu XML hợp khuôn dạng, mô hình DOM và cách phân tích tài liệu XML theo mô hình DOM cùng các trình phân ngữ trong XML như: kiểu tài liệu DTD, giản đồ XML, không gian tên gọi, bảng định kiểu CSS Ngoài những kiến thức cơ bản về XML, trong chương 1 cũng trình bày những kiến thức cơ bản về cơ sở dữ liệu quan hệ, các khái niệm, cấu trúc, các ràng buộc toàn vẹn, các dạng chuẩn hóa CSDL quan hệ.

Chuyển đổi giữa cơ sở dữ liệu quan hệ và XML

Phương pháp luận

Nghiên cứu các thuật toán chuyển đổi cơ sở dữ liệu quan hệ sang tài liệu XML và ngược lại, nhằm tối ưu hóa quy trình xử lý dữ liệu Việc chuyển đổi này giúp cải thiện khả năng truy xuất và quản lý thông tin, đồng thời tạo điều kiện thuận lợi cho việc tích hợp dữ liệu từ nhiều nguồn khác nhau.

2.1.1 Cấu trúc, kiểu cơ chế của XML và lƣợc đồ CSDL quan hệ

Cấu trúc của tài liệu XML và lược đồ quan hệ được xác định bởi các phần tử và thuộc tính, tương tự như quan hệ và thuộc tính trong cơ sở dữ liệu quan hệ Các kiểu phần tử có vai trò quan trọng trong việc mô tả hai mảng phạm trù: một là xác định xem phần tử có chứa miền nguyên tử hay không, hai là liệu phần tử có miền hợp hay không Sự phân loại này tạo ra bốn kiểu phần tử khác nhau, phù hợp với cả lược đồ DTD và XML Mặc dù cơ sở dữ liệu quan hệ không cho phép miền quan hệ đặc biệt, nhưng các thuộc tính vẫn có thể được xem xét tương ứng với từng loại kiểu phần tử trong XML và cơ sở dữ liệu quan hệ.

Bảng 2.1: Các kiểu phần tử

Kiểu phần tử (Element Type) Miền nguyên tử Miền hợp

Kiểu phần tử nguyên tử True False

Kiểu phần tử hợp thành với nội dung phần tử False True

Kiểu phần tử hợp thành True True

Kiểu phần tử rỗng False False

Các kiểu phần tử chỉ bao gồm miền nguyên tử được gọi là kiểu phần tử nguyên tử Trong DTD, những kiểu phần tử này chỉ có một miền nguyên tử duy nhất.

PCDATA là các miền nguyên tử được xác định trước cho các thuộc tính DTD, so sánh với kiểu chuỗi CDATA Nó bao gồm kiểu liệt kê và một số kiểu đặc biệt như ID và IDREF(s).

Lược đồ XML cung cấp một phạm vi rộng lớn các nguyên tử thông qua kiểu phần tử và thuộc tính, cho phép các miền nguyên tử được sử dụng như cơ sở từ những miền do người dùng định nghĩa Điều này tương tự như nội dung hướng đối tượng của lớp con, nơi các mở rộng và ràng buộc được xác định một cách thích hợp.

Mỗi tài liệu XML yêu cầu tất cả các kiểu phần tử hợp được tạo thành từ một hay nhiều kiểu phần tử đơn, tuân theo ràng buộc của cơ sở dữ liệu quan hệ Trong đó, một phần của sự phân cấp không thể thực hiện bởi những trung gian ẩn mà chỉ khi các quan hệ gồm thuộc tính có giá trị nguyên thủy Khi các kiểu phần tử hợp thành, chúng có thể có một miền nguyên tử để bổ sung vào miền hợp thành.

Trong các kiểu phần tử hợp thành, có hai loại chính: phần tử chứa nội dung hỗn hợp và phần tử chứa nội dung phần tử Đặc biệt, những kiểu phần tử hợp thành này thường xuất hiện trong chuỗi nối tiếp hoặc như một sự lựa chọn, tạo ra sự linh hoạt trong việc trình bày nội dung.

Bảng 2.2: Minh họa định nghĩa kiểu phần tử hợp thành Độc giả

Diachi, Nghenghiep,Khoa,Lop,DienThoai>

Ngày đăng: 05/10/2014, 00:40

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Nguyễn Tiến, Đặng Xuân Hường, Nguyễn Văn Hoài, Nguyễn Tuấn Ngọc (2001), “Nhập môn XML thực hành và ứng dụng”, NXB Thống kê Sách, tạp chí
Tiêu đề: Nhập môn XML thực hành và ứng dụng”
Tác giả: Nguyễn Tiến, Đặng Xuân Hường, Nguyễn Văn Hoài, Nguyễn Tuấn Ngọc
Nhà XB: NXB Thống kê
Năm: 2001
2. Christopher Allen (2004), “Nhập môn về Cơ sở dữ liệu quan hệ và Lập trình SQL”, NXB Thống kê Sách, tạp chí
Tiêu đề: Nhập môn về Cơ sở dữ liệu quan hệ và Lập trình SQL”
Tác giả: Christopher Allen
Nhà XB: NXB Thống kê
Năm: 2004
3. Lê Minh Hoàng (2006), “Các thủ thuật trong HTML và thiết kế Web”, NXB Lao động - Xã hội Sách, tạp chí
Tiêu đề: Các thủ thuật trong HTML và thiết kế Web”
Tác giả: Lê Minh Hoàng
Nhà XB: NXB Lao động - Xã hội
Năm: 2006
4. Lê Tiến Vương (2000), “Nhập môn cơ sở dữ liệu quan hệ”, NXB Thống kê Sách, tạp chí
Tiêu đề: “Nhập môn cơ sở dữ liệu quan hệ”
Tác giả: Lê Tiến Vương
Nhà XB: NXB Thống kê
Năm: 2000
5. Nguyễn Ngọc Bình Phương, Thái Kim Phụng, Lê Ngọc Sơn, Nguyễn Hoàng Thanh Nhàn (2007), “Các giải pháp lập trình ASP.NET 2.0”, Nhà sách Đất Việt Sách, tạp chí
Tiêu đề: Các giải pháp lập trình ASP.NET 2.0”
Tác giả: Nguyễn Ngọc Bình Phương, Thái Kim Phụng, Lê Ngọc Sơn, Nguyễn Hoàng Thanh Nhàn
Năm: 2007
6. Nguyễn Phương Lan (2003), “XML nền tảng và ứng dụng”, NXB Lao động - Xã hội Sách, tạp chí
Tiêu đề: XML nền tảng và ứng dụng”
Tác giả: Nguyễn Phương Lan
Nhà XB: NXB Lao động - Xã hội
Năm: 2003
7. Nguyễn Thị Ngọc Mai (2007), “Lý thuyết cơ sở dữ liệu - Tập1, 2”, NXB Lao động - Xã hội Sách, tạp chí
Tiêu đề: “Lý thuyết cơ sở dữ liệu - Tập1, 2”
Tác giả: Nguyễn Thị Ngọc Mai
Nhà XB: NXB Lao động - Xã hội
Năm: 2007
8. Nguyễn Thiên Bằng, Hoàng Đức Hải, Phương Lan (2005), “Giáo trình nhập môn XML”, NXB Lao động - Xã hội Sách, tạp chí
Tiêu đề: Giáo trình nhập môn XML”
Tác giả: Nguyễn Thiên Bằng, Hoàng Đức Hải, Phương Lan
Nhà XB: NXB Lao động - Xã hội
Năm: 2005
9. Phạm Hữu Khang (2005), “Lập trình ASP.Net 2.0”, NXB Lao động - Xã hội Sách, tạp chí
Tiêu đề: Lập trình ASP.Net 2.0”
Tác giả: Phạm Hữu Khang
Nhà XB: NXB Lao động - Xã hội
Năm: 2005
10. Phạm Hữu Khang (2007), “SQL Server 2005 - Lập Trình T-SQL”, NXB Lao động - Xã hội Sách, tạp chí
Tiêu đề: SQL Server 2005 - Lập Trình T-SQL”
Tác giả: Phạm Hữu Khang
Nhà XB: NXB Lao động - Xã hội
Năm: 2007
11. Phương Lan, Hoàng Đức Hải (2002), “Lập trình Windows với C#. Net”, NXB Lao động - Xã hội.Tiếng Anh Sách, tạp chí
Tiêu đề: Lập trình Windows với C#. Net”
Tác giả: Phương Lan, Hoàng Đức Hải
Nhà XB: NXB Lao động - Xã hội. Tiếng Anh
Năm: 2002
12. Ash Rofail and R. Allen Wyke (2002), “XML Programming (Core Reference)” Published by Microsoft Corporation Sách, tạp chí
Tiêu đề: XML Programming (Core Reference)”
Tác giả: Ash Rofail and R. Allen Wyke
Năm: 2002
13. Bhavani Thuraisingham (2002), “XML Databases and the Semantic Web”, Published by CRC Press Sách, tạp chí
Tiêu đề: XML Databases and the Semantic Web”
Tác giả: Bhavani Thuraisingham
Năm: 2002
14. Bipin Joshi (2008), “Beginning XML with C# 2008: From Novice to Professional”, Published by Apress Sách, tạp chí
Tiêu đề: Beginning XML with C# 2008: From Novice to Professional”
Tác giả: Bipin Joshi
Năm: 2008

HÌNH ẢNH LIÊN QUAN

Hình 1.1: Cấu trúc tài liệu XML - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Hình 1.1 Cấu trúc tài liệu XML (Trang 13)
Bảng 1.1: Bảng tham chiếu thực thể trong XML - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Bảng 1.1 Bảng tham chiếu thực thể trong XML (Trang 22)
Hình 1.2: Tài liệu XML được biểu diễn theo cấu trúc cây - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Hình 1.2 Tài liệu XML được biểu diễn theo cấu trúc cây (Trang 31)
Hình 2. 1: Các mức so sánh giữa mô hình quan hệ và XML - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Hình 2. 1: Các mức so sánh giữa mô hình quan hệ và XML (Trang 41)
Bảng 2.3: So sánh các yếu tố trong một tập hợp - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Bảng 2.3 So sánh các yếu tố trong một tập hợp (Trang 43)
Bảng 2.4: Nội dung so sánh các quan hệ - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Bảng 2.4 Nội dung so sánh các quan hệ (Trang 44)
Bảng 2.5: Những kiểu phần tử hợp thành không có thứ tự - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Bảng 2.5 Những kiểu phần tử hợp thành không có thứ tự (Trang 46)
Hình 2.2:  Sơ đồ thực thể liên kết - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Hình 2.2 Sơ đồ thực thể liên kết (Trang 48)
Hình 2.3: Chuẩn hóa các quan hệ - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Hình 2.3 Chuẩn hóa các quan hệ (Trang 49)
Bảng dữ liệu liên kết được xây dựng khi ta kết nối dữ liệu trên các bảng theo  nhu cầu sử dụng dữ liệu của người dùng thông qua truy vấn SQL - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Bảng d ữ liệu liên kết được xây dựng khi ta kết nối dữ liệu trên các bảng theo nhu cầu sử dụng dữ liệu của người dùng thông qua truy vấn SQL (Trang 50)
Hình 2. 6: Ánh xạ một CSDL sang một tài liệu XML - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Hình 2. 6: Ánh xạ một CSDL sang một tài liệu XML (Trang 51)
Hình 2.7: Sơ đồ chuyển CSDL quan hệ thành tài liệu XML - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Hình 2.7 Sơ đồ chuyển CSDL quan hệ thành tài liệu XML (Trang 52)
Hình 2.9: Tài liệu XML được thể hiện theo mô hình DOM - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Hình 2.9 Tài liệu XML được thể hiện theo mô hình DOM (Trang 53)
Hình 2. 10: Sơ đồ chuyển tài liệu XML thành CSDL quan hệ - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Hình 2. 10: Sơ đồ chuyển tài liệu XML thành CSDL quan hệ (Trang 54)
Hình 2. 11: Những ánh xạ cơ bản từ tài liệu XML thành CSDL quan hệ - nghiên cứu cách chuyển đổi cơ sở dữ liệu quan hệ và xml, ứng dụng hệ thống vào quản lý thư viện
Hình 2. 11: Những ánh xạ cơ bản từ tài liệu XML thành CSDL quan hệ (Trang 55)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w