1. Trang chủ
  2. » Giáo Dục - Đào Tạo

ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)

107 70 4

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 107
Dung lượng 7,18 MB
File đính kèm 05_NguyenThiBichNgan.rar (27 MB)

Cấu trúc

  • Chương 1 GIỚI THIỆU CÁC DẠNG DỮ LIỆU VÀ TRỰC QUAN HÓA DỮ LIỆU

    • 1.1 Tìm hiểu về hệ cơ sở dữ liệu (database)

    • 1.2 Các dạng database

    • 1.3 Cấu trúc dữ liệu.

      • 1.3.1 Khái niệm:

      • 1.3.2 Vai trò của cấu trúc dữ liệu.

    • 1.4 Tìm hiều khái niệm data visualization.

      • 1.4.1 Khái niệm.

      • 1.4.2 Ưu điểm về data visualization

      • 1.4.3 Một số lĩnh vực yêu cầu về data visualization.

  • Chương 2 GIỚI THIỆU CÔNG CỤ DATA VISUALIZATION TABLEU

    • 2.1 Nền tảng Tableau đối với phân tích dữ liệu

    • 2.2 Lịch sử hình thành Tableau.

    • 2.3 Lợi ích của Tableau

    • 2.4 Sản phẩm của Tableau

    • 2.5 Ứng dụng của Tableau

    • 2.6 Kiến trúc tableau

      • 2.6.1 Nguồn dữ liệu

      • 2.6.2 Tableau Server and Desktop.

      • 2.6.3 Clients.

    • 2.7 Data layer

    • 2.8 Data Connectors

    • 2.9 Live Connections

    • 2.10 In-memory

    • 2.11 Install Tableau Desktop.

      • 2.11.1 Yêu cầu hệ thống cho Tableau.

      • 2.11.2 Dowload và cài đặt Tableau Desktop.

      • 2.11.3 Đăng ký và kích hoạt Tableau Desktop

    • 2.12 Kết nối Tableau với cơ sở dữ liệu đa nguồn

      • 2.12.1 Thiết lập kết nối dữ liệu.

        • *Kết nối với file

      • 2.12.2 Liên kết bảng dữ liệu

      • 2.12.3 Kết nối dữ liệu ở chế độ Live hoặc Extract.

      • 2.12.4 Chỉnh sửa dữ liệu của mô hình.

      • 2.12.5 Kiểu dữ liệu.

      • 2.12.6 Workbooks and Sheets

    • 2.13 Data scource pane

    • 2.14 The Tableau Workspace

    • 2.15 The Data Pane

      • 2.15.1 Trực quan hóa với các measure

      • 2.15.2 Trực quan hóa với các dimesion

      • 2.15.3 Làm việc với khung Mark

      • 2.15.4 Lưu workbook

    • 2.16 Trực quan hóa với các dạng biểu đồ

      • 2.16.1 Các dạng biểu đồ

      • 2.16.2 Show me menu.

    • 2.17 Filter và Hierarchies

      • 2.17.1 Lọc dimesions.

      • 2.17.2 Lọc theo measures

      • 2.17.3 Quick filters

      • 2.17.4 Data source filter.

      • 2.17.5 Hierarchies.

    • 2.18 Các hàm tổng hợp, calculated field và parameter

      • 2.18.1 Các hàm tổng hợp.

      • 2.18.2 Calculated Field

      • 2.18.3 Trường dữ liệu ngày tháng

      • 2.18.4 Các hàm tính ngày tháng

      • 2.18.5 Parameter.

    • 2.19 Bảng tính toán và mức độ chi tiết (LOD)

      • 2.19.1 Các loại tính toán.

      • 2.19.2 Mở bảng tính nhanh.

      • 2.19.3 Mức độ thể hiện chi tiết.

      • 2.19.4 Mức trung bình trong một khu vực.

    • 2.20 Tương tác Dashboard

      • 2.20.1 Create Dashboard.

      • 2.20.2 The Dashboard Pane.

      • 2.20.3 Xây dựng bản đồ trên Dashboard.

      • 2.20.4 Tiêu đề Dashboard.

      • 2.20.5 Dashboard Actions.

    • 2.21 TabPy-Python kết hợp Tableau.

      • 2.21.1 TabPy

      • 2.21.2 Cài đặt TabPy

      • 2.21.3 Kết nối Tableau vào TabPy

      • 2.21.4 Sử dụng TabPy

  • Chương 3 ỨNG DỤNG TABLEAU TRỰC QUAN HÓA DỮ LIỆU

    • 3.1 Thực nghiệm truy vấn trên dữ liệu SQL Server.

      • 3.1.1 Mô tả dữ liệu liên kết bảng MOVIES

      • 3.1.2 Một số thống kê trực quan hóa dữ liệu trên bộ dữ liêu Movies

    • 3.2 Thực nghiệm trên dataset dạng big data.

      • 3.2.1 Mô tả dữ liệu Olympic

      • 3.2.2 Trực quan hóa dữ liệu

  • Chương 4 Kết luận

Nội dung

Tìm hiểu về hệ cơ sở dữ liệu (database)

Cơ sở dữ liệu là một tập hợp các dữ liệu có liên quan logic, chứa thông tin về tổ chức như trường học, công ty hay nhà máy Những dữ liệu này được lưu trữ trên máy tính nhằm phục vụ nhu cầu khai thác thông tin của nhiều người dùng với các mục đích khác nhau.

Hệ cơ sở dữ liệu được quản lý bởi hệ quản lý cơ sở dữ liệu (DBMS), đóng vai trò quan trọng trong việc tạo ra, quản lý, lưu trữ và xử lý các truy vấn dữ liệu Sự kết hợp giữa DBMS và cơ sở dữ liệu hình thành nên hệ thống cơ sở dữ liệu, hay còn gọi là hệ cơ sở dữ liệu.

Hình 1.1Hệ quản trị cơ sở dữ liệu

Ngôn ngữ được sử dụng trong DBSM:

 Ngôn ngữ định nghĩa dữ liệu - DDL

 Ngôn ngữ thao tác dữ liệu - DML

 Ngôn ngữ truy vấn dữ liệu - SQL

 Ngôn ngữ quản lý dữ liệu – DCL

Một số DBMS thông dụng: Oracle, MongoDB, MySQL, Db4o, Neo4j, NoSQL, DM2, Ms SQL Server (Microsoft), …

Các dạng database

Database được phân ra theo hai hướng là theo mục đích sử dụng và theo hệ điều hành

*Theo mục đích sử dụng

- Database dạng file: *.mdb Foxpro, *.dbf, ascii,…

Cơ sở dữ liệu quan hệ là hệ thống lưu trữ thông tin dưới dạng các bảng dữ liệu, trong đó các bảng này có mối quan hệ với nhau Một số ví dụ tiêu biểu về cơ sở dữ liệu quan hệ bao gồm MySQL, MS SQL và Oracle.

Cơ sở dữ liệu hướng đối tượng có điểm chung với cơ sở dữ liệu quan hệ là đều lưu trữ thông tin trong bảng dữ liệu Tuy nhiên, khác biệt lớn nhất là các bảng trong cơ sở dữ liệu hướng đối tượng tích hợp thêm các tính năng hướng đối tượng, cho phép lưu trữ hành vi để thể hiện rõ hơn các đặc tính của đối tượng Một số hệ quản trị cơ sở dữ liệu tiêu biểu cho loại này bao gồm MS SQL Server, PostgreSQL và Oracle.

Cơ sở dữ liệu bán cấu trúc là loại cơ sở dữ liệu được lưu trữ dưới định dạng XML, trong đó thông tin mô tả dữ liệu và các đối tượng được trình bày qua các thẻ tag Ưu điểm nổi bật của cơ sở dữ liệu bán cấu trúc là khả năng lưu trữ một lượng lớn dữ liệu một cách hiệu quả.

- Database dùng trong hệ điêu hành windows: SQL server,…

- Database dùng trong hệ điều hành Linux: Maria DB, MySQL,…

Cấu trúc dữ liệu

Khái niệm

Đơn giản cấu trúc dữ liệu là cách lưu dữ liệu trong máy tính sao cho nó có thể sử dụng một cách hiệu quả nhất.

Vai trò của cấu trúc dữ liệu

Mọi chương trình máy tính đều cần dữ liệu để hoạt động, bao gồm dữ liệu đầu vào, dữ liệu trung gian và dữ liệu đầu ra Việc tổ chức và lưu trữ dữ liệu một cách hợp lý là rất quan trọng để đảm bảo hiệu quả cho toàn bộ hệ thống chương trình.

Trong thiết kế chương trình, việc lựa chọn cấu trúc dữ liệu đóng vai trò quan trọng Khi xây dựng một hệ thống lớn, các vấn đề về triển khai, chất lượng và hiệu quả thường xuất hiện, do đó, quyết định về cấu trúc dữ liệu có ảnh hưởng lớn đến thành công của dự án.

Cấu trúc dữ liệu được xây dựng từ các kiểu dữ liệu, tham chiếu và phép toán, tất cả đều được lập trình bằng ngôn ngữ lập trình.

Các cấu trúc dữ liệu thường dùng như: Mảng, ngăn xếp, hàng đợi, hàm băm, danh sách liên kết, cây, đồ thị.

Tìm hiều khái niệm data visualization

Khái niệm

Data Visualization, hay còn gọi là trực quan hóa dữ liệu, là một khái niệm mới nổi trong những năm gần đây Nó sử dụng hình ảnh, biểu đồ và bảng đồ để trình bày dữ liệu một cách trực quan, giúp người xem dễ dàng tiếp nhận thông tin Phương pháp này không chỉ làm cho nội dung trở nên sinh động hơn mà còn giúp người đọc hiểu rõ và khai thác tối đa giá trị của dữ liệu.

Ưu điểm về data visualization

Hình ảnh não bộ giúp con người phản ứng hiệu quả hơn so với các ký hiệu và con số cứng nhắc Nghiên cứu cho thấy con người có khả năng xử lý hình ảnh nhanh gấp 60.000 lần so với văn bản.

Triển khai big data một cách hiệu quả mà không cần xử lý các bản dữ liệu phức tạp, giúp nắm bắt thông tin một cách nhanh chóng và trực quan.

Việc trực quan hóa dữ liệu giúp tăng tốc độ ra quyết định nhờ vào khả năng hiểu dữ liệu một cách nhanh chóng và hiệu quả.

 Dữ liệu được truy xuất một cách nhanh nhất tốn ít thời gian và công sức của nhân viên.

 Truyền tải thông tin nhanh hơn.

Một số lĩnh vực yêu cầu về data visualization

Trực quan hóa dữ liệu được sử dụng nhiều trong các lĩnh vực như: Kinh doanh, y tế, giáo dục, thể thao, ngân hàng, chính phủ,…

GIỚI THIỆU CÔNG CỤ DATA VISUALIZATION TABLEU

Nền tảng Tableau đối với phân tích dữ liệu

Trong kinh doanh thông minh, việc tìm kiếm thông tin chính xác về khách hàng, sản phẩm, dịch vụ và nhu cầu của khách hàng là rất quan trọng Do đó, cần áp dụng các công cụ thông minh để thiết kế, tổng hợp và phân tích dữ liệu một cách đa dạng và hiệu quả.

Các công cụ thông minh phải đáp ứng được các yêu cầu sau:

– Cho hình ảnh trực quan phải chính xác với thực tế kết quả mong muốn.

Cung cấp khả năng thao tác dữ liệu linh hoạt như cắt, thêm, bớt, chỉnh sửa, xóa và lọc, giúp người dùng dễ dàng quản lý thông tin Hệ thống cho phép thực hiện truy vấn dữ liệu lớn một cách nhanh chóng và chính xác, nâng cao hiệu suất làm việc.

Một số công cụ trưc quan hóa dữ liệu như : Tableau, SAP, SAS, MiscroStrategy, A1 digihub Ngoài ra còn có các công cụ khác như: QlikView from QlikTech, D3.js (Data

Driven Documents) sử dụng HTML, CSS and SVG, Chart.js, Tibco SpotFire, IBM Cognos Visual Analytics, RoambiAnalytics, Google Charts, FusionCharts.

Tableau là công cụ phân tích và trực quan hóa dữ liệu dễ dàng tiếp cận cho mọi khách hàng Tương tự như Excel, Tableau không chỉ tổng hợp dữ liệu mà còn nâng cao khả năng hiển thị thông tin bằng cách chuyển đổi các con số thành hình ảnh và biểu đồ trực quan, giúp người dùng dễ dàng hiểu và phân tích dữ liệu.

Lịch sử hình thành Tableau

Tableau được viết bởi 3 nhà đồng sáng lập công ty là Christian Chabot, Pat

Hanrahan và Chris Stolte Được thành lập năm 2003 tại Mountain View, California và hiện nay trụ sở chính ở Seattle, Washington.

Năm 2019, công ty được Salesforce mua lại với giá 15,7 tỷ đô la.

Lợi ích của Tableau

– Kết nối hơn 40 nguồn dữ liệu khác nhau.

– Xây dựng bản điều khiển tương tác chỉ bằng vài cú click chuột.

– Giúp hiểu rõ hơn về dữ liệu và những thông tin liên quan khác.

– Phân tích đơn giản như xu hướng hay dự báo…

– Cung cấp được nhiều biểu đồ như hình tròn,hình cột, …

Sản phẩm của Tableau

Để nói về dòng sản phảm của Tableau ta chia ra làm 2 loại:

- Developer tool ( Công cụ nhà phát triển):Tableau Desktop, Tableau Public.

- Sharing tool (Công cụ chia sẻ):Tableau Server, Tableau Online, Tableau Reader.

Tableau Reader cho phép người dùng xem và tương tác với các workbook Tableau (.twbx), nhưng không cho phép chỉnh sửa Ngoài ra, Tableau Reader cũng không thể kết nối với Tableau Server.

 Tableau Public: Ứng dụng được cung cấp miễn phí trên trang chủ Tableau Chỉ làm việc với nguồn dữ liệu Excel, Access, hoặc text file.Mọi dữ liệu trong

Tableau Puclic đều được lưu trong Tableau Public Server và không thể download chúng.

 Tableau Desktop: Cung cấp giao diện trực quan cùng các tính năng đa dạng để mã hóa và phân tích dữ liệu.

 Tableau Desktop chia ra 2 loại: Tableau Desktop Personal, Tableau Desktop

Tableau Prep là công cụ mạnh mẽ giúp chuẩn bị dữ liệu, mang lại sự thay đổi đáng kể trong việc tổ chức dữ liệu so với các phương pháp truyền thống, với nhiều cải tiến nổi bật.

Tableau Online là một giải pháp không cần máy chủ với khả năng lưu trữ không giới hạn, cho phép kết nối tới hơn 40 nguồn dữ liệu khác nhau Để xuất bản báo cáo, người dùng vẫn cần sử dụng Tableau Desktop Nó có thể được coi là một server miễn phí, giúp người dùng truy cập vào các báo cáo trên các thiết bị di động như iOS và nhiều thiết bị khác.

Tableau Server là nền tảng chia sẻ phân tích dữ liệu dành cho doanh nghiệp, được thiết kế với tính năng bảo mật và quản lý quyền truy cập Tuy nhiên, việc sử dụng Tableau Server sẽ có phí hoạt động.

Hình 2.2Mối quan hệ giữa Tableau Desktop và Taleau Server

Ngoài ra còn một số tableau như Catalog, Bridge, Data management, Server management,

Ứng dụng của Tableau

 Thu gom, tổng hợp dữ liệu, xây dựng metadata cung cấp cho người dùng nghiệp vụ

(business users) để chuẩn bị phân tích dữ liệu.

Với hơn 40 loại biểu đồ, việc tạo ra các phân tích dữ liệu trở nên dễ dàng hơn bao giờ hết Các biểu đồ này không chỉ giúp mô tả các lý thuyết kinh tế như mô hình 80/20, mà còn hỗ trợ phân tích phân khúc khách hàng RFM và cung cấp bản đồ hành chính của Việt Nam.

 Hỗ trợ tạo các truy vấn bằng thao tác đơn giản.

 Vận hành trên nền tảng công nghệ in-memory nhằm đảm bảo tốc độ phân tích với lượng dữ liệu lớn của doanh nghiệp.

Tạo ra các dashboard tương tác với biểu đồ, tham biến, tooltip, và chức năng drill up, drill down giúp bạn dễ dàng nắm bắt thông tin từ nhiều góc nhìn khác nhau Liên kết dashboard và giải thích dữ liệu sẽ hỗ trợ bạn trong việc phân tích và đặt câu hỏi về dữ liệu một cách hiệu quả.

 Sử dụng phần mềm Tableau trên các máy di động iOS & Android để phân tích và truy xuất các phân tích & dashboard.

 Khả năng mở rộng dễ dàng đáp ứng yêu cầu mở rộng của doanh nghiệp, độ phức tạp của các nghiệp vụ hiện tại.

Kiến trúc tableau

Kiến trúc của Tableau được xây dựng dựa trên mô hình máy chủ-khách n-tier, trong đó Tableau Server hoạt động như một phần mềm cài đặt trên máy tính để bàn, ứng dụng web và ứng dụng di động Tableau Desktop là công cụ hỗ trợ người dùng trong việc khám phá dữ liệu và chia sẻ thông tin chi tiết, cho phép hiển thị chúng qua chế độ xem được chia sẻ từ Tableau Server.

Kiến trúc tableau được chia thành 3 phần chính bao gồm:

Người dùng có thể lấy dữ liệu từ các nguồn như Oracle, MySQL và file Excel để phục vụ cho việc phân tích Họ có hai phương thức thiết lập kết nối dữ liệu: một là kết nối trực tiếp để gửi truy vấn và nhận kết quả ngay lập tức, hai là trích xuất dữ liệu để tạo bản sao local làm cơ sở dữ liệu tạm thời Dữ liệu có thể được truy xuất qua kết nối trực tiếp hoặc được trích xuất vào cả Tableau Desktop và Tableau Server.

Máy chủ Tableau bao gồm nhiều thành phần phối hợp để quản lý các quy trình quan trọng, phục vụ người dùng thông qua tương tác của khách hàng trên nền tảng mobile và web với dữ liệu.

Người sử dụng Tableau có thể truy cập qua web, thiết bị di động, đám mây hoặc tại cơ sở, cũng như qua giao diện dòng lệnh để phát triển Họ chủ yếu tương tác với Máy chủ Tableau để truy cập các workbook hoặc hình ảnh trực quan.

Hình 2.3 Cấu trúc Tableau (Sc.Https://Tableau.Com)

Data layer

Nền tảng Tableau cho phép người dùng làm việc với môi trường dữ liệu không đồng nhất, bao gồm cơ sở dữ liệu, máy chủ, kho dữ liệu, tệp Excel và Ms Access Bạn không cần phải đưa tất cả dữ liệu vào bộ nhớ trừ khi cần thiết, giúp tối ưu hóa hiệu suất Tableau tận dụng môi trường hiện có của bạn bằng cách áp dụng các tính năng cơ sở dữ liệu để trả lời các câu hỏi một cách hiệu quả.

Data Connectors

Tableau cung cấp đa dạng trình kết nối dữ liệu cho các cơ sở dữ liệu như Microsoft SQL Server, Oracle, Teradata, Vertica, Cloudera Hadoop và nhiều hơn nữa Ngoài ra, Tableau còn hỗ trợ các đầu nối ODBC chung, cho phép kết nối với bất kỳ hệ thống nào mà không cần trình kết nối gốc Người dùng có thể tương tác với dữ liệu qua hai chế độ: kết nối trực tiếp và kết nối trong bộ nhớ, và dễ dàng chuyển đổi giữa hai tính năng này.

Live Connections

Các trình kết nối dữ liệu của Tableau cho phép tận dụng cơ sở hạ tầng dữ liệu hiện có bằng cách gửi câu lệnh SQL động hoặc MDX trực tiếp vào cơ sở dữ liệu nguồn, giúp tiết kiệm thời gian và tài nguyên Nếu bạn đã đầu tư vào một cơ sở dữ liệu tối ưu hóa cho phân tích như Vertica, bạn sẽ nhận được lợi ích từ việc kết nối trực tiếp với dữ liệu Điều này giữ lại dữ liệu chi tiết trong hệ thống nguồn và chỉ gửi kết quả tổng hợp tới Tableau, cho phép sử dụng lượng dữ liệu không giới hạn.

In-memory

Tableau là một công cụ phân tích dữ liệu nhanh chóng và hiệu quả, cho phép người dùng kết nối dữ liệu chỉ bằng một cú nhấp chuột Công cụ này giải nén dữ liệu và lưu trữ trong bộ nhớ, tối ưu hóa phản hồi truy vấn nhanh chóng ngay cả khi làm việc với hàng trăm triệu hàng dữ liệu Nhờ khả năng truy cập cả đĩa lưu trữ, RAM và bộ nhớ cache, Tableau không bị giới hạn bởi dung lượng bộ nhớ hệ thống, giúp đạt được hiệu suất tối ưu mà không cần tải toàn bộ tập dữ liệu vào bộ nhớ.

Install Tableau Desktop

2.11.1 Yêu cầu hệ thống cho Tableau.

Tableau Desktop đều tích hợp được với hệ điều hành Windows và MacOS.

Cấu hình tối thiểu để cài trên hệ điều hành Windows:

 Microsoft Windows 7 or later (64 bit).‐

 Intel Pentium 4 or AMD Opteron processor or later

 Cấu hình tối thiểu để cài trên Mac:

Nếu làm việc với nguồn dữ liệu lớn thì nên cân nhắc cấu hình sau đây:

 Latest service pack or update for your operating system.

 Intel Core i3/i5/i7/i9 or AMD FX processor or later

 At least 8 GB RAM Solid state drive (SSD) ‐ with at least 20 GB of free space

 Full HD resolution‐ (1920 × 1080 pixels) or higher with 32 bit ‐ color depth.

2.11.2 Dowload và cài đặt Tableau Desktop.

To download Tableau, visit [Tableau's official site](https://www.tableau.com/products/desktop) For Windows users, execute the setup file (EXE) and follow the system prompts MacOS users should select the (DMG) file for installation on their machines.

2.11.3 Đăng ký và kích hoạt Tableau Desktop

Sau khi cài đặt xong, bạn có thể mở Tableau bằng cách nhấn vào biểu tượng Tiếp theo, bảng mẫu đăng ký sẽ xuất hiện để bạn tiến hành đăng ký và kích hoạt Tableau của mình.

Nhập khóa của sản phẩm Tableau, nếu chưa có khóa có thể sử dụng miễn phí tất cả các chức năng của Tableau trong 14 ngày.

Kết nối Tableau với cơ sở dữ liệu đa nguồn

2.12.1 Thiết lập kết nối dữ liệu.

Tableau hỗ trợ hơn 50 trình kết nối dữ liệu, cho phép người dùng phân tích dữ liệu từ các tệp Excel, CSV, PDF, cũng như từ các cơ sở dữ liệu, khối dữ liệu và Hadoop cluster Ngoài ra, Tableau còn cung cấp khả năng truy cập dữ liệu từ các dịch vụ đám mây như Google Sheets, Google Analytics, Amazon Redshift và Salesforce Để thêm nguồn dữ liệu vào Tableau, người dùng cần nắm rõ các bước thực hiện.

– Tạo kết nối với các tệp và cơ sở dữ liệu.

Kết hợp các bảng dữ liệu khác nhau thông qua phép nối và phép kết hợp là một kỹ thuật quan trọng trong quản lý cơ sở dữ liệu Ngoài ra, việc thay đổi dữ liệu và kiểu dữ liệu trong mô hình dữ liệu hiện tại cũng đóng vai trò quan trọng trong việc tối ưu hóa hiệu suất và khả năng truy xuất thông tin.

Khi khởi động Tableau, người dùng sẽ thấy các tùy chọn kết nối hiển thị ở bên trái màn hình, trong đó kết nối với tệp được liệt kê ở trên cùng, trong khi các máy chủ cơ sở dữ liệu nằm phía dưới.

Hình 2.4 Giao diện sau khi bật Tableau

*Kết nối với file Để phân tích một tệp dữ liệu, chọn một trong các trình kết nối được liệt kê sẵn, có thể nhấp vào

More -> Other files để tìm kiểu dữ liệu khác có hỗ trợ nếu như không được liệt kê sẵn.

Hình 2.5 Kết nối Excel với Tabeau

Hình 2.6Mở file text trong Tableau

Để phân tích dữ liệu trên máy chủ, bạn cần kết nối với máy chủ cơ sở dữ liệu bằng cách chọn một trong các trình kết nối có sẵn trong mục "To a server" Nếu loại máy chủ bạn cần không có trong danh sách, hãy nhấp vào "More" để xem tất cả các trình kết nối hỗ trợ khác.

Hình 2.7 Nguồn máy chủ khi làm việc với Tableau

*Kết nối máy chủ MS SQL Sever

Hình 2.8Đăng nhập vào SQL Server

Hình 2.9 Đăng nhập vào MySQl

*Kết nối tới dịch vụ Cloud.

Trong số các trình kết nối hiện có, người dùng có thể tìm thấy nhiều dịch vụ đám mây như Dropbox, OneDrive, Salesforce và ServiceNow Ngoài ra, các dịch vụ khác của Google chỉ yêu cầu tài khoản Google miễn phí để sử dụng.

- Google Trang tính: Một công cụ bảng tính tương tự như Excel.

- Google Analytics: Dịch vụ phân tích lưu lượng truy cập trang web.

- Google BigQuery: Kho dữ liệu với 10 GB dung lượng lưu trữ miễn phí mỗi tháng.

Nếu dịch vụ cloud bạn cần không có trong danh sách trình kết nối sẵn có, bạn có thể sử dụng tùy chọn Web Data Connector (WDC) ở cuối danh sách Tuy nhiên, WDC chỉ nên được xem như giải pháp cuối cùng vì hiệu suất không được tối ưu như các trình kết nối có sẵn, có thể làm chậm quá trình phân tích dữ liệu.

2.12.2 Liên kết bảng dữ liệu Để xây dựng nên một mô hình dữ liệu cần thêm vào một trang tính hoặc bảng,

Tableau cung cấp khả năng tùy chọn kết hợp hai hoặc nhiều bảng có quan hệ với nhau

Để kết nối hai bảng trong Tableau, bạn chỉ cần kéo một bảng khác vào khoảng trắng bên phải bảng đầu tiên Ví dụ, khi làm việc với hai bảng movie và movie_cast, sau khi thả chuột, Tableau sẽ hiển thị một cửa sổ cho phép bạn chọn các yếu tố tương ứng từ mỗi bảng để thiết lập liên kết.

Hình 2.10 Nối 2 bảng movie và movie_cast

2.12.3 Kết nối dữ liệu ở chế độ Live hoặc Extract. Đối với đa số các kiểu kết nối dữ liệu, Tableau cung cấp lựa chọn giữa kết nối trực tiếp (Live connection -kết nối trực tiếp đến cơ sở dữ liệu) và trích xuất dữ liệu (Extract connection - snapshot dữ liệu), có thể dễ dàng chuyển đổi giữa hai loại này.

Hình 2.11 Chế độ Live và Extract

Live cho phép làm việc trực tiếp với nguồn dữ liệu và tự động cập nhật khi có thay đổi trong cơ sở dữ liệu Nên sử dụng kết nối Live khi lượng dữ liệu là nhỏ hoặc vừa.

Extract cho phép đóng gói dữ liệu cần thiết cho phân tích và tự động cập nhật khi có thay đổi trong cơ sở dữ liệu Sử dụng hệ thống Tableau Server hỗ trợ chức năng cập nhật tự động theo thời gian quy định Đối với các cơ sở dữ liệu lớn, việc sử dụng kết nối Extract sẽ cải thiện đáng kể tốc độ làm việc.

2.12.4 Chỉnh sửa dữ liệu của mô hình.

Các cột trong bảng thể hiện các thuộc tính của dữ liệu Tableau thường tự động diễn giải dữ liệu một cách chính xác, tuy nhiên, trong một số trường hợp, cần thực hiện chỉnh sửa thủ công, đặc biệt khi mở tệp văn bản.

Dữ liệu có thể được chỉnh sửa trực tiếp bằng cách nhấp chuột phải vào tên trường trong tiêu đề cột.

Hình 2.12 Bảng chỉnh sửa nguồn dữ liệu

Aliases là tên thay thế cho các thành phần trong một dimension Để tạo aliases, hãy chọn Aliases trong cửa sổ Edit aliases, sau đó chọn một thành phần dưới mục Value (Alias) và nhập tên mới Lưu ý rằng không thể tạo aliases cho các dimensions liên tục, ngày tháng, hoặc các measures.

Create Calculated Field: Để tạo trường mới dựa trên hàm logic xác định Việc tạo các trường như vậy thường được thực hiện đặc biệt để trực quan.

Một group cho phép kết hợp các thành viên liên quan trong một trường Để tạo group, bạn chỉ cần chọn "Create Group", sau đó chọn các thành phần muốn nhóm lại và nhấn "Group" Các thành phần được chọn sẽ được kết hợp thành một nhóm duy nhất.

Nếu một trường chứa nhiều thành phần có thể phân tích riêng biệt, thì có thể tách trường đó thành một trường mới một cách hợp lý.

Describe: chọn để tìm hiểu thêm về các thuộc tính của trường, như role, type, local và sort flags.

Mỗi trường trong nguồn dữ liệu được gán một kiểu dữ liệu phù hợp với thông tin lưu trữ Ví dụ, kiểu dữ liệu có thể là giá trị số.

Kiểu dữ liệu của một trường được biểu thị bằng một ký hiệu, như:

:Number :String :Date and Time

Data scource pane

A Ngăn bên trái: Hiển thị chi tiết về dữ liệu mà bạn được kết nối Đối với ví dụ, đối với dữ liệu dựa trên tệp, tên tệp và trang tính sẽ được hiển thị.

B Canvas: Cho phép bạn kéo và thả một hoặc nhiều bảng vào vùng canvas để thiết lập lên nguồn dữ liệu của bạn.

C Grid: Cho phép bạn xem lại 1.000 hàng dữ liệu đầu tiên có trong dữ liệu của bạn nguồn Nó cũng cho phép bạn sửa đổi nguồn dữ liệu của mình như đổi tên trường, sắp xếp, tạo trường, v.v…

D Data grid: Cho phép một người nhấp vào lưới siêu dữ liệu để hiển thị các trường trong nguồn dữ liệu.

E Metadata grid: Hiển thị các trường trong nguồn dữ liệu của bạn dưới dạng hàng.

The Tableau Workspace

Khung trống để hiển thị dữ liệu được trực quan hóa bao gồm tên tiêu đề, Data Pane và Analytics Pane Người dùng có thể kéo Dimensions và Measures lên khung cột, hàng hoặc khung Mark, bộ lọc và thẻ Page để tương tác với dữ liệu Ngoài ra, người dùng có thể quay lại dữ liệu để chỉnh sửa và chuyển đổi giữa các Sheet khác nhau Giao diện còn có thanh menu và thanh công cụ với 3 nút chính giúp tối ưu hóa trải nghiệm làm việc với dữ liệu.

Biểu tượng Tableau cho phép bạn trở về màn hình bắt đầu, nơi bạn có thể dễ dàng thêm các nguồn dữ liệu bổ sung.

 Undo: Điều này cho phép bạn quay lại một bước để bạn có thể an toàn thử các ý tưởng bạn có thể quay lại bao nhiêu bước tùy thích.

 Redo: Điều này cho phép bạn khôi phục mọi hành động đã hoàn tác.

Thanh Menu (14) là thanh có thể cho phép truy cập các tính năng bổ sung, trong đó có các tính năng như:

 File Menu: chứa các chức năng chính như lưu file, lưu file dưới dạng khác nhau.

Menu Dữ liệu trong Tableau cho phép người dùng dễ dàng chèn bảng dữ liệu mới Bạn chỉ cần chọn và sao chép bảng từ tài liệu gốc, sau đó nhấp vào nút Chèn trong Tableau Hành động này sẽ thêm dữ liệu vào cửa sổ làm việc của bạn dưới dạng nguồn dữ liệu mới.

Với tính năng Export trong Tableau, bạn có thể dễ dàng lấy dữ liệu của mình bằng cách tạo hình ảnh, tệp cơ sở dữ liệu hoặc bảng Excel Ngoài ra, bạn cũng có thể mở một trang tính mới trong Tableau và sao chép dữ liệu từ các tệp hoặc hình ảnh mà bạn đã tạo ra.

Menu Dashboard: Các hoạt động trên Dashboard tăng cường tương tác và cho phép bạn thiết lập, chỉnh sửa tổng quan dễ dàng thông qua việc nhấp vào Actions Bạn sẽ khám phá đầy đủ các tính năng như bộ lọc, đánh dấu và nhiều công cụ hữu ích khác.

 Story Menu: cho phép bạn tạo story từ worksheets và dashboard.

 Analysis Menu: Bạn có thể tạo và chỉnh sửa các trường được tính toán.

Trong phần menu bản đồ, người dùng có thể lựa chọn từ nhiều loại bản đồ khác nhau như bản đồ dạng thanh, bản đồ tròn, và bản đồ văn bản Đặc biệt, bạn còn có thể sử dụng bản đồ ngoại tuyến khi không có kết nối internet.

Menu Định Dạng cho phép bạn tùy chỉnh phông chữ, căn chỉnh, tô bóng và các tùy chọn định dạng khác Bạn cũng có thể thiết lập thiết kế tổng thể cho sổ làm việc và điều chỉnh kích thước ô một cách linh hoạt.

 Server Menu: Sử dụng menu này để chia sẻ dashboard của bạn qua Tableau

Trên Tableau Online, Tableau Server hoặc Tableau Public, tính năng Tạo Người Dùng cho phép bạn thiết lập bộ lọc riêng biệt để cấp quyền truy cập cho các người dùng hoặc nhóm người dùng cụ thể (được xác định trong Tableau Online hoặc Tableau Server) đến các dữ liệu đã chọn.

 Window Menu: Sử dụng tùy chọn Presentation Mode để sử dụng toàn màn hình cho bảng điều khiển

Trợ giúp trực tuyến Tableau cung cấp cho bạn các video đào tạo và sách bài tập mẫu Bạn có thể sử dụng tùy chọn "Start Performance" trong phần Cài đặt và Hiệu suất để ghi lại và phân tích thời gian xử lý bảng điều khiển.

The Data Pane

The data pane được chia thành các Measures và Dimensions.

Measures là các biến số và giá trị giúp bạn xác định tập giá trị nào từ dữ liệu để trực quan hóa, từ tổng, trung bình cộng, max, min đến phần trăm Các measures thường được biểu thị bằng màu xanh lá cây.

Dimensions là những giá trị mô tả và phân loại, bao gồm tên, ngày tháng và dữ liệu địa lý Chúng cho phép bạn xác định các giá trị tổng hợp cho measures Thông thường, các dimensions được biểu thị bằng màu xanh nước biển.

2.15.1 Trực quan hóa với các measure

Sau khi kết nối dữ liệu trong Tableau, bạn có thể kéo các giá trị từ Measure vào các cột hoặc hàng để hiển thị thông tin Ví dụ, bạn có thể trình bày tổng doanh thu từ dữ liệu bán hàng một cách trực quan và dễ hiểu.

Hình 2.16Dữ liệu Measure Sales

2.15.2 Trực quan hóa với các dimesion

Cũng giống như Measurea ta có thể kéo các Dimensions lên trên cột và hàng để hiển thị các thông tin mà dimesions mô tả.

Hình 2.17 Dữ liệu Dimesion Customer Name

2.15.3 Làm việc với khung Mark

Mark cung cấp tính năng màu sắc, cho phép thêm chú giải cho dữ liệu và điều chỉnh kích thước cho các giá trị trực quan hóa Bạn có thể kéo thanh Dimension hoặc Measure vào giao diện Mark để thực hiện các thao tác này.

Hình 2.19 Dữ liệu sau khi làm việc với Mark

Mở file menu and click Save as và chọn lưu file dưới dạng các file sau đây:

Tableau Workbook (*.twb) là định dạng chứa tất cả hình ảnh hóa và siêu dữ liệu, nhưng không bao gồm dữ liệu thực tế Khi chia sẻ workbook Tableau, người nhận cần có quyền truy cập vào tệp gốc hoặc cơ sở dữ liệu đã sử dụng.

Tableau Packaged Workbook (*.tpwb) chứa dữ liệu thực tế cùng với hình ảnh hóa và siêu dữ liệu, giúp nén dữ liệu và giảm kích thước tệp Khi chia sẻ tệp này, người nhận có thể mở và làm việc với các hình ảnh trực quan mà không cần quyền truy cập vào nguồn dữ liệu gốc.

Tệp nguồn dữ liệu Tableau (*.tds) chứa thông tin cần thiết để kết nối với nguồn dữ liệu, bao gồm loại nguồn dữ liệu, thông tin kết nối như địa chỉ máy chủ cơ sở dữ liệu, cổng, vị trí tệp cục bộ, cũng như các bảng, nhóm, bộ và trường được tính toán Ngoài ra, tệp này còn lưu trữ các thuộc tính trường mặc định như định dạng số, tổng hợp và thứ tự sắp xếp.

Trực quan hóa với các dạng biểu đồ

Khi sử dụng Tableau, bạn có thể dễ dàng xem các loại biểu đồ bằng cách nhấn vào nút "Show me" ở góc phải màn hình, phù hợp với tất cả dữ liệu mà bạn đang làm việc.

Scatter Plots (biểu đồ phân tán).

Line chars (biểu đồ đường)

Filled Maps and Symbol Maps.

Bản đồ thanh được sử dụng nhiều trog tableau, nó dễ dàng triển khai khi bạn kéo 1 measure với 1 dimesions.

Hình 2.20 Biểu đồ Bar Chart về Doanh thu

Các thay đổi theo thời gian thường được thể hiện rõ ràng qua biểu đồ đường, trong đó các dấu chấm được kết nối bằng các đường thẳng Tableau cũng cung cấp tùy chọn sử dụng jum line hoặc line thay vì biểu đồ đường truyền thống.

Bạn cần có một dimesions dạng ngày tháng năm với dữ liệu là liên tục (Continous) và mesuare

Hình 2.21 Biểu đồ Line Chart

Bảng tô sáng là giải pháp đơn giản để tạo bảng tổng hợp từ Excel Việc thêm màu sắc cho các giá trị giúp bạn dễ dàng nhận diện những thông tin quan trọng trong bảng.

To connect Tableau with Superstore data, drag the Sub-Category field to the Rows shelf and place the Order Day field on the Columns shelf, ensuring that the data is displayed by Month Additionally, present the Total Sales figures in a text format for clarity.

Step 2: Click vào Show Me chọn ở biểu đồ hightlight table.

Trong khung Mark bạn có thể thay đổi màu cho dữ liệu tổng doanh thu(Sales) bằng cách chọn Color -> Edit.

Trong bản đồ nhiệt, các giá trị của số đo được hiển thị bằng các vòng tròn có kích thước khác nhau.

Giá trị cao hơn được biểu thị bằng các vòng tròn lớn hơn và được tô màu đậm hơn, tạo nên bản đồ nhiệt Những giá trị này có thể được tổ chức trong một ma trận, tương tự như cách trình bày trong bảng đánh dấu.

Hình 2.22 Biểu đồ heat map về Doanh thu trong Dữ liệu SuperStore

Biểu đồ dấu đầu dòng là một biến thể của biểu đồ thanh, kết hợp hai biện pháp để thể hiện mối quan hệ giữa chúng Một biện pháp được hiển thị bằng các thanh, trong khi biện pháp còn lại sử dụng các đường tham chiếu cắt ngang Việc vẽ hai biện pháp trên cùng một trục giúp dễ dàng đánh giá trực quan, với sự khác biệt giữa các giá trị được thể hiện qua khoảng cách giữa các thanh và đường tham chiếu Thiết kế đơn giản và gọn nhẹ của biểu đồ này cho phép chứa đựng nhiều thông tin trong một không gian nhỏ.

Trong phần "Show Me", bạn có thể phân tích sự kết hợp giữa các dimensions và measures mà bạn đã chọn Khi kéo một giá trị dimension và một measure, hệ thống sẽ đề xuất các loại biểu đồ phù hợp như biểu đồ cột ngang (horizontal bar) hoặc biểu đồ cột chồng (stacked bar) Nếu bạn chọn một measure kết hợp với một dimension dạng ngày, "Show Me" sẽ gợi ý cho bạn các biểu đồ như biểu đồ đường (line chart) hoặc bản đồ vùng (area chart) để trực quan hóa dữ liệu một cách hiệu quả.

Filter và Hierarchies

Lọc cho phép bạn loại trừ hoặc bao gồm các giá trị cụ thể trong môi trường làm việc Bằng cách sử dụng các bộ lọc, bạn có thể hiển thị các bản ghi cụ thể trong biểu mẫu, báo cáo hoặc truy vấn, cũng như chỉ in những bản ghi nhất định trong các báo cáo hoặc truy vấn đó.

Tableau hỗ trợ các tính năng lọc như sau: lọc measures, lọc dimesions, lọc nhanh, lọc nguồn dữ liệu.

Filtering Dimensions là công cụ phân loại giá trị dữ liệu, giúp người dùng chọn lọc hoặc loại bỏ các giá trị cần thiết cho việc trực quan hóa Bộ lọc này bao gồm nhiều kiểu lọc khác nhau.

– Basic categorical filter (bộ lọc cơ bản)

– Wildcard match filter (bộ lọc ký tự)

– Conditions for filtering (bộ lọc điều kiện)

– Limits to filtering (bộ lọc giới hạn)

Basic categorical filter (bộ lọc cơ bản)

Hình 2.24 Lọc các giá trị cần lấy trong “City Name”

Wildcard match filter (bộ lọc ký tự)

Hình 2.25 Lọc các giá trị trong City Name bắt đầu bằng chữ C

Conditions for filtering (bộ lọc điều kiện)

Hình 2.26 Lọc bằng field (trái) và lọc bằng câu lệnh (phải) của mục ID City

Limits to filtering (bộ lọc giới hạn)

Hình 2.27 Giao diện lọc giới hạn

Bộ lộc của loại dữ liệu này cho phép bạn chọn một loạt các giá trị mà bạn muốn đưa vào để hiển thị dữ liệu

Hình 2.28Các tính toán cho measure

Hình 2.29 Lọc Measures cơ bản

– Range of values: Bao gồm từ giá trị bé nhất được chọn đến giá trị lớn nhất được chọn.

– At least: Bao gồm tất cả các giá trị lớn hơn hoặc bằng với các giá trị lựa chọn nhất định.

– At most: Bao gồm tất cả các giá trị nhỏ hơn hoặc bằng với các giá trị lựa chọn nhất định.

– Special: Giúp bạn lọc các giá trị rỗng Chỉ bao gồm các giá trị rỗng, các giá trị không rỗng hoặc tất cả các giá trị.

Bộ lọc nhanh cho phép bạn nhanh chóng hiển thị các sự kiện phù hợp với tiêu chí đã chọn Bạn có thể tìm thấy thanh lọc nhanh ở bên phải của trang worksheets.

Hình 2.30 Giao diện lọc nhanh

Bộ lọc nguồn dữ liệu giúp bạn giảm lượng dữ liệu trong nguồn dữ liệu.

Hình 2.31 Giao diện add filter dữ liệu nguồn

Hệ thống phân cấp trong Tableau cho phép người dùng truy cập sâu vào các báo cáo một cách dễ dàng Việc tạo ra hệ thống phân cấp trong Tableau là một quá trình đơn giản, giúp nâng cao khả năng phân tích dữ liệu.

Ví dụ: Trong dữ liệu Superstore chúng ta cần phân cấp mục Category với mục Sub- Category.

Nhấn shift chọn Category và Sub-Category, click chuột phải chọn Create Hierarchy.

Các hàm tổng hợp, calculated field và parameter

Mặc định, Tableau sử dụng hàm Sum để tổng hợp dữ liệu, nhưng không phải lúc nào cũng phù hợp Để sử dụng hàm tổng hợp khác, hãy nhấp vào mũi tên nhỏ khi di chuột qua measure, chọn Measure (Sum) và chọn hàm tổng hợp phù hợp nhất cho nhu cầu của bạn.

Hình 2.33 Các lựa chọn kiểu tính toán của measure

Các loại hàm tổng hợp được Tableau hỗ trợ :

Trả về giá trị của biểu thức nếu chỉ có một giá trị duy nhất cho tất cả các hàng trong nhóm; nếu không, hiển thị dấu hoa thị (*) Giá trị null sẽ bị bỏ qua, và tổng hợp này thường được sử dụng cho dimension Để thiết lập một measure thành tổng hợp này, hãy nhấp chuột phải vào measure và chọn Attribute Trường sẽ thay đổi để hiển thị văn bản ATTR: ví dụ, ATTR (Sales).

Trả về tổng các số trong measure, bỏ qua giá trị null (rỗng).

Trả về trung bình cộng các số trong một measure, bỏ qua giá trị rỗng

Trả về số lượng giá trị duy nhất trong measure hoặc dimension, Tableau sẽ tạo một cột tạm thời để tính toán khi áp dụng cho một dimension, vì kết quả của count là một con số Bạn có thể đếm các loại dữ liệu như số, ngày tháng, boolean và chuỗi, đồng thời bỏ qua các giá trị rỗng.

Trả về giá trị nhỏ nhất trong một measure hoặc continuous (liên tục) dimension, bỏ qua giá trị rỗng.

Trả về giá trị lớn nhất trong một measure hoặc biểu thức cụ thể từ tập hợp mẫu, đồng thời loại bỏ các giá trị rỗng Nếu tập hợp không rỗng có ít hơn 2 đối tượng, hàm sẽ trả về Null Sử dụng hàm này khi dữ liệu của bạn đại diện cho một mẫu tập hợp.

Trả về độ lệch chuẩn của tất cả các giá trị trong biểu thức dựa trên tổng thể Hàm này được sử dụng cho các mẫu có kích thước lớn với các đối số là toàn bộ tập hợp.

Trả về phương sai của tất cả các giá trị trong biểu thức đã cho dựa trên một mẫu, loại bỏ các giá trị rỗng Nếu mẫu có ít hơn 2 đối tượng không Null, trả về Null Sử dụng hàm này khi dữ liệu của bạn đại diện cho một mẫu tập hợp.

Trả về phương sai của tất cả các giá trị trong biểu thức dựa trên tổng thể, với các đối số bao gồm toàn bộ tập hợp Hàm này thích hợp cho các mẫu cỡ lớn.

Khi trực quan hóa dữ liệu, thường không bị hạn chế về các dimention và measure, ta cũng có thể tự thêm vào các calculated field tuỳ ý.

Các phép tính này được lưu dưới dạng các trường mới trong mô hình dữ liệu và có thể được sử dụng làm dimention hoặc measure tuỳ trường hợp.

Bắt đầu bằng cách nhấp vào mũi tên nhỏ ở đầu Data pane (ở bên phải tiêu đề dimention) Trong menu, chọn mục nhập đầu tiên, Create Calculated field.

Tableau sẽ mở một cửa sổ trống để nhập các lệnh tính toán Đầu tiên, bạn cần đổi tên trường từ Calculation1 thành tên tùy ý Sau đó, hãy thêm công thức vào trường trống để thực hiện phép tính.

Lấy ví dụ, để tính được tổng doanh thu của movie ta cần lấy Revenue trừ đi Budget vậy câu lệnh sẽ là:

Ví dụ này chỉ sử dụng hàm SUM; tuy nhiên, để hiểu rõ hơn về các hàm khác và cách sử dụng chính xác của chúng, hãy nhấp vào mũi tên màu xám ở lề phải để khám phá thêm.

Hình 2.35 Giao diện nhập lệnh vào Calculated Field

Nếu công thức đúng, phép tính hợp lệ sẽ xuất hiện ở góc dưới cùng bên trái của cửa sổ Bấm OK để tạo trường và đóng cửa sổ.

Cũng giống như các trường gốc của dữ liệu, giờ ta có thể thả các calculated field vào để tạo các loại biểu đồ khác nhau.

Hình 2.36Sử dụng Calculated Field để tính toán

2.18.3 Trường dữ liệu ngày tháng

Các kiểu chức năng ngày tháng được sử dụng trong Tableau:

Thời gian Ý nghĩa Các giá trị được cho phép

'hour' Giờ 0–23 hoặc 1am, 12pm,…

'weekday' Các ngày trong tuần 1–7 hoặc Thứ hai, thứ ba,…

'iso weekday'‐ Các ngày trong tuần theo chuẩn ISO 8601 1–7 hoặc Thứ hai, thứ ba,…

'week' Các tuần trong năm 1–52

'iso week'‐ Các tuần trong năm theo chuẩn ISO 8601 1–52

'dayofyear' Các ngày trong năm 1–365

'month' tháng 1–12 hoặc tháng một, tháng hai,…

'iso quarter'‐ Quý tính theo chuẩn ISO 8601 1–4

'iso year'‐ Cách viết năm theo chuẩn ISO 8601 Ví dụ: 2020, 2021,…

2.18.4 Các hàm tính ngày tháng

Hàm DATEADD cho phép người dùng thêm một khoảng thời gian cụ thể vào một ngày nhất định Để sử dụng hàm này, cần chỉ định cả phần đơn vị thời gian (như 'day') và độ dài của khoảng thời gian muốn thêm.

Để tính thời gian giao hàng cho một đơn đặt hàng có thời gian giao hàng là ba ngày, bạn có thể áp dụng công thức tính từ ngày đặt hàng.

DATEADD ('day', 3, [Ngay dat hang])

Vì vậy, nếu ngày đặt hàng là 25/05/2020 thì hàm này sẽ trả về 28/05/2020 là ngày giao hàng dự kiến.

Hàm DATEDIFF: Trả về một giá trị số nguyên thể hiện thời gian đã trôi qua được đo bằng phần ngày cụ thể (day, month, quarter,…).

Để tính số ngày đã trôi qua kể từ khi đặt hàng, bạn có thể sử dụng công thức DATEDIFF ('day', [Ngày đặt hàng], TODAY ()) Trong đó, 'day' chỉ ra rằng thời gian được tính bằng ngày, [Ngày đặt hàng] là ngày bắt đầu, và hàm TODAY được dùng để lấy ngày hiện tại làm ngày kết thúc Ví dụ, nếu hôm nay là 25/05/2020 và đơn hàng được đặt vào 10/05/2020, kết quả sẽ là 15 ngày.

Hàm DATEPART: trả về giá trị của chỉ phần ngày được khai báo dưới dạng số nguyên

Để báo cáo số liệu tài chính cho nửa cuối năm, bạn có thể tạo trường "half_year" và sử dụng trường này để lọc dữ liệu Trước tiên, cần xác định tháng mà đơn hàng được đặt.

DATEPART ('month', [Ngay dat hang])

Nếu ngày đặt hàng là 25/02/2020 thì kết quả sẽ trả về số 2.

Hàm DATENAME: trả về tên đầy đủ của phần ngày tháng.

DATENAME ('month', [Ngay bat dau]) + ' to' + DATENAME ('month', [Ngay ket thuc])

Khi có hai bảng [Ngày bắt đầu] và [Ngày kết thúc] với dữ liệu ngày tháng, trong đó ngày bắt đầu là 19/02/2020 và ngày kết thúc là 20/05/2020, kết quả trả về sẽ là “Tháng Hai đến Tháng Năm”.

Hàm DAYPARSE: định dạng lại kiểu sắp xếp ngày tháng.

DATEPARSE ('dd/MM/yyyy', [Ngay ban dau])

Nếu ngày ban đầu là 05/23/2020 thì kết quả trả về sẽ là 23/05/2020.

Parameter là công cụ giúp thu thập thông tin đầu vào từ người dùng trên worksheet và dashboard Các giá trị này có thể được sử dụng trong các trường tính toán hoặc hiển thị dưới dạng đường tham chiếu trong biểu đồ.

Bảng tính toán và mức độ chi tiết (LOD)

Các dạng Calculated field đã được giới thiệu trong Chương 4 thường được đánh giá ở mức độ sử dụng riêng lẻ Tuy nhiên, với Bảng tính toán và Mức độ chi tiết (LOD), người dùng có thể thực hiện nhiều phân tích nâng cao hơn.

Bảng tính đã được tạo sẵn cho phép người dùng thực hiện nhanh chóng các phép tính thông dụng mà không cần nhập công thức.

LOD cho phép xác định các dimension để phân chia dữ liệu, khác với các công thức trong calculated field thông thường Điều này giúp người dùng không bị giới hạn bởi các dimension sử dụng trong việc tạo biểu đồ.

Các kiểu dữ liệu khác nhau quyết định các loại tính toán khác nhau trong Tableau Khi có thể, Tableau thực hiện phép tính trực tiếp trong cơ sở dữ liệu, điều này không thể xảy ra với Bảng tính, nơi dữ liệu được xử lý trước khi phân tích và áp dụng bộ lọc Do đó, các phép tính trong Bảng luôn được thực hiện ngay trong Tableau.

Tùy thuộc vào loại phép tính, dữ liệu vào khác nhau, và do đó thời gian xử lý cũng khác nhau.

Các loại tính toán Mức độ đánh giá Thời gian xử lý Row level và ‐ aggregate calculation

Hàng đơn được được xác định bởi dimention

Bảng tính Dữ liệu trong chế độ xem sau khi bộ lọc đã được áp dụng

Tính Độ chi tiết Kích thước cụ thể (không phụ thuộc vào kích thước được sử dụng trong chế độ xem)

Thứ tự các bước xử lý là yếu tố quan trọng để hiểu ảnh hưởng của quá trình này đối với phép tính Cần xem xét các bước xử lý cho các trường tính toán, bộ lọc và bảng tính, vì thứ tự áp dụng các bước xử lý có thể khác nhau và ảnh hưởng đến kết quả cuối cùng.

1 Tableau tạo một truy vấn và gửi nó đến nguồn dữ liệu.

2 Cơ sở dữ liệu sẽ xử lý truy vấn đó Các câu lệnh LOD sẽ được xem xét trong bước này.

3 Tableau tạo một bảng tạm thời Các hàng đã được lọc sẽ bị loại trừ khỏi bảng này và các calculated field sẽ được thêm vào dưới dạng các cột mới.

4 Hiện tại chỉ có Bảng tính là được xử lý vì lúc này Tableau sử dụng bảng tạm thời này làm cơ sở.

5 Biểu đồ được kết xuất.

Bảng tính được tạo ra từ dữ liệu hiển thị trong chế độ xem Sau khi xây dựng biểu đồ đầu tiên, người dùng có thể nhanh chóng mở Bảng tính bằng cách sử dụng các bảng tính nhanh mà Tableau đã cung cấp sẵn, bao gồm các loại như tỷ lệ, thứ hạng, tổng tích lũy và đường trung bình.

Thiết lập một bảng tính nhanh.

Hình 2.42 Thiết lập bảng tính nhanh

Tùy thuộc vào loại dữ liệu trong worksheet, một số phép tính có thể không được hỗ trợ, dẫn đến việc các mục nhập liên quan bị chuyển sang màu xám.

Mặc dù Bảng tính cho thấy doanh số được thiết lập nhanh chóng, nhưng cần chú ý đến một số cài đặt khác để đảm bảo kết quả chính xác Để chỉnh sửa Bảng tính, hãy nhấp chuột phải vào doanh số và chọn "Chỉnh sửa Bảng tính".

Hình 2.43 Điều chỉnh bảng tính

Sau khi mở cửa sổ cấu hình Bảng tính, hãy tích vào tùy chọn "Show calculation assistance" ở phía dưới Việc này sẽ hiển thị đánh dấu trên biểu đồ trong quá trình cửa sổ mở, tùy thuộc vào loại biểu đồ mà bạn đang sử dụng.

Hình 2.44 Các lựa chọn điều chỉnh bảng tính

Phần được đánh dấu màu vàng hiển thị thứ tự của các dấu trong ô của chúng khi vào Bảng tính

2.19.3 Mức độ thể hiện chi tiết.

Mức độ chi tiết (LOD) và Bảng tính có những điểm tương đồng, nhưng cũng tồn tại nhiều khác biệt quan trọng Trong một số trường hợp, cả hai phương pháp đều mang lại kết quả tốt, nhưng có những tình huống mà chỉ một trong hai là phù hợp Điểm khác biệt nổi bật là các tính LOD được thực hiện trực tiếp trong nguồn dữ liệu, cho phép chỉ dữ liệu đã tổng hợp cần chuyển sang Tableau Nếu cơ sở dữ liệu đủ khả năng tính toán, điều này có thể cải thiện hiệu suất một cách đáng kể.

Các từ khóa và cú pháp. Để tính được LOD thì ta nhập vào các calculated field cú pháp sau:

Biểu thức LOD trong Tableau được đánh dấu bằng dấu {, với là phép tính tiêu chuẩn sử dụng hàm tổng hợp Từ khóa chỉ định các dimension cụ thể trong (), giúp xác định mức độ chi tiết của phép tính.

Các từ khóa có thể được sử dụng như sau:

Từ khóa FIXED được sử dụng để chỉ định các dimension nhằm xác định mức độ chi tiết, bất kể dimension nào được áp dụng trong biểu đồ.

Ví dụ: { FIXED [Segment] : SUM([Revenue]) }

- INCLUDE: Keyword INCLUDE được sử dụng để đưa vào thủ công một hoặc nhiều dimention khác ngoài những dimention đã được sử dụng trong chế độ xem.

Ví dụ: { INCLUDE [film title] : SUM([Revenue]) }

- EXCLUDE: Keyword EXCLUDE được sử dụng để loại bỏ thủ công một hoặc nhiều dimention khác ngoài những dimention đã được sử dụng trong chế độ xem.

Ví dụ: { EXCLUDE [Company] : SUM([Revenue]) }

Phân tích theo từng nhóm.

Tạo một calculated field, đặt tên là khoản đầu tư và nhập công thức sau.

Trước khi bắt đầu tính toán, hãy tạo một biểu đồ cột với Revenue ở hàng và Release day ở cột Sau đó, trong phần Marks, hãy chuyển đổi loại biểu đồ từ Automatic sang Bar.

Hình 2.46 Sử dụng Fixed keyword

2.19.4 Mức trung bình trong một khu vực.

Để tính giá trị trung bình doanh thu của mỗi bộ phim, trước tiên cần xác định tổng doanh thu của từng bộ phim Sau đó, có thể sử dụng biểu thức LOD để tạo một trường tính toán mới, được gọi là "Doanh thu của mỗi bộ phim", và nhập công thức tương ứng.

Tương tác Dashboard

2.20.1 Create Dashboard. Để tạo trang dashboard trong Tableau, hãy nhấp vào nút New Dashboard, nút này là tiếp theo của nút New Worksheet.

Trong trang Dashboard bao gồm các bảng điều khiển sau:

Chức năng Xem trước thiết bị cho phép bạn xem giao diện dashboard trên các thiết bị khác nhau như iPad, máy tính thông minh, và nhiều hơn nữa Bạn cũng có khả năng điều chỉnh kích thước của dashboard để phù hợp với từng loại thiết bị.

Sheet: Là phần quan trọng nhất trong Dashboard, bạn có thể thêm vào dashboard các sheet mà bạn tạo được.

Object: Object cho phép bạn thêm các đối tượng đặc biệt như : Văn bản, hình ảnh, wed page, các bảng cột hoặc dòng.

Bạn có thể chuyển đổi giữa chế độ Tiled và Floating Khi chọn chế độ Tiled, các đối tượng trang tính và bảng điều khiển sẽ được sắp xếp cạnh nhau trong một lưới Ngược lại, khi chọn chế độ Floating, các phần tử có thể được di chuyển và định kích thước độc lập, cho phép chúng chồng lên nhau Cuối bảng điều khiển, có một hộp kiểm để hiển thị tiêu đề của bảng điều khiển.

2.20.3 Xây dựng bản đồ trên Dashboard.

Both worksheets and objects can be placed on the dashboard by dragging items from the Dashboard Pane to the area labeled "Drop Sheets Here." First, prepare separate worksheet pages, and then drag these pages onto the dashboard For instance, you might prepare three worksheets: Sales, Profit, and Map.

Hình 2.52Add các Sheet vào Dashboard

Nhấp chuột phải vào tab Dashboard ở cuối màn hình và chọn "Đổi tên" trong menu ngữ cảnh Sau đó, nhập tên mà bạn muốn, ví dụ như "Doanh số" Cuối cùng, chọn tùy chọn "Hiển thị".

Hình 2.53 Đặt tiêu đề dashboard

Dashboard actions giúp khách hàng khám phá dữ liệu một cách trực quan và hiểu rõ hơn mối liên hệ giữa các biểu đồ Các hành động này có thể được thiết lập để lọc, đánh dấu biểu đồ, mở nội dung web hoặc gửi email thông báo Người dùng nâng cao có thể sáng tạo trong việc sử dụng dashboard actions để thiết lập những liên kết tinh vi giữa các biểu đồ.

 Filter actions: Lọc các biểu đồ charts dựa trên lựa chọn trong nguồn đồ thị.

 Highlight actions: Đánh dấu các điểm nổi bật trong đồ thị đã chọn.

 URL actions: Mở nội dung wed.

 Set actions: Thay đổi dữ liệu trong set.

 Go to sheet actions‐ ‐ : Đưa người dùng đến sheet hay dashboard khác.

Filter actions là công cụ hữu ích để kết nối hai biểu đồ và nhiều loại khác nhau Đầu tiên, chọn trang tính trên bảng điều khiển mà bạn muốn áp dụng bộ lọc Khi khung màu xám xuất hiện, hãy mở menu nhỏ bên cạnh Nhấp vào nút thứ ba từ trên xuống, có biểu tượng hình phễu, được gán nhãn "Use as Filter".

Hình 2.54 Bộ lọc của dashboard

Thêm và chỉnh sửa bộ lọc và Highlight Actions.

Bạn có thể chọn Use as Filter ngay tại bên phải của sheet trên Dashboard hoặc chọn Worksheet-> action trên thanh công cụ.

Hình 2.55 Chọn Actions trên thanh Menu

Đôi khi, việc tham khảo nội dung từ các trang web như trang sản phẩm, biểu mẫu hoặc toàn bộ trang web có thể rất hữu ích ngay trong Dashboard của bạn Để thực hiện điều này, bạn chỉ cần kéo trang web vào thanh Object và nhập tên của trang đó.

Hình 2.57 Thêm Giao diện Wed vào dasboard

TabPy-Python kết hợp Tableau

TabPy là một tiện ích mở rộng phân tích từ Tableau, cho phép người dùng thực thi các lệnh Python và hàm đã lưu trong Tableau Nhờ vào TabPy, Tableau có khả năng chạy các tập lệnh Python và hiển thị kết quả dưới dạng hình ảnh hóa Người dùng có thể kiểm soát dữ liệu gửi đến TabPy thông qua các tương tác trên trang tính Tableau và bảng điều khiển, sử dụng các tham số.

Cài đặt tabpy bằng cách sử dụng Anaconda navigator,nhập lệnh “pip install tabpy”

Sau khi đã cài đặt thành công Tabpy, nhập lệnh “tabpy” để khởi động gói mở rộng.

Hình 2.59Cài đặt thành công

Tabpy hoạt động trên máy tính cục bộ tại port 9004, có thể vào một trình duyệt bất kỳ để kiểm tra

Hình 2.60 Thông tin máy chủ TabPy

2.21.3 Kết nối Tableau vào TabPy

Tại giao diện của Tableau, mở help, trỏ đến Setting and Performance sau đó chọn Manage External Service Connection.

Hình 2.61 Kết nối Tableau và Tabpy

Sau khi nhấp vào sẽ có một cửa sổ thông báo, chọn Edit Tabpy Connection sau đó nhập thông tin của máy chủ Tabpy vào và ấn Save.

Hình 2.62Kết nối Tabpy vào Tableau

Nhập vào thông tin xong, bấm test connection để kiểm tra xem Tableau đã được kết nối với Tabpy chưa

Hình 2.63 Hoành thành kiểm tra kết nối

Có hai cách thường được sử dụng để tính toán trong Tabpy:

– Viết code trực tiếp dưới dạng các calculated field bằng Tableau Sau đó, code sẽ được thực thi ngay lập tức trong máy chủ TabPy.

– Triển khai một chức năng vào máy chủ TabPy có thể truy cập được dưới dạng điểm cuối REST API.

Dựa trên cơ sở dữ liệu công khai của các công ty cho thuê nhà và phòng AirBnb, chúng tôi đã tiến hành phân cụm các khu nhà theo đặc điểm thông qua mã zip, sử dụng một số thuật toán phân cụm phổ biến.

Trước hết, thông qua mã zip sẽ phân cụm:

– Số lượng xếp hạng trung bình.

– Cần tạo hai tham số sẽ được sử dụng để chọn phương pháp phân nhóm và số lượng cụm, đó là:

Hình 2.64 Tham số Số cụm

Hình 2.65Tham số Thuật toán phân cụm

Bây giờ, với các tham số đã có, hãy tạo một tập mã lệnh Python dưới dạng một trường tính toán Mã này sẽ được đặt trong hàm SCRIPT_REAL() của Tableau và sẽ thực hiện các chức năng cần thiết.

– Nhập các thư viện Python.

– Chia tỷ lệ với Bộ chia tỷ lệ chuẩn.

– Kết hợp các Tính năng được chia tỷ lệ và xử lý các giá trị rỗng.

– Kiểm tra điều kiện xem nên sử dụng thuật toán nào.

– Trả về kết quả phân cụm dưới dạng danh sách.

Trong quá trình tạo clustering, bởi vì thực hiện tính toán thông qua mã zip nên cần thay đổi bảng tính toán mặc định (Default Table Calculation) thành zipcode.

Hình 2.67 Định dạng bảng tính toán mặc định

Bằng cách sử dụng mã zip, chúng ta có thể tạo ra bản đồ trực quan hóa kết quả, giúp việc phân cụm trở nên dễ dàng và rõ ràng hơn.

Hình 2.68 Phân cụm các khu nhà, phòng cho thuê của AirBnb tại New york

ỨNG DỤNG TABLEAU TRỰC QUAN HÓA DỮ LIỆU

Thực nghiệm truy vấn trên dữ liệu SQL Server

3.1.1 Mô tả dữ liệu liên kết bảng MOVIES

Nguồn dữ liệu được lấy từ [Database Star](https://www.databasestar.com/), nơi cung cấp nhiều bộ dữ liệu miễn phí Dữ liệu về phim ảnh bao gồm thông tin từ các bộ phim sản xuất từ năm 1906 đến 2017, bao gồm nhà sản xuất, diễn viên, đạo diễn và nhiều thông tin khác Bộ dữ liệu này bao quát các bộ phim nổi tiếng từ các nền điện ảnh lớn trên toàn thế giới như Mỹ, Hàn Quốc, Trung Quốc, Anh, Ấn Độ và hơn 80 quốc gia khác.

Cơ sở dữ liệu này chứa thông tin chi tiết về phim, bao gồm dàn diễn viên, đoàn phim, địa điểm sản xuất, công ty sản xuất, ngôn ngữ, thể loại và các từ khóa liên quan.

Dữ liệu mẫu được thu thập từ một nguồn trực tuyến miễn phí, bao gồm khoảng 4.800 bộ phim và 104.000 diễn viên, cùng với hàng nghìn bản ghi siêu dữ liệu như ngôn ngữ và từ khóa.

Bảng movie cung cấp thông tin chi tiết về từng bộ phim, bao gồm tên phim và mô tả tổng quan Ngoài ra, bảng còn ghi nhận các chỉ số quan trọng như doanh thu, ngân sách sản xuất và các trường khác được tính toán từ dữ liệu nguồn, bao gồm mức độ phổ biến và đánh giá từ người xem.

Bảng Country liệt kê các quốc gia khác nhau, trong khi bảng movie_country ghi lại các bộ phim được quay tại những quốc gia này, vì nhiều phim có thể được sản xuất tại nhiều địa điểm khác nhau Tương tự, bảng production_company cung cấp danh sách các công ty sản xuất, với mối quan hệ nhiều-nhiều được thể hiện qua bảng movie_company, nơi các bộ phim được liên kết với các công ty sản xuất tương ứng.

Bảng Language chứa danh sách các ngôn ngữ, trong khi bảng movie_languages ghi lại các ngôn ngữ được sử dụng trong một bộ phim Đặc biệt, bảng language_role bổ sung thêm thông tin với hai bản ghi: Bản gốc và Bản dịch Mỗi bộ phim có thể có một ngôn ngữ gốc, chẳng hạn như tiếng Anh, nhưng có thể được dịch sang nhiều ngôn ngữ khác, và điều này được phản ánh trong bảng movie_languages.

Các thể loại phim, như Hài hoặc Kinh dị, giúp xác định nội dung phù hợp cho người xem Một bộ phim có thể thuộc nhiều thể loại khác nhau, và thông tin này được lưu trữ trong bảng movie_genres.

Bảng keyword, có nhiều từ khóa liên quan tới bộ phim.

Cơ sở dữ liệu về diễn viên và phi hành đoàn có cấu trúc phức tạp hơn, bao gồm các cá nhân như diễn viên, nhân viên đoàn phim, mỗi người đảm nhận vai trò khác nhau trong một bộ phim Thay vì liệt kê tên riêng cho từng thành viên, cơ sở dữ liệu này sử dụng một bảng gọi là "Person" để lưu trữ tên của tất cả các cá nhân liên quan.

Bảng movie_cast chứa các bản ghi của từng người trong một bộ phim với tư cách là một diễn viên

Bảng movie_cast kết nối với bảng Gender để xác định giới tính của từng nhân vật, trong khi bảng movie_crew lưu trữ thông tin về tất cả các thành viên phi hành đoàn cho từng bộ phim Mỗi thành viên trong phi hành đoàn được ghi lại cùng với công việc của họ trong bảng department, chẳng hạn như Camera.

Hình 3.69 Mô hình liên kết dữ liệu movies

3.1.2 Một số thống kê trực quan hóa dữ liệu trên bộ dữ liêu Movies

1 Thống kê số lượng phim từng năm trong dữ liệu từ 2005  2015

2 Thống kê top 10 phim doanh thu cao nhất của hãng phim Sony

3 Top 10 bộ phim có doanh thu cao nhất từ năm 1906 đến năm 2017.

4 Thống kê số phim trong từng năm của Mỹ trong khoảng 2010-2016  line

5 Thống kê số phim trong năm 2016 của từng quốc gia trên thế giới.

6 Thống kê top 10 phim có doanh thu cao nhất của Mỹ từ năm 1906 đến năm

7 Thống kê top 10 phim có doanh thu thấp nhất của Mỹ trong năm 2015.

8 Thống kê số phim đã đóng trong từng năm của các diễn viên sau trong giai đoạn

2005 đến 2015 Johnny Depp, Adam Sandler, Jackie Chan, Brad pitt.

9 Thống kê số phim đạt doanh thu trên 100 triệu đô trong từng năm của hãng Pixar Animation Studios từ 2010 – 2016.

10 Thống kê số phim sản xuất trong từng năm của các hãng Universal Studios, Sony Pictures, Columbia Pictures, Walt Disney Pictures, Pixar Animation

11 Thống kê % số lượng phim của từng quốc gia trong năm 2016  Pie

12 Thống kê số lượng phim phát hành theo mùa (xuân, hè, thu, đông  dựa theo tháng phát hành) của Mỹ trong năm 2016.

13 Thống kê số phim trong từng năm của các cường quốc điện ảnh (Mỹ, Trung Quốc, Hàn quốc, Pháp, Ấn độ) trong khoảng 2010-2016  Dạng bar và line.

14 Thống kê top 10 diễn viên có số lượng phim nhiều nhất trong dữ liệu

15 Thống kê số phim sản xuất trong từng năm của hãng Universal trong giai đoạn 2013-2015

16 Thống kê top 10 phim doanh thu thấp nhất của Walt Disney Pictures.

17 Thống kê số phim đã đóng trong từng năm của diễn viên Brad Pitt trong giai đoạn: 2000 đến 2016.

18 Thống kê top 10 đạo diễn có nhiều phim nhất (kèm số lượng phim) của Mỹ.

19 Thống kê % số lượng phim của từng quốc gia trong các năm 2014, 2015, 2016  mỗi năm 1 pie

20 Thống kê số lượng phim theo từng thể loại trong các năm 2010  2016.

Thực nghiệm trên dataset dạng big data

3.2.1 Mô tả dữ liệu Olympic

Dữ liệu từ Kaggle, một nền tảng nổi tiếng cung cấp hơn 50.000 bộ dữ liệu miễn phí từ nhiều lĩnh vực như khoa học, giáo dục, y tế và xã hội lịch sử, hỗ trợ sinh viên và những người nghiên cứu kinh tế Kaggle cũng có hơn 400.000 notebook, giúp người dùng dễ dàng tiếp cận và học hỏi trong lĩnh vực dữ liệu và machine learning.

Dữ liệu Olympic là một tập dữ liệu lịch sử về Thế vận hội Olympic hiện đại, bao gồm tất cả các Thế vận hội Athens 1896 đến Rio 2016

Lưu ý rằng trước năm 1992, Thế vận hội Mùa đông và Mùa hè được tổ chức trong cùng một năm Tuy nhiên, từ năm 1994, Thế vận hội Mùa đông đã được điều chỉnh để diễn ra theo chu kỳ 4 năm, bắt đầu từ năm 1994, tiếp theo là Thế vận hội Mùa hè vào năm 1996 và Thế vận hội Mùa đông vào năm 1998.

Tệp VĐV_events.csv bao gồm 271116 hàng và 15 cột, trong đó mỗi hàng đại diện cho một vận động viên tham gia thi đấu trong các sự kiện Olympic cá nhân Các cột trong tệp này chứa thông tin chi tiết về từng vận động viên và sự kiện mà họ tham gia.

1 ID- Số duy nhất cho mỗi vận động viên

2 Name - Tên vận động viên

8 NOC - Mã 3 chữ cái của Ủy ban Olympic Quốc gia

11 Seasons- Mùa hè hoặc mùa đông

12 City - Thành phố đăng cai

15 Medal- Vàng, Bạc, Đồng hoặc NA

3.2.2 Trực quan hóa dữ liệu

1 Top 10 vận động viên nhiều huy chương vàng nhiều nhất (số huy chương).

2 Cho biết top 10 quốc gia đạt được nhiều huy chương nhất->cột bar và số huy chương (vàng, bạc , đồng)->cột line.

3 Cho biết những môn thể thao đạt nhiều huy chương nhất của Mỹ tại thế vận hội từ năm 2000-2016.(kèm số lượng).

4 Cho biết top 10 vận động viên đạt nhiều huy chương nhất của môn bơi lội qua các kỳ olimic từ năm 2004-2016 (kèm số lượng huy chương).

5 Cho biết tỷ lệ giới tính trong các cuộc thy Olympic từ trước tới hiện tại.

6 Cho biết tên các vận động viên đạt huy chương trong bơi tự do 1500m nam trong Olympic 2016.

7 Tỷ lệ vận động viên nam và nữ tham gia thế vận hội London năm 1908, 1948 và 2012.

8 Cho biết số huy chương mà đội tuyển Mỹ dành được từ năm 2010-2016.

9 Cho biết số huy chương đội tuyển Mỹ đạt được tại Olympic mùa đông 2006.

10 Cho biết thành phố tổ chức nhiều lần thế vận hội nhất.

11 Cho biết 10 đội tuyển dành được nhiều huy chương nhất thế vận hội 2016.

12 Cho biết huy chương vàng của đội tuyển Trung Quốc qua các năm -> dạng line.

13 Cho biết Việt Nam nhận được bao nhiêu huy chương từ 2007-2016

14 Cho biết ở bộ môn bơi lội, top 5 nước giành được nhiều huy chương vàng nhất

15 Cho biết các đội tuyển quốc gia nào đạt được huy chương tại bộ môn bóng đá từ năm 2000-2016.

16 Cho biết top 5 vận động viên của Mỹ đạt được nhiều huy chương vàng nhất.

17 Cho biết số huy chương đội tuyển Ấn Độ đạt được từ năm 1900 đến năm 2016 và trung bình số huy chương đạt được.

18 Cho biết tỷ lệ đat huy chương vàng của các nước tham gia thế vận hội 2006.

19 Cho biết số lượng các huy chương mà các nước tham gia Olympic 2010.

20 Cho biết số huy chương mà các quốc gia đạt được từ năm 1980-2000

Ngày đăng: 22/12/2021, 20:42

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[9] Movies : https://www.databasestar.com/sample-database-movies/ Link
[10] Olympic: https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results?select=athlete_events.csv Link
[11] Airbnb: https://public.tableau.com/en-us/s/resources Link
[1] Visual Data Storytelling with Tableau, Lindy Ryan, 2018 [2] Visual Analytics with Tableau, Alexander Loth, 2019 Khác
[3] Prepare Your Data For Tableau: A Practical Guide To The Tableau Data Prep Tool, Tim Costello, Lori Blackshear, 2020.Website Khác

HÌNH ẢNH LIÊN QUAN

Hình 1.1Hệ quản trị cơ sở dữ liệu - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 1.1 Hệ quản trị cơ sở dữ liệu (Trang 12)
Hình 2.4 Giao diện sau khi bật Tableau - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 2.4 Giao diện sau khi bật Tableau (Trang 23)
Hình 2.5 Kết nối Excel với Tabeau - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 2.5 Kết nối Excel với Tabeau (Trang 24)
Hình 2.7 Nguồn máy chủ khi làm việc với Tableau - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 2.7 Nguồn máy chủ khi làm việc với Tableau (Trang 25)
Hình 2.9 Đăng nhập vào MySQl - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 2.9 Đăng nhập vào MySQl (Trang 26)
Hình 2.12 Bảng chỉnh sửa nguồn dữ liệu - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 2.12 Bảng chỉnh sửa nguồn dữ liệu (Trang 28)
Hình 2.14 Data scoure pane - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 2.14 Data scoure pane (Trang 31)
Hình 2.15 Tableau workspace - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 2.15 Tableau workspace (Trang 32)
Hình 2.19 Dữ liệu sau khi làm việc với Mark - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 2.19 Dữ liệu sau khi làm việc với Mark (Trang 36)
Hình 2.22 Biểu đồ heat map về Doanh thu trong Dữ liệu SuperStore. - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 2.22 Biểu đồ heat map về Doanh thu trong Dữ liệu SuperStore (Trang 42)
Hình 2.25 Lọc các giá trị trong City Name bắt đầu bằng chữ C. - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 2.25 Lọc các giá trị trong City Name bắt đầu bằng chữ C (Trang 45)
Hình 2.26 Lọc bằng field (trái) và lọc bằng câu lệnh (phải) của mục ID City. - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 2.26 Lọc bằng field (trái) và lọc bằng câu lệnh (phải) của mục ID City (Trang 45)
Hình 2.27 Giao diện lọc giới hạn - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 2.27 Giao diện lọc giới hạn (Trang 46)
Hình 2.29 Lọc Measures cơ bản - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 2.29 Lọc Measures cơ bản (Trang 47)
Hình 2.28Các tính toán cho measure - ĐỒ ÁN TÌM HIỂU TABLEAU DATA VISUALIZATION THỰC NGHIỆM MINH HỌA (Full đồ án)
Hình 2.28 Các tính toán cho measure (Trang 47)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w