1. Trang chủ
  2. » Giáo Dục - Đào Tạo

BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT

43 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Goods Transport: Container Transport
Tác giả Nguyễn Anh Nhật Minh, Nguyễn Thành Minh, Nguyễn Hoàng Yến Nhi, Ngô Trần Thu Thảo, Ngô Minh Vũ
Người hướng dẫn TS. Nguyễn Vạng Phúc Nguyên
Trường học Đại Học Quốc Gia Thành Phố Hồ Chí Minh
Chuyên ngành Kỹ Thuật Dự Báo
Thể loại Báo Cáo Bài Tập Lớn
Năm xuất bản 2020
Thành phố Tp. Hồ Chí Minh
Định dạng
Số trang 43
Dung lượng 1,8 MB

Cấu trúc

  • CHƯƠNG 1. GIỚI THIỆU ĐỀ TÀI (7)
    • 1.1. Mục đích (7)
    • 1.2. Nhiệm vụ (7)
    • 1.3. Bố cục (7)
    • 1.4. Phạm vi báo cáo (7)
  • CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP LUẬN (8)
    • 2.1. Cơ sở lý thuyết (8)
      • 2.1.1. Kỹ thuật EDA (8)
      • 2.1.2. Phương pháp dự báo (8)
    • 2.2. Phương pháp luận (9)
  • CHƯƠNG 3. GIỚI THIỆU VẤN ĐỀ (10)
    • 3.1. Vấn đề (10)
    • 3.2. Công cụ (10)
    • 3.3. Thu thập dữ liệu (10)
      • 3.3.1. Cách thức thu thập dữ liệu (10)
      • 3.3.2. Điều chỉnh dữ liệu (10)
  • CHƯƠNG 4. KỸ THUẬT EDA VÀ THỐNG KÊ MÔ TẢ (12)
    • 4.1. Thống kê mô tả (12)
      • 4.1.1. Các thông số của thống kê mô tả (12)
      • 4.1.2. Nhận xét các thông số của thống kê mô tả (12)
      • 4.1.3. Dạng dữ liệu (14)
    • 4.2. Hệ số biến thiên (16)
    • 4.3. Phân tích khoảng tin cậy (16)
    • 4.4. Phân tích hệ số tương quan (17)
      • 4.4.1. Ma trận tương quan (17)
      • 4.4.2. Kiểm định hệ số tương quan (18)
  • CHƯƠNG 5. TRẢ LỜI CÂU HỎI (19)
    • 5.1. Câu 2A (19)
    • 5.2. Câu 2B (19)
    • 5.3. Câu 3C (19)
    • 5.4. Câu 3D (20)
    • 5.5. Câu 3E (20)
    • 5.6. Câu 3F ........................................................................................................................ 15 TÀI LIỆU THAM KHẢO (22)

Nội dung

GIỚI THIỆU ĐỀ TÀI

Mục đích

Phân tích dữ liệu đang trở thành xu hướng quan trọng trong thời đại mới, không chỉ giúp hiểu rõ bản chất của dữ liệu mà còn hỗ trợ ra quyết định hiệu quả Kỹ năng này hiện được tích hợp vào chương trình giảng dạy của nhiều trường đại học, phản ánh sự cần thiết trong các lĩnh vực khác nhau Môn học Kỹ thuật dự báo trang bị cho sinh viên kiến thức cơ bản về thống kê và dự báo, từ đó tạo điều kiện cho họ phát triển kỹ năng phân tích dữ liệu.

Báo cáo này nhằm mục đích phân tích dữ liệu chỉ số vận tải container qua hai phương thức đường sắt và đường thủy tại các quốc gia như Hà Lan, Đức, Ý, Tây Ban Nha, Bỉ, Hungary, Lithuania và Romania từ năm 1970 đến 2019 Qua việc phân tích, nhóm đã áp dụng kiến thức từ môn Kỹ thuật dự báo để giải quyết vấn đề thực tiễn, đồng thời tìm hiểu đặc tính vận tải hàng hóa bằng container của các quốc gia này, góp phần nâng cao kiến thức về Logistics quốc tế.

Nhiệm vụ

Nhiệm vụ chính liên quan đến thống kê và phân tích dữ liệu của báo cáo bao gồm:

− Chọn lọc, thu thập dữ liệu cho chỉ số Container transportation (chỉ số vận tải container) của 5 nước có giao thương nhiều nhất với Việt Nam

Kỹ thuật EDA (Phân tích dữ liệu khám phá) được áp dụng để phân tích và xác định các đặc trưng cơ bản của dữ liệu Quá trình này bao gồm việc tính toán các chỉ số thống kê mô tả như trung bình, trung vị, phương sai và độ lệch chuẩn, cùng với việc xác định các tứ phân vị và khoảng tin cậy cho trung bình và độ lệch chuẩn Ngoài ra, việc đánh giá mức biến động và sự tương quan giữa các biến cũng được thực hiện, từ đó giúp rút ra những đặc tính quan trọng của dữ liệu.

− Từ đặc tính của dữ liệu, đưa ra mô hình dự báo phù hợp cho chỉ số vận tải container của các nước.

Bố cục

Bố cục bài báo cáo gồm 5 chương, cụ thể:

− Chương 1: Giới thiệu đề tài

− Chương 2: Cơ sở lý thuyết và Phương pháp luận

− Chương 3: Giới thiệu vấn đề

− Chương 4: Thống kê mô tả

− Chương 5: Trả lời câu hỏi

Phạm vi báo cáo

− Chỉ tiến hành dự báo đối với dữ liệu có data pattern là stationary, trend và seasonal

− Các phương pháp dự báo sử dụng bao gồm: Nạve, Simple averages, Moving averages, Exponential smoothing, Growth curves, Linear exponential smoothing, Quadratic exponential smoothing, Holt’s method

CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP LUẬN

Cơ sở lý thuyết

Phân tích dữ liệu khám phá (EDA) là phương pháp chủ yếu sử dụng kỹ thuật biểu đồ và hình vẽ để phân tích dữ liệu EDA bao gồm việc nghiên cứu và xem xét các dữ liệu cùng với các biểu đồ khác nhau, đồng thời áp dụng các phương pháp thống kê mô tả nhằm tìm ra kết quả cho các câu hỏi nghiên cứu Phương pháp này cũng cung cấp cơ sở vững chắc để lựa chọn mô hình trong các bước phân tích tiếp theo.

Những kỹ thuật biểu đồ được sử dụng trong EDA thường khá đơn giản, bao gồm một vài kỹ thuật sau:

− Vẽ dữ liệu nguyên bản sử dụng data traces, histograms, block plots,

− Vẽ phân bố của dữ liệu nguyên bản sử dụng mean plots, standard deviation plots, box plots,

− Sắp xếp các biểu đồ giúp tối đa hoá khả năng tự nhiên về nhận biết mô hình của con người

Bảng 2.1 Lựa chọn phương pháp dự báo

Data Time horizon Type of Model

Pattern of the data: ST, stationary; T, trending; S, seasonal

Time horizon: S, short term; I, intermediate term; L, long term

Type of model: TS, time series

Phương pháp luận

Hình 2.1 Phương pháp luận thực hiện báo cáo

GIỚI THIỆU VẤN ĐỀ

Vấn đề

Trong phân tích dự báo, việc thu thập thông tin tối đa về lĩnh vực dự báo là rất quan trọng Thông tin này bao gồm số liệu quá khứ, diễn biến hiện tại và xu hướng phát triển của lĩnh vực, cùng với việc đánh giá đầy đủ các yếu tố ảnh hưởng, cả định lượng lẫn định tính.

Bài báo cáo này phân tích các chỉ số thống kê mô tả cho chuỗi dữ liệu thông qua kỹ thuật Khám Phá Dữ Liệu (EDA) và phương pháp chuỗi thời gian Phân tích dữ liệu khai phá giúp xác định mối quan hệ, xu hướng và các quan sát quan trọng, từ đó tóm tắt và mô tả bộ dữ liệu một cách trực quan, hỗ trợ nhà phân tích tối ưu hóa việc sử dụng dữ liệu Phương pháp chuỗi thời gian tập trung vào việc phân tích chuỗi quan sát của một biến duy nhất theo biến số độc lập là thời gian Bộ dữ liệu được nghiên cứu là chỉ số vận tải hàng hóa bằng container từ năm quốc gia mà Việt Nam xuất khẩu nhiều nhất, bao gồm hai hình thức vận tải là đường sắt và đường thủy, với đơn vị đo lường là TEU (Đơn vị tương đương 20 feet) Dữ liệu được thu thập từ Bộ cơ sở dữ liệu OECD, có thể truy cập tại: https://www.oecd-ilibrary.org/transport.

Công cụ

− Kỹ thuật EDA bao gồm:

▪ Các thông số đo lường sự tập trung: Trung bình, Trung vị, Yếu vị

▪ Các thông số đo lường sự phân tán: Khoảng biến thiên, Tứ phân vị, IQR, Phương sai, Độ lệch chuẩn

▪ Biểu đồ Biểu đồ Histogram, Biểu đồ hệ số tương quan

▪ Hệ số biến thiên (CV), Khoảng tứ phân vị, Biểu đồ Box Plot, Hệ số tương quan Pearson

Thu thập dữ liệu

3.3.1 Cách thức thu thập dữ liệu

Dữ liệu xuất khẩu container được thu thập từ trang thông tin điện tử OECD iLibrary, bao gồm 5 quốc gia đường sắt: Hà Lan, Hungary, Romania, Đức, Lithuania và 5 quốc gia đường biển: Hà Lan, Đức, Ý, Tây Ban Nha, Bỉ.

Sau khi thu thập dữ liệu về chỉ số vận tải container của các quốc gia, một số nước không có dữ liệu trong một số năm nhất định Để khắc phục tình trạng này, nhóm nghiên cứu đã áp dụng phương pháp trung bình dịch chuyển (MA) nhằm làm đầy các khoảng trống trong dữ liệu thô.

Ví dụ: nước Hà Lan không có dữ liệu về vận tải container từ năm 1995 – 2003

Hình 3.1 Chuỗi dữ liệu bị thiếu của Hà Lan

Ta sử dụng phương pháp trung bình dịch chuyển với k = 3, 4, 5 để dự báo dữ liệu cho giai đoạn 1995 – 2003 cho Hà Lan

Hình 3.2 Kết quả dự báo bằng phương pháp Trung bình dịch chuyển với k = 3,4,5

Dựa vào các loại sai số MAD, MSE, MAPE khi lần lượt dự báo dữ liệu, sử dụng lần lượt

Khi áp dụng phương pháp dự báo Trung bình dịch chuyển với 3 thời đoạn (k = 3), chúng ta nhận thấy rằng khi số thời đoạn dự báo tăng lên, giá trị sai số của dự báo cũng gia tăng Do đó, phương pháp này được chọn để dự báo dữ liệu cho các năm còn thiếu một cách hiệu quả.

Dữ liệu chỉ số xuất khẩu container của các nước được trình bày đầy đủ ở phần phụ lục A

KỸ THUẬT EDA VÀ THỐNG KÊ MÔ TẢ

Thống kê mô tả

4.1.1 Các thông số của thống kê mô tả

Sử dụng công cụ Thống kê mô tả trong phần mềm Minitab (Stat → Basic Statistics → Display Descriptive Statistics ) để tính toán các thông số thống kê, kết quả thu được được trình bày trong hình 4.1 dưới đây.

Hình 4.1 Các thông số của thống kê mô tả

Nhóm đã sử dụng công cụ Graphical Summary (Stat → Basic Statistics → Graphical Summary) để khai thác biểu đồ Histogram và Boxplot của dữ liệu, từ đó tính toán các thông số cơ bản của thống kê mô tả Hình 4.2 minh họa dữ liệu của Hà Lan, trong khi kết quả cho tất cả các nước được trình bày chi tiết trong phần phụ lục B.

Hình 4.2 Summary Report for Netherlands 4.1.2 Nhận xét các thông số của thống kê mô tả

Chỉ số xuất khẩu container qua đường sắt của Đức dao động từ 365.243 TEU đến 7.138.556 TEU, với khoảng IQR từ 1.013.776 đến 5.209.543 TEU Trung vị (Median) của dữ liệu thấp hơn giá trị trung bình (Mean), cụ thể là 2.206.628 so với 2.857.355, điều này cho thấy chỉ số vận tải có sự chênh lệch đáng kể.

95% Confidence Interval for Mean 95% Confidence Interval for Median 95% Confidence Interval for StDev

6 container qua đường sắt của Đức có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị bé hơn giá trị trung bình 2 857 355 TEU

Hungary: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hungary có giá trị từ 8687

Số liệu về vận tải container qua đường sắt tại Hungary cho thấy tổng số TEU đạt 736.798 TEU, với khoảng IQR từ 132.127 đến 441.856 TEU Trung vị (Median) là 204.713 TEU, thấp hơn giá trị trung bình (Mean) là 266.232 TEU, cho thấy sự phân bố dữ liệu lệch phải, tức là phần lớn giá trị dữ liệu nằm dưới mức trung bình.

Hà Lan: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hà Lan có giá trị từ 88

Dữ liệu về vận tải container qua đường sắt của Hà Lan cho thấy giá trị dao động từ 000 TEU đến 1 686 000 TEU, với khoảng IQR từ 200 044 đến 930 458 TEU Trung vị của dữ liệu là 216 784 TEU, thấp hơn giá trị trung bình 517 214 TEU, cho thấy xu hướng lệch phải, tức là phần lớn dữ liệu có giá trị nhỏ hơn giá trị trung bình.

Lithuania: Ta thấy chỉ số xuất khẩu container qua đường sắt của Lithuania có giá trị từ 10

Số liệu vận tải container qua đường sắt của Lithuania dao động từ 554 TEU đến 305.686 TEU, với khoảng IQR từ 38.670 đến 187.983 TEU Trung vị của dữ liệu là 103.125 TEU, thấp hơn giá trị trung bình 123.127 TEU, cho thấy sự phân phối lệch phải, tức là phần lớn dữ liệu có giá trị nhỏ hơn giá trị trung bình.

Romania: Ta thấy chỉ số xuất khẩu container qua đường sắt của Romania có giá trị từ 54

Số liệu về vận tải container qua đường sắt của Romania dao động từ 995 TEU đến 2.468.750 TEU, với khoảng IQR từ 108.364 đến 1.436.772 TEU Trung vị (Median) là 220.074 TEU, thấp hơn giá trị trung bình (Mean) là 750.837 TEU, cho thấy xu hướng lệch phải trong dữ liệu, tức là phần lớn các giá trị đều nhỏ hơn giá trị trung bình.

❖ Đối với các nhóm nước xuất khẩu container bằng đường biển :

Hà Lan: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hà Lan có giá trị từ 88 000

Chỉ số vận tải container qua đường sắt của Hà Lan dao động từ 200 044 đến 1 686 000 TEU, với trung vị là 216 784 TEU, thấp hơn giá trị trung bình 517 214 TEU, cho thấy xu hướng lệch phải trong dữ liệu Trong khi đó, chỉ số xuất khẩu container qua đường biển của Đức có giá trị từ 279 376 TEU đến 15 905 000 TEU, với khoảng IQR từ 1 771 453 TEU đến 13 272 393 TEU Trung vị của dữ liệu cũng thấp hơn giá trị trung bình, cho thấy xu hướng lệch phải trong vận tải container qua đường biển của Đức.

6 803 993 TEU Ý: Ta thấy chỉ số xuất khẩu container qua đường biển của Ý có giá trị từ 49 937 TEU đến

Số lượng TEU đạt 12.758.529, với khoảng IQR phân bố từ 792.015 TEU đến 7.943.429 TEU Trung vị của dữ liệu thấp hơn giá trị trung bình, cho thấy chỉ số vận tải container qua đường biển của Ý có xu hướng lệch phải Điều này chỉ ra rằng phần lớn dữ liệu có giá trị nhỏ hơn giá trị trung bình là 4.557 TEU.

Chỉ số xuất khẩu container qua đường biển của Tây Ban Nha dao động từ 137,483 TEU đến 17,435,718 TEU, với khoảng IQR phân bố từ 1,335,867 TEU đến 17,435 TEU.

718 Trung vị của dữ liệu bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải

7 container qua đường biển của Bỉ có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé hơn giá trị trung bình 6 374 367 TEU

Chỉ số xuất khẩu container qua đường biển của Bỉ dao động từ 316.354 TEU đến 11.527.000 TEU, với khoảng IQR phân bố từ 1.033.084 TEU đến 8.658.750 TEU Trung vị dữ liệu thấp hơn giá trị trung bình, cho thấy xu hướng lệch phải trong chỉ số Transportation cho vận tải container, tức là phần lớn dữ liệu có giá trị nhỏ hơn giá trị trung bình.

Dựa vào biểu đồ Histogram (phụ lục B), độ lệch của chuỗi dữ liệu cho thấy rằng cả 10 dữ liệu đều có độ lệch dương Hơn nữa, giá trị trung bình lớn hơn giá trị trung vị, điều này cho thấy phân bố dữ liệu của cả năm nước đều có xu hướng lệch về phía bên phải.

Xác định dạng của chuỗi dữ liệu: Đầu tiên, sử dụng công cụ vẽ Time Series Plot (Stat

Đồ thị chuỗi thời gian (Time Series Plot) được sử dụng để xác định các hình dạng có thể có của chuỗi dữ liệu Ví dụ, dữ liệu xuất khẩu container của Bỉ được minh họa trong hình 4.3.

Hình 4.3 Biểu đồ chuỗi thời gian

Dựa vào biểu đồ chuỗi thời gian, có thể nhận thấy dữ liệu có xu hướng Tuy nhiên, để xác định chính xác, cần sử dụng công cụ Autocorrelation trong Minitab (Stat → Time Series → AutoCorrelation) để vẽ biểu đồ ACF Ví dụ, ACF của nước Bỉ được minh họa trong hình 4.4.

Hình 4.4 ACF của dữ liệu nước Bỉ

Biểu đồ cho thấy hệ số tự tương quan tại các lag đầu tiên cao hơn 0 và giảm dần về 0, cho thấy dữ liệu xuất khẩu container của Bỉ có tính xu hướng rõ rệt.

Time Series Plot of Belgium

A ut oc or re la ti on

Autocorrelation Function for Belgium (with 5% significance limits for the autocorrelations)

8 hướng Thực hiện tương tự với dữ liệu các nước khác, ta thu được kết quả được tổng hợp trong bảng 4.1

Bảng 4.1 Data pattern của các nước

Dữ liệu Độ lệch Data Pattern Đường biển

Hà Lan Lệch phải Trend Đức Lệch phải Trend Ý Lệch phải Trend

Tây Ban Nha Lệch phải Trend

Bỉ Lệch phải Trend Đường sắt Đức Lệch phải Trend

Hà Lan Lệch phải Trend

Lithuania Lệch phải Non-stationary

Romania Lệch phải Non-stationary

Phân tích dạng dữ liệu của Lithuania:

Hình 4.5 Kết quả phân tích autocorrelation và biểu đồ time series của dữ liệu Lithuania

Hệ số biến thiên

Sử dụng công cụ Descriptive Statistics (Stat → Basic Statistics → Display Descriptive Statistics ) của phần mềm Minitab để tính toán hệ số biến thiên, thu được kết quả như hình 4.7

Kết quả phân tích chỉ số CV của dữ liệu vận tải đường biển cho thấy tất cả các nước đều có mức biến động thấp, với chỉ số TEU của Hà Lan ổn định nhất (73.12%), trong khi Tây Ban Nha có mức biến động cao nhất (90.76%) Đối với vận tải đường sắt, chỉ số CV của Đức, Hungary và Lithuania cũng thấp hơn 1, cho thấy mức biến động thấp Tuy nhiên, Romania và Hà Lan lại có chỉ số TEU biến động mạnh với giá trị CV lần lượt là 106.28% và 100.27%, trong khi Lithuania có mức biến động thấp nhất trong nhóm này (72.51%).

Dữ liệu về vận tải container qua đường sắt của Lithuania cho thấy tính ổn định cao và ít biến động hơn so với các quốc gia khác, trong khi Romania có chỉ số TEU biến động lớn nhất đạt 106.28%, phản ánh tính không ổn định và sự biến động mạnh mẽ trong vận tải container qua đường sắt.

Phân tích khoảng tin cậy

Khoảng tin cậy là một dải giá trị có khả năng chứa tham số tổng thể chưa xác định Mức độ tin cậy thể hiện tỷ lệ phần trăm xác suất mà khoảng tin cậy sẽ bao gồm tham số tổng thể thực tế khi thực hiện nhiều lần lấy mẫu ngẫu nhiên Khoảng tin cậy liên quan đến giá trị trung bình và độ lệch chuẩn có ý nghĩa quan trọng trong việc phân tích dữ liệu vận tải container của các quốc gia.

Ví dụ với dữ liệu chỉ số xuất khẩu container theo đường sắt của Hà Lan:

Sử dụng Minitab để tính toán khoảng tin cậy (trích từ mục thống kê mô tả), ta được kết quả như sau

Hình 4.8 Kết quả tính toán khoảng tin cậy sử dụng Minitab

Khoảng tin cậy 95% cho giá trị trung bình của chỉ số vận tải container qua đường sắt tại Hà Lan được xác định là (370.251; 664.177) TEU Điều này có nghĩa là khi phân tích ngẫu nhiên dữ liệu vận tải từ các năm, có 95% khả năng giá trị trung bình của chỉ số vận tải sẽ nằm trong khoảng này.

Khoảng tin cậy 95% cho độ lệch chuẩn của chỉ số vận tải container qua đường sắt tại Hà Lan là (426.674 ; 639.202) TEU, cho thấy rằng 95% giá trị độ lệch chuẩn sẽ nằm trong khoảng này khi dữ liệu vận tải được lấy ngẫu nhiên từ các năm.

Phân tích hệ số tương quan

Bảng 4.2 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường sắt

Nước Đức Hungary Lithuania Hà Lan Romania Đức 1 0.903 -0.430 0.939 -0.639

Trong nhóm ba nước Đức, Hungary và Hà Lan, chỉ số tăng trưởng vận tải container theo đường sắt cho thấy sự tương đồng rõ rệt với xu hướng tăng trưởng theo hàm bậc hai Điều này dẫn đến hệ số tương quan cao giữa ba nước, với giá trị thấp nhất đạt 0.882.

Lithuania và Romania có đặc điểm dữ liệu tăng dần đều từ năm 1970, nhưng ghi nhận sự giảm đột ngột vào các năm 1987 và 1988 Hệ số tương quan giữa hai quốc gia này đạt giá trị cao, xấp xỉ 0.912.

Hệ số tương quan giữa Lithuania và Romania so với Đức, Hà Lan và Hungary cho thấy sự khác biệt trong xu hướng tăng trưởng chỉ số vận tải Hai nhóm nước này có ít sự tương quan trong vận tải container bằng đường sắt Giá trị hệ số âm cho thấy trong khi chỉ số vận tải của Hungary, Đức và Hà Lan tăng đều, thì chỉ số vận tải của Lithuania và Romania lại không có sự phát triển tương tự.

Sau giai đoạn giảm đột ngột vào năm 1987 và 1988, 11 của 2 nước còn lại đã tiếp tục ghi nhận sự tăng trưởng, tuy nhiên mức tăng trưởng này vẫn thấp hơn nhiều so với giá trị trước khi giảm.

Bảng 4.3 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường biển

Nước Hà Lan Đức Ý Tây Ban Nha Bỉ

Ma trận hệ số tương quan của nhóm 5 nước đường biển, như thể hiện trong bảng 4.3, cho thấy sự tương quan rất cao với giá trị thấp nhất đạt 0.967 Chỉ số Transportation cho vận tải container bằng đường biển giữa 5 nước này có mối liên hệ chặt chẽ, phù hợp với xu hướng dữ liệu vận tải tăng dần từ 1970 đến 2019, theo hàm xu hướng bậc 2 đã được trình bày ở phần trước.

4.4.2 Kiểm định hệ số tương quan

Giá trị p-value được xuất ra từ phần mềm Minitab với độ tin cậy 95% cho thấy các hệ số tương quan giữa nhóm các nước đường sắt có ý nghĩa thống kê Cụ thể, p-value giữa Hà Lan, Đức và Hungary, cũng như giữa Lithuania và Romania đều tiến gần đến 0, chứng tỏ sự tương quan này có tính chất đáng kể Đối với các nước thuộc hai nhóm khác nhau như Hungary và Romania, Hà Lan và Lithuania, giá trị p-value lần lượt là 0.002 và 0.008, vẫn nhỏ hơn 0.05, khẳng định rằng các hệ số tương quan này vẫn có giá trị thống kê.

Trị thống kê p-value cho hệ số tương quan giữa Hungary và Lithuania có giá trị 0.077

> 0.05, cho thấy mức ý nghĩa của hệ số tương quan này thấp hơn các hệ số tương quan còn lại Đối với nhóm các nước đường biển:

Giá trị p-value kiểm định cho các hệ số tương quan trong bảng 4.3, được xuất ra từ phần mềm Minitab, đều tiến gần về 0, cho thấy các hệ số này có ý nghĩa thống kê rõ ràng.

TRẢ LỜI CÂU HỎI

Câu 2A

Mô tả các đối tượng nghiên cứu (các nước đã chọn) bằng các đặc điểm đặc trưng nhất thông qua phân tích EDA ở câu 1?

− Đa số các nước có chỉ số vận tải container theo xu hướng tăng dần qua các năm

Chỉ số vận tải container qua đường sắt và đường biển giữa các quốc gia có sự phân bố không đồng đều, với xu hướng lệch phải Điều này có nghĩa là phần lớn dữ liệu có giá trị thấp hơn giá trị trung bình, nhưng sự chênh lệch không quá lớn so với giá trị trung bình.

Trong nhóm các nước xuất khẩu container bằng đường sắt, Đức dẫn đầu với giá trị xuất khẩu trung bình cao nhất đạt 2,875,355 TEU, trong khi Lithuania có giá trị xuất khẩu trung bình thấp nhất chỉ đạt 123,127 TEU.

Giá trị xuất khẩu trung bình của các nước xuất khẩu container bằng đường biển cho thấy Đức dẫn đầu với 6,803,993 TEU.

Bỉ là thấp nhất (4,533,168 TEU)

− Nhìn chung các nước xuất khẩu theo đường biển với trọng lượng container (TEU) nhiều hơn đáng kể so với đường sắt.

Câu 2B

Chuỗi dữ liệu sử dụng của các đối tượng nghiên cứu có tuân theo phân bố Normal không? Tại sao?

Dựa vào giá trị p – value của kiểm định Anderson – Darling Normality Test được thực hiện trên Minitab 18 ta thu được kết quả dưới bảng sau

Bảng 5.1 Kết quả kiểm định phân bố Normal

Dữ liệu Giá trị kiểm định Nhận xét Đường biển

The analysis indicates that the data from the Netherlands, Germany, Italy, Spain, and Belgium all show a significance level of p < 0.05, suggesting that these countries do not conform to a normal distribution in their railway statistics.

The analysis of data from several European countries reveals that Germany, Hungary, Lithuania, the Netherlands, and Romania all show a significant deviation from a normal distribution, with p-values less than 0.05.

Câu 3C

Ước lượng về CIs của chuỗi dữ liệu của các đối tượng nghiên cứu có đủ “tốt” để tin cậy không?

− Do dữ liệu không tuân theo phân bố Normal nên khoảng tin cậy không dùng được

Dữ liệu trong mẫu cần phải ngẫu nhiên, nhưng với một số quốc gia có dữ liệu không đầy đủ, việc sử dụng phương pháp dự báo là cần thiết để thực hiện tính toán Điều này dẫn đến việc dữ liệu mất đi tính ngẫu nhiên và độc lập.

Câu 3D

Chủ đề mà nhóm quan tâm là liệu các giá trị liên quan đến giao thông hàng hóa của Đức có tương đồng với Hà Lan hay không Cụ thể, chúng ta cần xem xét giá trị vận chuyển hàng hóa của Đức so với giá trị vận chuyển hàng hóa của Hà Lan để đánh giá sự tương đồng này.

Sử dụng kiểm định trung bình 2 tổng thể theo cặp (Paired t for the mean)

To conduct the analysis in Minitab 18, navigate to Stat → Paired t for the mean, where 𝜇 1 represents the mean value for Germany and 𝜇 2 represents the mean value for the Netherlands, with the difference calculated as difference = 𝜇 1 − 𝜇 2 The results obtained are as follows:

Hình 5.1 Kết quả kiểm định đối với vận tải đường thủy

Hình 5.2 Kết quả kiểm định đối với vận tải đường sắt

Kết luận: Chỉ số vận tải container cả bằng đường sắt và đường thủy của Đức đều lớn hơn Hà Lan

Hình 5.3 Chỉ số vận tải container bằng đường thủy và đường sắt của Đức và Hà Lan qua các năm

Câu 3E

Có sự khác nhau giữa các bộ dữ liệu được phân tích từ các nước hay không? (One-way ANOVA và Tukey test, Interval Plots và Boxplot of Data )

Hình 5.4 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường biển

Hình 5.5 Interval Plot và Boxplot các chỉ số vận tải container bằng đường biển

Vì p – value = 0.05 nên kết luận rằng không có sự khác biệt giữa chỉ số vận tải container bằng đường biển giữa 5 nước Netherlands, Germany, Italy, Spain, Belgium Đường sắt

Hình 5.6 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường sắt

Hình 5.7 Interval Plot và Boxplot các chỉ số vận tải container bằng đường sắt

Vì p-value < 0.05 nên có sự khác biệt giữa giá trị trung bình của các nước Tiến hành kiểm định sâu ANOVA (Turkey Test)

Interval Plot of Netherlands, Germany,

The pooled standard deviation is used to calculate the intervals Netherlands Germany Italy Spain Belgium

Interval Plot of Germany (Rai, Hungary,

The pooled standard deviation is used to calculate the intervals Germany (Rail) Hungary Lithuania Netherlands (Rail) Romania

Boxplot of Germany (Rai, Hungary,

Hình 5.8 Kết quả kiểm định Turkey

Kết quả kiểm định Turkey cho thấy có sự khác biệt có ý nghĩa thống kê về chỉ số xuất khẩu container giữa các cặp nước Hungary – Đức, Lithuania – Đức, Hà Lan – Đức, Romania – Đức và Romania – Lithuania với p-value < 0.05 Trong khi đó, các cặp nước còn lại không có sự khác biệt khi p-value > 0.05.

Câu 3F 15 TÀI LIỆU THAM KHẢO

Dự báo cho năm tiếp theo có thể được thực hiện dựa trên dữ liệu thu thập từ các đối tượng nghiên cứu đã chọn Nếu dữ liệu đủ chính xác và đại diện, chúng ta có thể tiến hành tính toán giá trị dự báo Ngược lại, nếu dữ liệu không đầy đủ hoặc không đáng tin cậy, việc dự báo sẽ không chính xác và cần lập luận giải thích rõ ràng về sự hạn chế này.

Dựa vào phân tích hình dạng chuỗi dữ liệu ở phần Thống kê mô tả, thu được bảng sau

Bảng 5.2 Phân tích các yếu tố của chuỗi thời gian

Phương pháp dự báo đề xuất Đường biển

Hà Lan Trend Short time TS − Linear exponential smoothing

− Holt’s method Đức Trend Short time TS Ý Trend Short time TS

Tây Ban Nha Trend Short time TS

Bỉ Trend Short time TS Đường sắt Đức Trend Short time TS

Hungary Trend Short time TS

Hà Lan Trend Short time TS

Lithuania Non stationary Short time TS Không tiến hành dự báo với dữ liệu non stationary

Romania Non stationary Short time TS Không tiến hành dự báo với dữ liệu non stationary

Bảng 5.3 So sánh sai số của các phương án lựa chọn

Vì giá trị thực rất lớn nên sử dụng sai số MAPE để đánh giá lựa chọn phương pháp dự báo →

Sử dụng phương pháp Holt’s method

Sau khi tiến hành phân tích và đánh giá các quốc gia còn lại, chúng tôi đã thu được kết quả dự báo như được thể hiện trong bảng 5.4 Dữ liệu dự báo cho các quốc gia này được xử lý bằng phần mềm Minitab và chi tiết được trình bày trong phụ lục C.

Bảng 5.4 Kết quả dự báo

Dữ liệu Phương pháp dự báo Giá trị dự báo Đường biển

Hà Lan Holt’s method 16,067,404 Đức Holt’s method 15,229,009 Ý Holt’s method 11,511,375

Tây Ban Nha Holt’s method 17,584,252

Bỉ Exponential trend models 19,002,833 Đường sắt Đức Holt’s Method 7,323,485

Phương pháp Hà Lan Holt với 1.754.952 đánh giá sự phù hợp của dự báo thông qua việc kiểm tra hệ số tương quan của phần dư, nhằm xác định tính ngẫu nhiên.

Dựa vào LBQ test để kiểm tra sự tương quan giữa time lags với data thu được kết quả sau

Ví dụ đối với nước Đức của vận tải đường sắt, ta có kết quả sau:

Hình 5.9 Kiểm tra sự tương quan của Residual đối với nước Đức

Do LBQ

Ngày đăng: 04/06/2022, 09:23

HÌNH ẢNH LIÊN QUAN

Hình 2.1 Phương pháp luận thực hiện báo cáo - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
Hình 2.1 Phương pháp luận thực hiện báo cáo (Trang 9)
Hình 3.2. Kết quả dự báo bằng phương pháp Trung bình dịch chuyển với k= 3,4,5 - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
Hình 3.2. Kết quả dự báo bằng phương pháp Trung bình dịch chuyển với k= 3,4,5 (Trang 11)
Hình 4.2 Summary Report for Netherlands - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
Hình 4.2 Summary Report for Netherlands (Trang 12)
Hình 4.1 Các thơng số của thống kê mơ tả - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
Hình 4.1 Các thơng số của thống kê mơ tả (Trang 12)
→ Time Series → Time Series Plot) để xác định hình dạng cĩ thể cĩ của chuỗi dữ liệu. Ví dụ đối với dữ liệu xuất khẩu container của nước Bỉ trong hình 4.3 - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
ime Series → Time Series Plot) để xác định hình dạng cĩ thể cĩ của chuỗi dữ liệu. Ví dụ đối với dữ liệu xuất khẩu container của nước Bỉ trong hình 4.3 (Trang 14)
Hình 4.3 Biểu đồ chuỗi thời gian - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
Hình 4.3 Biểu đồ chuỗi thời gian (Trang 14)
Hình 4.5 Kết quả phân tích autocorrelation và biểu đồ time series của dữ liệu Lithuania - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
Hình 4.5 Kết quả phân tích autocorrelation và biểu đồ time series của dữ liệu Lithuania (Trang 15)
Hình 4.7 Kết quả CV của các dữ liệu - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
Hình 4.7 Kết quả CV của các dữ liệu (Trang 16)
Bảng 4.2 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường sắt Nước Đức Hungary Lithuania Hà Lan  Romania - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
Bảng 4.2 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường sắt Nước Đức Hungary Lithuania Hà Lan Romania (Trang 17)
Hình 4.8 Kết quả tính tốn khoảng tin cậy sử dụng Minitab - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
Hình 4.8 Kết quả tính tốn khoảng tin cậy sử dụng Minitab (Trang 17)
Bảng 5.1 Kết quả kiểm định phân bố Normal - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
Bảng 5.1 Kết quả kiểm định phân bố Normal (Trang 19)
Hình 5.1 Kết quả kiểm định đối với vận tải đường thủy - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
Hình 5.1 Kết quả kiểm định đối với vận tải đường thủy (Trang 20)
Hình 5.4 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường biển - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
Hình 5.4 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường biển (Trang 21)
Hình 5.5 Interval Plot và Boxplot các chỉ số vận tải container bằng đường biển - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
Hình 5.5 Interval Plot và Boxplot các chỉ số vận tải container bằng đường biển (Trang 21)
Hình 5.8 Kết quả kiểm định Turkey - BÁO CÁO BÀI TẬP LỚN 1 MÔN HỌC KỸ THUẬT DỰ BÁO GOODS TRANSPORT: CONTAINER TRANSPORT
Hình 5.8 Kết quả kiểm định Turkey (Trang 22)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w