TỔNG QUAN CHUNG VỀ PHỤ TẢI VÀ BÀI TOÁN DỰ BÁO
Gi ới thiệu chung về phụ tải
Sản lượng điện tiêu thụ tại Việt Nam đã tăng đột biến, trong khi nguồn tài nguyên nước từ các nhà máy thủy điện như Hòa Bình, Sơn La, Lai Châu và Tuyên Quang lại bị thiếu hụt, ảnh hưởng nghiêm trọng đến nền kinh tế Do đó, việc dự báo phụ tải điện trở nên vô cùng quan trọng trong quy hoạch và phát triển nguồn điện cũng như vận hành hệ thống điện Nhu cầu tiêu thụ điện năng gắn liền với sự phát triển của nền kinh tế quốc dân; nếu dự báo phụ tải quá thấp, nguồn dự phòng sẽ không đủ đáp ứng cho sản xuất công nghiệp và tiêu dùng Ngược lại, nếu dự báo phụ tải quá cao, việc huy động nguồn nguyên liệu đắt tiền sẽ gây lãng phí cho nền kinh tế.
Dự báo phụ tải dài hạn (10-20 năm) cung cấp dữ liệu quan trọng cho quy hoạch và đầu tư phát triển hệ thống điện, trong khi dự báo phụ tải ngắn hạn (30 ngày) đảm bảo an toàn và hiệu quả trong vận hành hệ thống điện Dự báo dài hạn mang tính chiến lược, chỉ nêu ra các phương hướng phát triển chủ yếu mà không cần xác định chỉ tiêu cụ thể.
Dự báo phụ tải là một chức năng quan trọng trong kế hoạch vận hành hệ thống điện (HTĐ), giúp phân phối nguồn một cách kinh tế và hiệu quả Nó cũng hỗ trợ trong việc lên kế hoạch bảo dưỡng và sửa chữa, từ đó đóng vai trò thiết yếu đối với điều độ viên và những người hoạch định phương thức vận hành HTĐ.
Trong công tác vận hành, việc lập phương thức hàng ngày và hàng tuần của Trung tâm Điều độ, cũng như dự báo phụ tải trước một giờ, một ngày, và một tuần là rất cần thiết Các phương thức vận hành cơ bản như huy động nguồn, phối hợp nguồn, truyền tải công suất giữa các miền, xử lý công tác sửa chữa trên lưới điện và đánh giá mức độ an toàn hệ thống điện đều yêu cầu dự báo phụ tải chính xác để đảm bảo hiệu quả và an toàn trong hoạt động.
Trong thực tế vận hành HTĐ Việt Nam nói chung và HTĐ thành phố Hà
Nội nói riêng, phụ tải cao điểm (phụ tải cao nhất trong ngày Pmax) và thấp điểm
Phụ tải thấp nhất trong ngày (Pmin) và phụ tải cao điểm là hai điểm quan trọng trong đồ thị phụ tải, ảnh hưởng lớn đến vận hành hệ thống điện Phụ tải cao điểm quyết định việc huy động các nguồn nhiệt điện, tua-bin khí và diesel dự phòng để đảm bảo cung cấp điện an toàn Ngược lại, phụ tải thấp điểm ảnh hưởng đến việc điều chỉnh nguồn năng lượng nhằm tối ưu hóa chi phí, tránh để các nhà máy thủy điện vận hành không hiệu quả Dự báo chính xác phụ tải cao điểm, đặc biệt trong mùa mưa lũ, giúp khai thác tối đa nguồn thủy điện và giảm thiểu chi phí, với khả năng tiết kiệm khoảng 80 MW từ nguồn tuabin khí nếu sai số dự báo giảm 2% Điều này không chỉ nâng cao hiệu quả vận hành hệ thống điện mà còn góp phần tiết kiệm hàng trăm triệu đồng mỗi giờ cho nền kinh tế.
Hạn chế phụ tải vào giờ cao điểm thường xảy ra trong mùa lũ do thiếu nguồn điện Việc xác định chính xác lượng công suất thiếu giúp chủ động cắt giảm phụ tải ở những khu vực không quan trọng, từ đó tránh tình trạng cắt thừa hoặc cắt thiếu, đồng thời giảm thiểu rủi ro sa thải phụ tải do bảo vệ tần số thấp Điều này có ý nghĩa quan trọng trong vận hành, giúp giảm thiệt hại do cắt điện.
Đặc điểm phụ tải hệ thống điện
Phụ tải ngày của hệ thống điện Việt Nam chủ yếu đến từ điện sinh hoạt và dịch vụ, chiếm tỷ lệ cao Việc giảm tỷ trọng tiêu thụ điện trong công nghiệp và tăng tỷ trọng trong sinh hoạt đã làm xấu đi chế độ tiêu thụ điện năng, dẫn đến giảm hệ số phụ tải và tạo ra đồ thị phụ tải nhọn hơn Điều này gây nhiều khó khăn trong việc đảm bảo an toàn cung cấp điện Đồ thị phụ tải ngày của hệ thống điện Quốc gia, được xây dựng dựa trên giá trị phụ tải trong 24 giờ, cho thấy sự biến thiên rõ rệt theo từng giờ, với phụ tải Pmax lớn gấp 2-3 lần.
Phụ tải Pmax thường đạt đỉnh vào mùa hè từ 19h đến 20h và vào mùa đông từ 18h đến 19h Ngược lại, mức phụ tải Pmin thấp nhất thường xảy ra vào ban đêm, cụ thể vào khoảng 3h đến 4h trong mùa hè và từ 2h đến 3h trong mùa đông.
Hình 1.1 Đồ thị phụ tải ngày Hệ thống điện Quốc gia
Trong trung tâm Điều độ, phụ tải cao điểm (Pmax) và phụ tải thấp điểm (Pmin) là hai yếu tố quan trọng nhất trong đồ thị phụ tải hàng ngày Hai chỉ số này không chỉ quyết định việc huy động nguồn năng lượng mà còn ảnh hưởng đến sự phối hợp giữa thủy điện và nhiệt điện trong quá trình lập phương thức ngày cho hệ thống điện.
Vào giờ cao điểm buổi tối, phụ tải điện tăng nhanh chóng, yêu cầu huy động nguồn điện đắt tiền như tua-bin khí chạy dầu ít nhất 30 phút trước để khởi động và tăng dần công suất Nếu không có nguồn bổ sung kịp thời, việc huy động tua-bin khí sẽ dẫn đến tình trạng tần số thấp và cắt tải do tác động của rơle tần số Trong trường hợp xảy ra sự cố thiếu nguồn, cần dự báo công suất thiếu để chuẩn bị phương án cắt tải, đồng thời phối hợp với các điều độ miền để phân bổ công suất cần thiết cho lưới điện.
4 phối Cắt tải có chuẩn bị trước thường ít gây thiệt hại về kinh tế hơn do rơ – le tần số thấp tác động
Vào ban đêm, khi phụ tải giảm xuống mức thấp, cần điều chỉnh các nguồn tua-bin khí và nhiệt điện để đảm bảo các tổ máy của thủy điện Hòa Bình không hoạt động trong vùng công suất không an toàn Việc dự báo chính xác Pmax và Pmin giúp huy động và điều chỉnh nguồn hợp lý, từ đó đảm bảo vận hành hệ thống điện an toàn và hiệu quả, đồng thời đáp ứng các tiêu chí kinh tế.
Các y ếu tố ảnh hưởng đến phụ tải
Để tối ưu hóa phương pháp dự báo phụ tải ngày cho hệ thống điện thành phố Hà Nội với sai số thấp, việc xác định các yếu tố ảnh hưởng như thứ trong tuần, ngày lễ, và các đặc điểm của ngày dự báo, bao gồm nhiệt độ, là rất quan trọng Do đó, để nâng cao độ chính xác trong dự báo phụ tải, cần xem xét các yếu tố chính tác động đến phụ tải hàng ngày.
Phụ tải của lưới điện Việt Nam, đặc biệt là tại thành phố Hà Nội, chủ yếu phụ thuộc vào một số yếu tố chính trong quá trình vận hành thực tế.
1.3.1 Thứ của ngày trong tuần
Có quy luật giữa phụ tải và ngày trong tuần
- Phụ tải thấp nhất trong đêm thứ 2
- Đồ thị phụ tải các ngày làm việc thường có dạng giống nhau
- Phụ tải ngày nghỉ cuối tuần giảm
Hình 1.2 Đồ thị phụ tải các ngày đặc trưng trong tuần
1.3.2 Các ngày đăc biệt trong năm
Vào những ngày lễ đặc biệt trong năm như 30/4, 1/5, và 2/9, phụ tải điện thường giảm đáng kể so với các ngày bình thường Sự giảm sút này cũng ảnh hưởng đến phụ tải trong những ngày liền kề, điều này có thể dễ dàng nhận thấy qua biểu đồ phụ tải điện tại các đô thị trong miền.
Vào ngày lễ 1/5/2016 và ngày làm việc bình thường 3/5/2016, dự báo phụ tải sẽ không giống như các ngày thông thường Thay vào đó, cần áp dụng phương pháp riêng để phân tích sự thay đổi phụ tải của các ngày này so với các năm trước.
Hình 1.3 Đồ thị phụ tải HTĐ trong 2 ngày 3/5 và 1/5
Các thông số tự nhiên như nhiệt độ, độ ẩm, tốc độ gió và cường độ sáng có ảnh hưởng đáng kể đến phụ tải điện Trong đó, nhiệt độ là yếu tố tác động lớn nhất; khi nhiệt độ tăng, phụ tải cũng tăng theo và ngược lại, do Việt Nam có khí hậu nhiệt đới Tuy nhiên, ở miền Bắc, trong những trường hợp đặc biệt khi nhiệt độ quá lạnh, phụ tải sẽ tăng do nhu cầu sử dụng các thiết bị sưởi ấm.
Hình 1.4 Đồ thị phụ tải hai ngày có nhiệt độ khác nhau
1.3.4 Truyền hình trực tiếp các sự kiện thể thao văn hóa
Trong các giờ phát sóng trực tiếp bóng đá quốc tế, đặc biệt là khi đội tuyển Việt Nam tham gia, công suất tiêu thụ điện tăng mạnh từ 150 đến 200 MW Các điều độ viên thường dựa vào kinh nghiệm từ các ngày tương tự trước đó để dự đoán phụ tải Chẳng hạn, khi dự báo phụ tải cho ngày có truyền hình trực tiếp World Cup 2018, họ sử dụng đồ thị phụ tải của những ngày có phát sóng tương tự trước đó để đưa ra dự báo chính xác hơn.
Hình 1.5 Đồ thị phụ tải đêm có WC và không có WC
1.3.5 Kế hoạch sửa chữa lớn trong ngày có cắt điện
Trong quá trình thực hiện kế hoạch sửa chữa lớn, việc cắt điện các đường dây đang hoạt động để kéo đường dây mới và sửa chữa các trạm 220kV, 500kV đã dẫn đến việc cắt tải diện rộng, làm giảm đáng kể điện năng tiêu thụ trong những ngày này.
Dự báo phụ tải trong thời gian này cần điều chỉnh để tính đến việc giảm phụ tải do ngừng cung cấp điện Hình dạng biểu đồ phụ tải trong ngày sẽ có những đặc điểm riêng biệt khi xảy ra cắt điện diện rộng, và sự thay đổi này phụ thuộc vào thời gian cũng như khu vực bị cắt điện.
Qua quá trình vận hành và phân tích dữ liệu, các chuyên viên đã xác định rằng nhiệt độ môi trường, đặc thù của các ngày trong tuần, cùng với các ngày lễ và ngày Tết là những yếu tố chính ảnh hưởng đến giá trị phụ tải trong ngày.
Vai trò c ủa dự báo
Dự báo đóng vai trò quan trọng trong nhiều lĩnh vực, ảnh hưởng đến kế hoạch sản xuất và định hướng đầu tư phát triển tương lai Để thực hiện dự báo phụ tải, cần sử dụng dữ liệu thống kê và phân tích, áp dụng các thuật toán nhằm xác định mối quan hệ giữa phụ tải và các yếu tố tác động Từ những yếu tố này, việc dự báo phụ tải có thể được thực hiện một cách chính xác hơn.
Trước đây, các mô hình toán học truyền thống thường được sử dụng cho dự báo bao gồm hồi quy tuyến tính, san bằng hàm mũ, trung bình trượt và hệ số ngẫu nhiên.
Dự báo phụ tải ngắn hạn (giờ, ngày hoặc tuần) đóng vai trò quan trọng trong việc vận hành và lập phương thức cung cấp điện Dự báo quá thừa so với nhu cầu có thể dẫn đến việc huy động nguồn dự phòng đắt tiền không cần thiết, trong khi dự báo quá thấp sẽ gây ra nguồn dự phòng không đủ, ảnh hưởng đến an toàn cung cấp điện và không đáp ứng đủ nhu cầu của người tiêu dùng, gây thiệt hại cho nền kinh tế quốc dân.
Do nhu cầu điện năng trong quản lý và tiêu dùng của cư dân rất cao, chênh lệch công suất giữa giờ cao điểm và thấp điểm có thể lên đến 2-3 lần Sự chênh lệch này phụ thuộc nhiều vào yếu tố thời tiết, ảnh hưởng lớn đến khả năng khai thác tối ưu các nguồn điện.
Phụ tải cao điểm đóng vai trò quyết định trong việc huy động nguồn điện, trong khi phụ tải thấp điểm lại quan trọng trong việc điều chỉnh và phối hợp các nguồn điện để đảm bảo vận hành kinh tế Do đó, dự báo chính xác phụ tải là rất cần thiết cho việc vận hành hệ thống điện, cải tạo và thiết kế hệ thống cung cấp điện, giúp giảm thiểu tổn thất công suất và điện năng Đặc biệt, việc dự báo phụ tải cao điểm chính xác không chỉ mang lại lợi ích cho khách hàng mà còn nâng cao hiệu suất sử dụng năng lượng, tránh tình trạng thiếu công suất trong giờ cao điểm.
Phụ tải cao điểm và thấp điểm là hai giá trị quan trọng trên đồ thị phụ tải ngày, đóng vai trò then chốt trong quy hoạch và thiết kế hệ thống điện Khi phụ tải ở mức thấp, tỷ lệ tổn thất sẽ gia tăng do tổn hao không tải.
Các bài toán d ự báo phụ tải điện
Để xây dựng một mô hình dự báo hiệu quả, việc xác định các nhu cầu cần được giải đáp là rất quan trọng Trong lĩnh vực vận hành và quy hoạch hệ thống điện, có hai loại dự báo phụ tải chính được phân biệt dựa trên khoảng thời gian dự báo.
• Trong quy hoạch các hệ thống điện
Dự báo dài hạn trong lĩnh vực năng lượng thường kéo dài từ 1 đến 10 năm, nhằm hỗ trợ quy hoạch và xây dựng các nhà máy điện cũng như hệ thống truyền tải và phân phối điện Thời gian này là cần thiết để đảm bảo sự phát triển bền vững và hiệu quả của hạ tầng năng lượng trong tương lai.
Dự báo trung hạn là giai đoạn dự báo kéo dài từ 1 tháng đến 1 năm, thường được sử dụng để xác định thiết bị và lưới điện cần lắp đặt, cũng như thiết lập các hợp đồng trong thị trường điện.
Trong vận hành hệ thống điện, việc dự báo phụ tải thường được thực hiện cho khoảng thời gian từ vài phút đến 168 giờ Hai loại dự báo phụ tải chính bao gồm dự báo phụ tải rất ngắn hạn và dự báo phụ tải ngắn hạn.
- Dự báo phụ tải rất ngắn hạn được lập cho vài phút sắp tới và được dùng cho điều khiển nguồn phát tự động AGC (Automatic Generation Control)
Dự báo phụ tải ngắn hạn được thực hiện cho khoảng thời gian từ 1 đến 168 giờ, chủ yếu nhằm thiết lập biểu đồ phát điện Trong khoảng thời gian này, công ty điện cần nắm rõ kế hoạch kinh doanh điện, kế hoạch bảo trì và kế hoạch điều khiển phụ tải để giảm thiểu chi phí.
CÁC PHƯƠNG PHÁP DỰ BÁO
M ột số khái niệm cơ bản
Dự báo là một lĩnh vực khoa học quan trọng, mang lại nhiều lợi ích thiết thực cho con người bằng cách giúp nắm bắt các quy luật tự nhiên và xã hội Mặc dù còn non trẻ, khoa học này nghiên cứu các phương pháp dự báo và ứng dụng của chúng trong các hiện tượng kinh tế, xã hội và kỹ thuật Mục tiêu của dự báo là phát triển các phương pháp luận khoa học để đề xuất dự báo cụ thể và đánh giá độ tin cậy, chính xác của các phương pháp đó Nghiên cứu ứng dụng các mô hình dự báo khác nhau cho phép lựa chọn phương pháp phù hợp, đánh giá độ chính xác và xác định khoảng thời gian tối đa cho dự báo Các phương pháp dự báo có thể được chia thành ba loại chính.
Dự báo theo phương pháp vật lý
Dự báo theo phương pháp thống kê, hồi quy
Dự báo theo phương pháp sử dụng trí tuệ nhân tạo
D ự báo theo phương pháp vật lý
2.2.1 Sử dụng tính chất tuần hoàn
Các nhà khí tượng học và hải dương học chú trọng vào việc tìm kiếm tính chu kỳ trong các yếu tố thời tiết và quá trình thủy văn để dự báo dài hạn Việc xác định rõ ràng tính chu kỳ sẽ giúp giảm bớt khó khăn trong dự báo Tuy nhiên, vấn đề này gặp trở ngại do thiếu chuỗi quan trắc dài và đáng tin cậy Một số quá trình đã được phát hiện có tính chu kỳ trong nhiều năm, tạo hy vọng cho các nhà dự báo, nhưng tính ổn định của chu kỳ này lại không đảm bảo theo thời gian.
Nghiên cứu về tính chu kỳ của các hiện tượng thời tiết cho thấy rằng ngoài các chu kỳ hàng ngày và hàng năm, tính chu kỳ không đủ bền vững để dự báo Một số ý tưởng đã được đưa ra nhằm tìm kiếm mối liên hệ giữa dao động thời tiết và hoạt động của mặt trời, đặc biệt là sự xuất hiện của vết đen mặt trời, những khu vực tối trên bề mặt Mặt Trời với độ sáng giảm xuống chỉ còn 1/4 so với các vùng xung quanh Vết đen mặt trời xuất hiện do nhiệt độ thấp hơn và ảnh hưởng từ các biến đổi từ trường mạnh Chu kỳ xuất hiện của vết đen này khoảng 11 năm, nhưng nỗ lực tìm kiếm mối liên hệ giữa số lượng vết đen và các dị thường thời tiết trên trái đất vẫn chưa cho ra kết quả rõ ràng để sử dụng trong dự báo.
2.2.2 Sử dụng các định luật bảo toàn vật chất và năng lượng
Khi giải các phương trình liên quan đến cân bằng nước, nhiệt và năng lượng, ta thu được những công thức lý thuyết hoặc thực nghiệm thể hiện mối quan hệ phụ thuộc giữa yếu tố dự báo và các yếu tố ảnh hưởng đến nó.
Khi giải phương trình cân bằng năng lượng sóng gió, có thể tính toán các yếu tố sóng dựa trên tốc độ gió, thời gian tác động của gió và ảnh hưởng của đà sóng, đà gió Phương pháp cân bằng nhiệt được áp dụng phổ biến để tính toán và dự báo trạng thái nhiệt của biển.
Việc áp dụng các phương trình cân bằng đang trở thành xu hướng chủ yếu trong dự báo ngắn hạn Tuy nhiên, trong dự báo dài hạn, việc sử dụng các phương pháp cân bằng vẫn gặp nhiều thách thức do thiếu hụt các dự báo khí tượng dài hạn đáng tin cậy.
2.2.3 Sử dụng các phương pháp số trị
Mô hình dự báo thời tiết số trị NWP (Numerical Weather Prediction Model) hiện đang là phương pháp tiên tiến nhất trong dự báo thời tiết NWP là một chương trình máy tính mô phỏng trạng thái của bầu khí quyển, giúp cung cấp những dự báo chính xác và đáng tin cậy.
12 quyển sách dựa trên hệ phương trình toán học Navier-Stokes, cho phép tính toán và dự báo định lượng các yếu tố khí tượng cũng như hiện tượng thời tiết tại các điểm nút trong không gian và thời gian, hoặc nội suy về một điểm bất kỳ.
Dự báo thủy động lực học hay dự báo số trị là quá trình tính toán các hiện tượng vật lý trong khí quyển và đại dương thông qua việc giải các phương trình thủy động lực học bằng số Các phương trình này được thiết lập với các điều kiện ban đầu và biên, cùng với các phép tham số hóa để đảm bảo tính chính xác trong mô tả quá trình Phương pháp dự báo này yêu cầu khối lượng tính toán lớn, do đó, nó chỉ phát triển mạnh mẽ khi có sự ra đời của những máy tính công suất lớn.
Các phương trình thủy nhiệt động lực học mô tả chính xác các quy luật vật lý biển và khí quyển, cho phép tính toán sự biến đổi của các đặc trưng thủy văn và khí tượng theo không gian và thời gian Do tính phức tạp của các phương trình này, chúng thường được đơn giản hóa để dễ dàng giải bằng máy tính thông qua các giả thiết Để dự báo bằng phương pháp số, các phương trình được chuyển đổi từ dạng vi phân sang tương tự sai phân cho từng nút lưới trong không gian - thời gian Khoảng cách giữa các điểm nút được gọi là bước lưới (Δx hoặc h), trong khi Δt biểu thị bước theo thời gian Các điểm nút được đánh số bằng các chỉ số (i, j) trong trường hợp bài toán hai chiều.
Hình 2.1 Sơ đồ lưới sai phân của miền tính
Trường phân bố của các yếu tố tại thời điểm quan trắc được coi là điều kiện ban đầu, với giá trị của tất cả các đại lượng được xác định trước Việc chọn các điều kiện biên là một thách thức lớn, phụ thuộc vào cách đặt bài toán cụ thể Do tính chất biến đổi mạnh mẽ của các quá trình trong lòng biển theo không gian và thời gian, phương pháp số trị (NWP) trong dự báo thủy động chỉ đảm bảo độ chính xác cho khoảng thời gian ngắn, thường chỉ vài giờ.
D ự báo theo phương pháp thống kê hồi quy
2.3.1 Phương pháp san bằng mũ Để khắc phục những hạn chế của các phương pháp trên, người ta đề xuất sử dụng phương pháp san bằng hàm mũ giản đơn để dự báo Đây là phương pháp dễ sử dụng nhất, nó cần ít số liệu trong quá khứ Theo phương pháp này:
Ft = Ft-1 + α(Dt-1 - Ft-1) với 0< α 0 Điều này có nghĩa là xác suất sai lệch giữa giá trị ước lượng và giá trị thực cần ước lượng sẽ tiến gần đến 0 khi kích thước mẫu thử tăng lên Biến ngẫu nhiên sẽ dao động quanh giá trị kỳ vọng của nó.
Phương sai V(x) nhỏ cho thấy sự dao động yếu, do đó, mục tiêu là giảm phương sai của ước lượng xuống mức tối thiểu Khi đạt được điều này, ước lượng được coi là hiệu quả.
Trong quá trình điều tra, có thể xuất hiện những giá trị bất thường, chẳng hạn như trẻ 10 tuổi nhưng cao tới 1,80 m Để đảm bảo rằng những giá trị này không làm sai lệch quá nhiều các ước lượng, cần áp dụng các phương pháp xử lý phù hợp.
27 vững Có thể thấy trung bình tích lũy trong ví dụ về chiều cao trung bình trẻ 10 tuổi không phải là một ước lượng vững
2.5.1.3 Kỳ vọng (Expectation) Định nghĩa: Giả sử 𝑋𝑋 là đại lượng ngẫu nhiên rời rạc có thể nhận các giá trị 𝑥𝑥 1 ,
𝑥𝑥 2 , … , 𝑥𝑥 𝑛 với các xác suất tương ứng 𝑃 1 , 𝑃 2 , … , 𝑃 𝑛
Khi đó kỳ vọng của X, ký hiệu là 𝐸𝐸(𝑋𝑋) hay 𝜇𝜇được xác định bởi công thức
Nếu 𝑋𝑋 là đại lượng ngẫu nhiên liên tục có hàm mật độ xác suất là 𝑓𝑓(𝑥𝑥) thì kỳ vọng của 𝑋𝑋 là:
Nếu X và Y là hai đại lượng ngẫu nhiên độc lập thì:
Kỳ vọng của một đại lượng ngẫu nhiên, ký hiệu là \(E(X)\), đại diện cho giá trị trung bình theo xác suất của đại lượng đó Điều này có nghĩa là kỳ vọng là điểm trung tâm của phân phối, nơi mà các giá trị cụ thể của X sẽ tập trung xung quanh.
2.5.1.4 Phương sai (Variance) Định nghĩa: Phương sai (trung bình bình phương độ lệch) của đại lượng ngẫu nhiên X, ký hiệu 𝑉𝑉𝑎𝑎𝑟𝑟(𝑋𝑋) hay 𝑉𝑉(𝑋𝑋) được xác định bởi công thức:
Nếu X là đại lượng ngẫu nhiên rời rạc có thể nhận các giá trị 𝑥𝑥 1 , 𝑥𝑥 2 , … , 𝑥𝑥 𝑛 với các xác suất tương ứng 𝑃 1 , 𝑃 2 , … , 𝑃 𝑛 thì:
Nếu X là đại lượng ngẫu nhiên liên tục có hàm mật độ xác suất là 𝑓𝑓(𝑥𝑥) thì:
Trong thực tế ta thường tính phương sai bằng công thức:
𝑉𝑉𝑎𝑎𝑟𝑟(𝑋𝑋) = 𝐸𝐸[𝑋𝑋 2 ]−[𝐸𝐸(𝑋𝑋)] 2 (2.26) Tính chất: i 𝑉𝑉𝑎𝑎𝑟𝑟(𝑋𝑋) = 0 ii 𝑉𝑉𝑎𝑎𝑟𝑟(𝐶𝐶 𝑋𝑋) = 𝐶𝐶2 𝑉𝑉𝑎𝑎𝑟𝑟(𝑋𝑋); iii Nếu X, Y là 2 biến ngẫu nhiên độc lập thì:
Phương sai của tổng hai biến ngẫu nhiên \(X\) và \(Y\) được biểu diễn bằng công thức \(V(X + Y) = V(X - Y) = V(X) + V(Y)\) Ý nghĩa của phương sai \(V(X)\) là đo lường độ lệch của \(X\) so với giá trị trung bình, hay còn gọi là trung bình bình phương độ lệch Phương sai phản ánh mức độ phân tán của các giá trị ngẫu nhiên xung quanh giá trị trung bình hoặc kỳ vọng; nếu phương sai lớn, giá trị sẽ phân tán nhiều hơn và ngược lại.
2.5.1.5 Độ lệch chuẩn Định nghĩa: Độ lệch chuẩn của đại lượng ngẫu nhiên X, ký hiệu 𝜎𝜎(𝑋𝑋) được xác định bởi công thức:
Cho 2 biến ngẫu nhiên X và Y, ta có định nghĩa hiệp phương sai của X và
Cov(X, Y) = E[(X − àx)(Y − ày)] (2.29) trong đó 𝜇𝜇𝑥𝑥, 𝜇𝜇𝑦𝑦 lần lượt là kỳ vọng của X, Y
Một công thức tương đương của hiệp phương sai:
Hiệp phương sai đo lường sự biến thiên đồng thời của hai biến ngẫu nhiên Nếu hai biến có xu hướng thay đổi cùng chiều, tức là khi một biến cao hơn giá trị kỳ vọng thì biến kia cũng cao hơn, hiệp phương sai sẽ có giá trị dương Ngược lại, nếu một biến nằm trên giá trị kỳ vọng trong khi biến kia nằm dưới, hiệp phương sai sẽ có giá trị âm.
Nếu 2 biến ngẫu nhiên là độc lập thì 𝐶𝐶𝑜𝑜𝑣𝑣(𝑋𝑋, 𝑌𝑌) = 0 tuy nhiên điều ngược lại không đúng Các biến ngẫu nhiên mà có hiêp phương sai bằng 0 được gọi là không tương quan (uncorrelated), chúng có thể độc lập nhau hoặc không
Như vậy nếu X, Y độc lập ta có 𝐸𝐸[𝑋𝑋𝑌𝑌] = 𝜇𝜇𝑥𝑥𝜇𝜇𝑦𝑦
2.5.1.7 Ma trận hiệp phương sai
Như chúng ta vừa trình bày, hiệp phương sai là đại lượng tính toán sự tương quan giữa 2 biến ngẫu nhiên
Vậy giả sử chúng ta có một vector biến ngẫu nhiên có 3 phần tử 𝑋𝑋 1 , 𝑋𝑋 2 ,𝑋𝑋 3
Nếu ta muốn tính toán sự tương quan giữa tất cả các cặp biến ngẫu nhiên thì ta phải tính tất cả 3 hiệp phương sai 𝐶𝐶𝑜𝑜𝑣𝑣(𝑋𝑋1, 𝑋𝑋2), 𝐶𝐶𝑜𝑜𝑣𝑣(𝑋𝑋1, 𝑋𝑋3), 𝐶𝐶𝑜𝑜𝑣𝑣(𝑋𝑋2, 𝑋𝑋3)
Ma trận hiệp phương sai được phát triển để tính toán tất cả các hệ số hiệp phương sai giữa hai biến ngẫu nhiên trong một vector biến ngẫu nhiên.
Cho một vector biến ngẫu nhiên X chứa n biến ngẫu nhiên, ma trận hiệp phương sai của X, kỹ hiệu là ∑, được định nghĩa là:
�Quan sát trên đường chéo của ma trận hiệp phương sai
(i=j) ta thấy tại đó là các phương sai, vì 𝐶𝐶𝑜𝑜𝑣𝑣(𝑋𝑋𝑖𝑖, 𝑋𝑋𝑖𝑖) = 𝑉𝑉𝑎𝑎𝑟𝑟(𝑋𝑋𝑖𝑖)
2.5.1.8 Phân phối chuẩn (phân phối Gaussian)
Trong thực tế, người ta thường sử dụng phân phối xác suất có tên là phân phối chuẩn (normal distribution) hay phân phối Gaussian
Biến ngẫu nhiên X được coi là có phân phối Gaussian khi hàm mật độ của nó là hàm Gaussian Ký hiệu X ~ N(μ, σ) cho thấy X có phân phối chuẩn với các tham số μ và σ.
Khi đó hàm mật độ của X là:
Với phân phối xác suất như trên, người ta tính được 𝜇𝜇, 𝜎𝜎 lần lượt là kỳ vọng và độ lệch chuẩn của X
Dưới đây là đồ thị của một số phân phối chuẩn
Hình 2.3 Đồ thị của một số phân phối chuẩn Quan sát đồ thị ta thấy phân phối chuẩn có dạng chuông Giá trị kỳ vọng của X là
𝑋𝑋 = 𝜇𝜇 là trục đối xứng Độ lệch chuẩn 𝜎𝜎 (hay phương sai 𝜎𝜎2) càng lớn thì đồ thị càng bẹt, nghĩa là các giá trị càng phân tán ra xa kỳ vọng