TỔNG QUAN NGHIÊN CỨU
Ngành công nghiệp năng lượng
1.1.1 Vai trò của năng lượng
Công nghiệp năng lượng đóng vai trò quan trọng trong nền kinh tế của một quốc gia, là nền tảng cho sự phát triển của sản xuất hiện đại Ngành này không chỉ là động lực cho các lĩnh vực kinh tế khác mà còn là thành phần thiết yếu trong hệ thống cơ sở hạ tầng sản xuất Sự phát triển của công nghiệp năng lượng kéo theo sự phát triển của các ngành công nghiệp khác như cơ khí và sản xuất vật liệu xây dựng Ngoài ra, ngành này còn thu hút các ngành công nghiệp tiêu thụ nhiều điện năng như luyện kim, chế biến thực phẩm và hóa chất Với vị trí địa lý thuận lợi, công nghiệp năng lượng có khả năng tạo ra vùng kinh tế lớn Chỉ số tiêu dùng năng lượng bình quân đầu người cũng phản ánh trình độ phát triển kinh tế, kỹ thuật và văn hóa của quốc gia.
Trong nhiều thế kỉ qua, mức tiêu thụ năng lượng của nhân loại, đặc biệt là than, dầu mỏ và khí đốt, đã tăng nhanh chóng Từ năm 1990, mỗi người tiêu thụ trung bình khoảng 1,6 tấn dầu quy đổi mỗi năm, gấp 25 lần trọng lượng cơ thể Mặc dù mức tiêu thụ năng lượng bình quân toàn cầu đã tăng rõ rệt trong 20 năm qua, sự chênh lệch giữa các quốc gia là rất lớn Các nước phát triển ở châu Âu và Bắc Mỹ có mức tiêu thụ năng lượng cao nhất, trong khi các nước nghèo ở châu Phi và Nam Á lại có mức tiêu thụ thấp nhất, với sự chênh lệch lên tới 45 lần Tại Việt Nam, chỉ số tiêu thụ năng lượng là 521 kg/người.
1.1.2 Cơ cấu sử dụng và các nguồn năng lượng chính hiện nay a/ Cơ cấu sử dụng năng lượng phổ biến hiện nay trên thế giới:
Công nghiệp năng lượng hiện đại là một hệ thống phức tạp, thiết yếu cho sản xuất và đời sống, có ảnh hưởng lớn đến nền kinh tế trong thời đại cách mạng khoa học kỹ thuật Thế giới sở hữu nguồn tài nguyên năng lượng phong phú, bao gồm cả năng lượng truyền thống như củi, than và dầu mỏ, cùng với các nguồn năng lượng mới hiệu quả như năng lượng thủy triều, hạt nhân, mặt trời, địa nhiệt, gió và sinh khối Những tiến bộ khoa học công nghệ và tác động môi trường đã thúc đẩy việc sử dụng các nguồn năng lượng mới, dẫn đến sự thay đổi đáng kể trong cơ cấu sử dụng năng lượng toàn cầu theo thời gian.
Năm 2017, tổng lượng điện năng tiêu thụ toàn cầu đạt 25,551 triệu tỷ kWh, tăng 3,1% so với năm trước Cơ cấu nguồn sản xuất điện bao gồm: than đá chiếm 38%, khí tự nhiên 23%, thủy điện 16%, điện hạt nhân 10%, dầu 4%, năng lượng tái tạo 8% và nguồn khác 1%.
Tại các nước phát triển như Mỹ, Nhật Bản và Hàn Quốc, điện năng từ nhiệt điện than chiếm hơn 30% tổng sản lượng điện Đặc biệt, ở những quốc gia có tốc độ tăng trưởng kinh tế cao như Trung Quốc, Ấn Độ và Nam Phi, tỷ lệ này còn cao hơn, đạt trên 65%.
Nước Đức, với GDP đứng thứ 4 và nền kinh tế mạnh thứ 6 toàn cầu, có dân số 82 triệu người và là một trong những quốc gia tiên phong trong phát triển năng lượng tái tạo Mặc dù năng lượng gió chiếm 50% công suất lắp đặt, nhưng do tính không ổn định của nguồn năng lượng này, trong năm 2018, năng lượng tái tạo chỉ cung cấp khoảng 23% sản lượng điện Ngược lại, nhiệt điện than, mặc dù chỉ chiếm 22% công suất lắp đặt, lại sản xuất gần 40% điện năng cho cả nước, cho thấy vai trò quan trọng của nó trong việc đảm bảo an ninh năng lượng của Đức.
ASEAN là khu vực có tốc độ tăng trưởng kinh tế và dân số nhanh chóng, dẫn đến nhu cầu điện năng tăng cao Năm 2017, nhiệt điện than đóng góp khoảng 40% vào tổng sản lượng điện của khu vực, với Malaysia (45%), Indonesia (59%) và Việt Nam (40%) là những quốc gia có tỷ trọng nhiệt điện than lớn nhất.
Theo thống kê của Cơ quan Năng lượng Quốc tế (IEA), nhu cầu năng lượng của ASEAN đã tăng hơn 150% trong 25 năm qua, chủ yếu do sự gia tăng dân số và quy mô nền kinh tế khu vực tăng gấp ba lần Năm 2018, dân số ASEAN khoảng 650 triệu người, và dự báo sẽ đạt 750 triệu người vào năm 2040.
Năng lượng truyền thống như củi và gỗ đã được con người sử dụng từ rất lâu, nhưng tỷ trọng của nó trong tổng năng lượng đang giảm nhanh chóng, chỉ còn 80% vào những năm gần đây.
Từ năm 1860, tỷ lệ sử dụng củi đã giảm xuống 25% vào năm 1920, và sau một thế kỷ, vai trò của nó chỉ còn 2% Đây là một xu hướng tích cực, vì củi và gỗ là tài nguyên tái tạo nhưng quá trình phục hồi rất chậm Nếu con người tiếp tục đốt củi, Trái đất sẽ sớm mất đi màu xanh, dẫn đến xói mòn đất đai nghiêm trọng và khí hậu nóng lên, gây ảnh hưởng tiêu cực đến môi trường sống của nhân loại Các nguồn năng lượng phổ biến hiện nay đang được chú ý hơn bao giờ hết.
Than đá, nguồn năng lượng hóa thạch có khả năng phục hồi chậm, đã được biết đến từ lâu và vẫn được sử dụng phổ biến trong sản xuất và đời sống Tỷ trọng sử dụng than đá trong cơ cấu năng lượng đã tăng nhanh vào cuối thế kỷ XIX, từ 44% năm 1880 lên 58% năm 1900, đạt mức cực đại vào đầu thế kỷ XX.
Vào năm 1920, việc sử dụng than cốc thay cho than củi trong ngành công nghiệp luyện kim, cùng với sự phát triển của máy hơi nước và ứng dụng của than trong công nghiệp hóa học, đã đánh dấu những thay đổi quan trọng trong quy trình sản xuất Tuy nhiên, từ nửa sau thế kỷ XX, tỷ trọng của than trong cơ cấu năng lượng đã giảm nhanh chóng, chủ yếu do tác động tiêu cực của việc khai thác và sử dụng than dẫn đến ô nhiễm môi trường, cũng như sự xuất hiện của các nguồn năng lượng hiệu quả hơn.
Dầu mỏ, khí đốt là nguồn năng lượng mới, chỉ thực sự được sử dụng nhiều vào nửa sau thế kỉ XX, từ 2% năm 1860 lên 4% năm 1900, 26% năm 1940 và 44% năm
Từ những năm 1960, ngành dầu mỏ đã đạt đỉnh vào thập kỷ 80, đóng vai trò quan trọng trong sự phát triển của giao thông và công nghiệp hóa chất, đặc biệt là hóa dầu Tuy nhiên, bước sang thế kỷ XXI, vai trò của dầu mỏ bắt đầu giảm sút do nhiều nguyên nhân, bao gồm xung đột và khủng hoảng giữa các quốc gia sản xuất và tiêu thụ, ô nhiễm môi trường từ khai thác và vận chuyển dầu, cũng như mức khai thác quá mức dẫn đến nguy cơ cạn kiệt nguồn năng lượng này, dự báo sẽ xảy ra vào năm 2030 nếu tình trạng khai thác hiện tại tiếp tục Đặc biệt, sự phát triển của các nguồn năng lượng mới thay thế cũng là một yếu tố quan trọng trong sự suy giảm vai trò của dầu mỏ.
Khí đốt nén tự nhiên (CNG) là hỗn hợp khí cháy chủ yếu gồm hydrocarbon, trong đó mêtan chiếm đến 85% Là một loại nhiên liệu hóa thạch, khí thiên nhiên được khai thác từ các mỏ dầu và cung cấp khoảng 25% năng lượng toàn cầu Trong quá trình tinh lọc, các tạp chất như CO2, H2S và N2 được loại bỏ để nâng cao chất lượng khí CNG được coi là giải pháp thay thế cho xăng và dầu diesel, với lợi ích lớn là không thải ra hiệu ứng nhà kính, thân thiện với môi trường và an toàn hơn trong trường hợp tràn Hiện nay, CNG được sử dụng cho ô tô đã chuyển đổi thành xe hai nhiên liệu, ngày càng trở nên phổ biến do giá xăng dầu tăng cao Ý là quốc gia dẫn đầu về số lượng xe sử dụng CNG, theo sau là Canada và New Zealand.
Năng lượng sinh khối là nguồn năng lượng tái tạo từ vật liệu sinh học, chủ yếu là cây trồng và nguyên liệu thực vật Nó có thể được sử dụng trực tiếp hoặc chuyển đổi thành nhiên liệu sinh học qua ba phương pháp: chuyển đổi nhiệt, hóa học và sinh hóa Lịch sử khai thác năng lượng sinh khối bắt đầu từ việc sử dụng củi và cỏ khô để sưởi ấm Hiện nay, sinh khối không chỉ là nguyên liệu tạo ra điện năng và nhiệt từ cây trồng mà còn bao gồm các chất thải phân hủy sinh học Nguồn sinh khối công nghiệp được phát triển từ nhiều loại thực vật như Miscanthus, cỏ, cây gai dầu, ngô, cây dương, cây liễu, cây lúa miến, mía và một số loài cây khác.
Công nghệ trí thông minh nhân tạo trong dự báo tiêu thụ năng lượng
1.2.1 Công nghệ trí thông minh nhân tạo
Trí tuệ nhân tạo (AI) là một lĩnh vực trong khoa học máy tính, tập trung vào nghiên cứu và ứng dụng các hệ thống máy tính thông minh Thay vì sử dụng các phương pháp truyền thống tốn kém tài nguyên để mô hình hóa và tối ưu hóa hệ thống phức tạp, AI cung cấp những giải pháp hiệu quả hơn, giúp giải quyết các vấn đề trong nhiều lĩnh vực như khoa học công nghệ, kỹ thuật, kinh tế, môi trường và y học.
Nghiên cứu về trí tuệ nhân tạo bắt đầu từ năm 1956 tại Đại học Dartmouth, nơi thuật ngữ "trí thông minh nhân tạo" được giới thiệu Đây là một lĩnh vực học thuật đa ngành, kết hợp các ngành như khoa học máy tính, điều khiển học, lý thuyết thông tin, tâm lý học, ngôn ngữ học và sinh lý thần kinh Tiến sỹ Stuart Russell, chuyên gia tại Đại học California, khẳng định rằng trí tuệ nhân tạo là một nhánh của khoa học máy tính, tập trung vào nghiên cứu, thiết kế và ứng dụng các hệ thống máy tính thông minh.
Mục tiêu của lĩnh vực trí tuệ nhân tạo là mô phỏng và thực hiện các chức năng thông minh của bộ não con người, nhằm phát triển công nghệ và lý thuyết liên quan Sự bùng nổ của trí tuệ nhân tạo vào cuối những năm 1960 và 1970 đã thúc đẩy sự phát triển của khoa học công nghệ, khẳng định vai trò quan trọng của nó trong nhiều lĩnh vực đời sống Đến những năm 1990, nghiên cứu trí tuệ nhân tạo có những bước tiến mới nhờ vào sự phát triển của công nghệ mạng, đặc biệt là internet, khiến cho nghiên cứu trở nên gần gũi và thực tiễn hơn.
Hình 1.3 Trí tuệ nhân tạo [12]
Trí tuệ nhân tạo (AI) đang thu hút sự chú ý mạnh mẽ trong những năm gần đây, nhờ vào sự đổi mới qua Internet, giúp AI trở nên gần gũi hơn với cuộc sống hàng ngày Những tiến bộ này, cùng với mối quan tâm về các tác động kinh tế, xã hội và đạo đức của công nghệ, đã đưa AI trở thành chủ đề nóng trong nhiều cuộc tranh luận hiện nay Đặc biệt, đầu tư vào AI từ các lĩnh vực khác nhau đang gia tăng nhanh chóng từng ngày.
Sự phát triển của siêu dữ liệu Big Data và mở rộng Internet vạn vật (IoT) đã tạo ra môi trường lý tưởng cho sự phát triển của các ứng dụng và dịch vụ trí tuệ nhân tạo (AI) Hiện nay, AI đã được ứng dụng trong nhiều lĩnh vực như chẩn đoán chăm sóc sức khỏe, điều trị nhắm mục tiêu, vận chuyển, an toàn công cộng, robot dịch vụ, giáo dục và giải trí, và dự kiến sẽ tiếp tục mở rộng ra nhiều lĩnh vực khác trong tương lai Cùng với Internet, AI đang thay đổi cách chúng ta trải nghiệm thế giới và có tiềm năng trở thành động lực mới cho sự tăng trưởng kinh tế.
Trí thông minh nhân tạo (AI) được chia thành hai loại chính: AI hẹp và AI tổng quát AI hẹp, mà chúng ta thường sử dụng hiện nay, được thiết kế để thực hiện các nhiệm vụ cụ thể, chẳng hạn như dịch ngôn ngữ Ngược lại, AI tổng quát là một khái niệm giả thuyết, có khả năng học hỏi và thực hiện nhiều loại nhiệm vụ khác nhau Sự phát triển của AI hẹp chủ yếu dựa vào các thuật toán và mô hình mới trong lĩnh vực học máy, một nhánh quan trọng của khoa học máy tính.
Trong kỹ thuật học máy, thuật toán là chuỗi hướng dẫn giúp giải quyết vấn đề, được lập trình viên phát triển để hướng dẫn máy tính thực hiện các nhiệm vụ mới Những thuật toán này là nền tảng của thế giới kỹ thuật số hiện đại, giúp tổ chức lượng lớn dữ liệu thành thông tin và dịch vụ, dựa trên các quy tắc và hướng dẫn cụ thể.
Thay vì lập trình máy tính theo từng bước, phương pháp học máy cho phép máy tính tự học từ dữ liệu mà không cần hướng dẫn cụ thể từ lập trình viên Điều này mở ra khả năng cho máy tính thực hiện các tác vụ mới và phức tạp mà không thể lập trình thủ công, như phát triển ứng dụng nhận dạng hình ảnh cho người khiếm thị hoặc chuyển đổi hình ảnh thành lời nói.
1.2.2 Các nghiên cứu về dự báo tiêu thụ năng lượng dựa trên AI
Tốc độ phát triển nhanh chóng của các quốc gia trên thế giới đã dẫn đến nhu cầu sử dụng năng lượng ngày càng tăng, đặc biệt là trong các khu dân cư và thương mại Dự báo mức tiêu thụ năng lượng trở nên quan trọng để ước tính mức sử dụng năng lượng, đồng thời xây dựng hiệu quả năng lượng không chỉ mang lại lợi ích môi trường mà còn tạo ra lợi ích kinh tế lớn với chi phí vận hành thấp hơn Nhiều quốc gia đã nhanh chóng thực hiện các quy định năng lượng cho các loại hình xây dựng khác nhau, và nhiều phần mềm thiết kế tiết kiệm năng lượng đã được phát triển và áp dụng rộng rãi.
Dự báo tiêu thụ năng lượng toàn cầu sẽ tăng 53%, từ 505 triệu tỷ Btu vào năm 2008 lên 700 triệu tỷ Btu vào năm 2035 Nhiều quốc gia đã nhanh chóng áp dụng các quy định về năng lượng cho các tòa nhà, nhằm đảm bảo thiết kế tiết kiệm năng lượng và giảm khí thải CO2 Nghiên cứu chỉ ra rằng cải thiện hiệu quả sử dụng năng lượng có thể giảm đáng kể tổng mức tiêu thụ toàn cầu Ngay cả những thay đổi nhỏ trong nhu cầu năng lượng cũng mang lại tiết kiệm lớn cho người tiêu dùng và các tiện ích Do đó, nâng cao hiệu quả sử dụng năng lượng của các tòa nhà là cần thiết để giảm tác động môi trường và kiểm soát chi phí năng lượng.
Trong hai thập kỷ qua, nhiều kỹ thuật dự báo đã được áp dụng để dự đoán mức tiêu thụ năng lượng của các tòa nhà, chia thành ba loại: phương pháp kỹ thuật, phương pháp thống kê và phương pháp trí tuệ nhân tạo Trong đó, các phương pháp trí tuệ nhân tạo (AI) như Mạng thần kinh nhân tạo (ANN), Máy vectơ hỗ trợ (SVM) và Hồi quy tuyến tính (LR) được triển khai rộng rãi Sự phi tuyến tính và biến động của mức tiêu thụ năng lượng theo thời gian thực đã tạo ra những thách thức trong việc dự đoán mức tiêu thụ năng lượng ở các tòa nhà dân cư.
Gần đây, hệ thống quản lý năng lượng tòa nhà đã phát triển nhanh chóng, giúp người dùng cuối sử dụng điện hiệu quả hơn Nghiên cứu của Aghemo et al (2014) đã chỉ ra rằng hệ thống điều khiển ánh sáng trong văn phòng có thể tiết kiệm năng lượng từ 17% đến 32% tại mười văn phòng ở Torino, Ý, với việc theo dõi mức tiêu thụ điện hàng năm và năng lượng ký sinh Ngoài ra, Zhou và cộng sự (2014) đã đề xuất một phương pháp kiểm soát tiêu thụ năng lượng theo thời gian thực cho các ngôi nhà ở Vương quốc Anh, cho thấy rằng phương pháp này có khả năng tối ưu hóa lịch sử dụng thiết bị gia dụng và hành vi sạc/xả pin, ngay cả khi thông tin dự báo không chính xác.
Valor et al (2001) đã nghiên cứu mối quan hệ giữa tải điện trong tòa nhà và nhiệt độ ngoài trời hàng ngày tại Tây Ban Nha, cho thấy độ nhạy của phụ tải điện với nhiệt độ ngoài trời tăng theo thời gian, đặc biệt cao vào mùa hè so với mùa đông, mặc dù độ nhạy vào mùa lạnh vẫn đáng kể Nghiên cứu xác định các hàm nhu cầu sưởi ấm và làm mát với hệ số tương quan lần lượt là 0,79 và 0,87, dự báo phụ tải điện với sai số tiêu chuẩn 4% và 2%.
Costa và cộng sự (2012) đã đề xuất một phương pháp luận giúp các nhà quản lý năng lượng xác định chiến lược vận hành tòa nhà tối ưu nhằm giảm tiêu thụ năng lượng và nâng cao tiện nghi nhiệt Trong khi đó, Chou và Ngo (2016) đã phát triển khung phân tích dữ liệu lớn cho lưới điện thông minh, nhấn mạnh các thành phần thiết yếu của hệ thống hỗ trợ ra quyết định tiết kiệm năng lượng Những nghiên cứu này tập trung vào việc xây dựng nền tảng và phương pháp dự đoán nhằm cải thiện hiệu quả và độ tin cậy của các hệ thống quản lý năng lượng.
Phân tích tiêu thụ năng lượng thông qua các phương pháp phân tích dữ liệu chuỗi thời gian giúp trích xuất các số liệu thống kê và đặc điểm quan trọng của dữ liệu Dự báo chuỗi thời gian sử dụng mô hình để dự đoán giá trị tương lai dựa trên các giá trị đã quan sát trước đó Chuỗi thời gian là tập hợp các giá trị được ghi lại theo thứ tự trong các khoảng thời gian đều đặn Phân tích chuỗi thời gian bao gồm hai phần: đầu tiên là xác định cấu trúc và mô hình cơ bản của dữ liệu, và thứ hai là áp dụng mô hình cho dữ liệu để hỗ trợ dự đoán tương lai Phân tích này được áp dụng rộng rãi trong nhiều lĩnh vực như thống kê, dự đoán năng lượng, xử lý tín hiệu, nhận dạng mẫu, kinh tế lượng, dự báo thời tiết, dự báo động đất, thiên văn học, và các lĩnh vực khoa học và kỹ thuật ứng dụng liên quan đến các phép đo theo thời gian.
Dự báo dữ liệu dạng chuỗi thời gian
Dữ liệu chuỗi thời gian là loại dữ liệu được thu thập tại các thời điểm khác nhau, khác với dữ liệu rời rạc chỉ quan sát cá nhân hoặc công ty tại một thời điểm duy nhất Do các điểm dữ liệu trong chuỗi thời gian được thu thập liên tiếp, nên có khả năng tương quan giữa các quan sát, điều này làm nổi bật tính chất đặc trưng của dữ liệu chuỗi thời gian so với dữ liệu rời rạc.
Chuỗi thời gian là tập hợp thông tin liên kết với thời gian cho mỗi giá trị Các giá trị này có thể là nhiều loại dữ liệu đo lường khác nhau, như giá cả, độ ẩm hoặc số lượng người Miễn là các giá trị được ghi chép rõ ràng, bất kỳ loại dữ liệu nào cũng có thể được phân tích thông qua chuỗi thời gian.
Không có bất kỳ giới hạn nào về tổng khoảng thời gian của một chuỗi thời gian.
Khoảng thời gian có thể kéo dài từ một phút đến một thế kỷ, nhưng để tạo nên giá trị, cần có điểm khởi đầu và điểm kết thúc rõ ràng Giữa hai điểm này thường có nhiều mốc thời gian khác nhau, được gọi là các khoảng thời gian Chẳng hạn, nếu dữ liệu được ghi lại hàng ngày từ 01/01/2000 đến đêm giao thừa năm 2009, thì mỗi ngày sẽ tạo thành một khoảng thời gian riêng biệt.
Tần số đầu ra của bộ dữ liệu cho biết tần suất ghi nhận các tập dữ liệu Để phân tích chuỗi thời gian hiệu quả, các khoảng thời gian cần phải đồng nhất và rõ ràng, dẫn đến tần số không đổi Tần số này, một phép đo thời gian, có thể dao động từ vài mili giây đến vài thập kỷ, nhưng thường gặp nhất là hàng ngày, hàng tháng, hàng quý và hàng năm.
Dữ liệu chuỗi thời gian có ứng dụng rộng rãi trong nhiều lĩnh vực như dự báo thời tiết, điện năng, tài chính và môi trường Các nhà khí tượng học dựa vào phân tích dữ liệu quá khứ để dự đoán thời tiết trong những ngày tới Tuy nhiên, nếu dữ liệu không được sắp xếp theo thứ tự thời gian, việc xác định mẫu chính xác sẽ trở nên rất khó khăn.
Để có giá trị thực sự từ thông tin về nhiệt độ cao nhất trong 5 ngày qua, chúng ta cần biết rõ nhiệt độ của từng ngày cụ thể Nếu không có khoảng thời gian tương ứng cho mỗi giá trị, khả năng nhiệt độ tăng hoặc giảm liên tiếp trong 5 ngày là như nhau, dẫn đến dữ liệu trở nên kém hữu ích.
Dữ liệu chuỗi thời gian đóng vai trò quan trọng trong lĩnh vực tài chính, đặc biệt là trong việc phân tích xu hướng giá, lợi nhuận và doanh số trong tương lai Đối với nhà đầu tư và chủ sở hữu công ty, việc dự đoán sự tăng giảm của các chỉ số này là rất cần thiết Một trong những chủ đề chính trong phân tích chuỗi thời gian là đánh giá hiệu quả và tính ổn định của thị trường tài chính cũng như các danh mục đầu tư.
Dữ liệu chuỗi thời gian đóng vai trò quan trọng trong dự báo bán hàng, giúp doanh nghiệp phân tích các xu hướng quá khứ để dự đoán nhu cầu tương lai Việc này không chỉ giúp các công ty duy trì mức tồn kho hợp lý, tránh tình trạng hết hàng, mà còn cho phép họ điều chỉnh giá cả nhằm tối đa hóa lợi nhuận.
Boeing là một ví dụ điển hình về việc thao túng giá cả dựa trên nhu cầu dự kiến Công ty này dự đoán nhu cầu của người Hồi giáo bằng cách sử dụng dữ liệu chuỗi thời gian từ các năm và tháng trước Nếu có mối quan hệ đáng kể giữa các giá trị trong quá khứ và hiện tại, giá trị đề xuất sẽ phản ánh sự phụ thuộc theo thời gian.
Dữ liệu chuỗi thời gian thường phụ thuộc vào thời gian, có nghĩa là các giá trị trong mỗi giai đoạn không chỉ bị ảnh hưởng bởi các yếu tố bên ngoài mà còn bởi các giá trị trong quá khứ Ví dụ, nhiệt độ dự kiến vào ngày mai thường sẽ nằm trong khoảng hợp lý so với giá trị hôm nay.
Dữ liệu chuỗi thời gian liên quan đến thời tiết có thể bị ảnh hưởng bởi hệ số mùa, với các giá trị như mưa và nhiệt độ thay đổi theo thời gian trong ngày và mùa trong năm Do tính chất chu kỳ lặp lại của chúng, có thể dự đoán những biến động này để cải thiện độ chính xác trong các dự đoán Tuy nhiên, dữ liệu thời gian chỉ có thể được thu thập và phân tích dựa trên logic mà không có chu kỳ cụ thể.
Dữ liệu chuỗi thời gian thường không tuân thủ các giả định của các phương pháp thống kê thông thường, do đó cần có những công cụ và phương pháp riêng biệt để phân tích Phân tích chuỗi thời gian là lĩnh vực chuyên biệt nhằm xử lý và hiểu rõ các đặc điểm thống kê của loại dữ liệu này.
1.3.2 Phân loại dự báo dữ liệu chuỗi thời gian a) Theo thời đoạn dự báo: Dự báo ngắn hạn, trung hạn và dài hạn
- Dự báo ngắn hạn: thời đoạn dự báo ngắn, thường không quá 3 tháng, ít khi đến
1 năm Loại dự báo này cần cho việc mua sắm, điều độ công việc, phân giao nhiệm vụ, cân đối các mặt trong quản trị tác nghiệp.
Dự báo trung hạn thường kéo dài từ 3 tháng đến 3 năm và rất quan trọng cho việc lập kế hoạch bán hàng, sản xuất, ngân sách, quản lý tiền mặt và huy động nguồn lực.
Dự báo dài hạn, kéo dài từ 3 năm trở lên, là yếu tố quan trọng trong việc lập kế hoạch cho các dự án sản xuất sản phẩm mới Nó giúp xác định vị trí cho các cơ sở mới, lựa chọn công nghệ và thiết bị hiện đại, đồng thời hỗ trợ việc mở rộng doanh nghiệp hiện tại hoặc thành lập doanh nghiệp mới.
Thời đoạn dự báo phụ thuộc vào lĩnh vực cụ thể, ví dụ như trong dự báo năng lượng, thời gian dự báo ngắn hạn không quá 2 tuần, trung hạn từ 2 tuần đến 3 năm, và dự báo rất ngắn hạn dưới 1 ngày Ngoài ra, dự báo còn được phân chia theo giai đoạn thành dự báo hậu nghiệm và dự báo tiền nghiệm.
Các thuật toán tối ưu hóa dựa trên kỹ thuật học máy
Kỹ thuật học máy (ML) là một nhánh của trí tuệ nhân tạo, cho phép các hệ thống công nghệ thông tin tự động tìm ra giải pháp cho các vấn đề bằng cách nhận diện các mẫu trong cơ sở dữ liệu Thông qua các thuật toán và bộ dữ liệu hiện có, ML giúp máy tính phát hiện các mẫu và phát triển các khái niệm giải pháp phù hợp, tạo ra kiến thức nhân tạo dựa trên kinh nghiệm.
Sự phát triển của các chương trình máy tính có khả năng truy cập và tự học từ dữ liệu là cốt lõi của kỹ thuật học máy Quy trình này bắt đầu bằng việc phân tích các quan sát và thống kê, bao gồm ví dụ, hướng dẫn và kinh nghiệm trực tiếp, nhằm tìm ra các mẫu trong dữ liệu để đưa ra quyết định chính xác hơn Mục tiêu quan trọng nhất là cho phép máy tính tự học mà không cần sự can thiệp của con người, từ đó điều chỉnh hành động một cách tự động và hiệu quả.
Kỹ thuật học máy giải thuật các bài toán theo năm bước cơ bản:
- Tìm kiếm, trích xuất và tóm tắt dữ liệu liên quan
- Đưa ra dự đoán dựa trên dữ liệu phân tích
- Tính xác suất cho kết quả cụ thể
- Thích ứng với sự phát triển nhất định một cách tự chủ
- Tối ưu hóa các quy trình dựa trên các mẫu được công nhận
Các thuật toán học máy được giám sát dự đoán sự kiện tương lai dựa trên dữ liệu quá khứ và các ví dụ được gắn nhãn, từ đó suy ra hàm để đưa ra dự đoán cho các giá trị đầu ra Sau khi đào tạo, chương trình có thể cung cấp mục tiêu cho bất kỳ đầu vào nào và đánh giá chính xác đầu ra để điều chỉnh mô hình và tìm kiếm lỗi Ngược lại, các thuật toán học máy không giám sát sử dụng dữ liệu không được gắn nhãn để suy ra các cấu trúc ẩn, giúp khám phá dữ liệu mà không luôn đảm bảo đầu ra chính xác Nhiều công ty lớn như Amazon, Google, Salesforce, Netflix và IBM đang đầu tư mạnh vào lĩnh vực học máy này.
Quá trình cơ bản của học máy bắt đầu bằng việc cung cấp dữ liệu đào tạo cho thuật toán học tập, từ đó thuật toán này tạo ra một bộ quy tắc mới dựa trên các suy luận từ dữ liệu Kết quả của quá trình này là một mô hình học máy, cho phép cùng một thuật toán học tập được áp dụng để tạo ra nhiều mô hình khác nhau từ các dữ liệu đào tạo khác nhau Chẳng hạn, thuật toán học tập có thể được sử dụng để dạy máy tính cách dịch ngôn ngữ hoặc dự đoán thị trường chứng khoán.
Học máy dựa vào việc suy ra các hướng dẫn mới từ dữ liệu, cho thấy tầm quan trọng của dữ liệu trong quá trình đào tạo thuật toán Số lượng dữ liệu càng lớn, thuật toán càng có khả năng học hỏi nhiều hơn Thực tế, nhiều tiến bộ gần đây trong trí tuệ nhân tạo không phải do những đổi mới về thuật toán, mà chủ yếu nhờ vào khối lượng dữ liệu khổng lồ được tạo ra từ Internet.
Mô hình học máy có thể sử dụng nhiều kỹ thuật khác nhau, nhưng thường được phân loại thành ba loại chính.
Học có giám sát là phương pháp mà thuật toán học từ dữ liệu đã được gán nhãn và đầu ra mong muốn Chẳng hạn, khi cung cấp hình ảnh của những con chó với nhãn "chó", thuật toán sẽ xác định các quy tắc cần thiết để phân loại đúng hình ảnh của chó.
Học tập không giám sát là một phương pháp trong đó dữ liệu đầu vào không được gán nhãn, và thuật toán phải tìm ra các mẫu từ dữ liệu này Một ví dụ điển hình là hệ thống đề xuất trên các trang web thương mại điện tử, nơi thuật toán học phát hiện các mặt hàng thường được mua cùng nhau.
Học tăng cường là một phương pháp mà thuật toán tương tác với môi trường năng động, nhận phản hồi thông qua phần thưởng và hình phạt Ví dụ điển hình là xe tự lái, được khen thưởng khi di chuyển đúng trên đường.
Hầu hết các ngành công nghiệp xử lý lượng lớn dữ liệu đều nhận thức rõ vai trò quan trọng của công nghệ học máy, giúp cải thiện hiệu quả vận hành và tạo ra lợi thế cạnh tranh so với đối thủ.
Các dịch vụ tài chính, bao gồm ngân hàng và doanh nghiệp trong lĩnh vực tài chính, ngày càng áp dụng công nghệ Machine Learning để đạt được hai mục đích chính: xác định thông tin quan trọng từ dữ liệu và ngăn chặn lừa đảo Công nghệ này giúp phát hiện các cơ hội đầu tư và thông báo cho nhà đầu tư về thời điểm giao dịch hợp lý Ngoài ra, data mining còn hỗ trợ trong việc nhận diện khách hàng có hồ sơ rủi ro cao và sử dụng giám sát mạng để phát hiện các tín hiệu lừa đảo một cách hiệu quả.
Chính phủ sở hữu nhiều nguồn dữ liệu từ các tổ chức an ninh cộng đồng và tiện ích xã hội, giúp khai thác insights quan trọng Việc phân tích dữ liệu cảm biến không chỉ nâng cao hiệu quả dịch vụ mà còn tiết kiệm chi phí Ngoài ra, công nghệ Machine Learning hỗ trợ phát hiện gian lận và giảm thiểu rủi ro trộm cắp danh tính.
Machine Learning đang trở thành một xu hướng phát triển nhanh chóng trong ngành chăm sóc sức khỏe, nhờ vào sự xuất hiện của các thiết bị đeo và cảm ứng có khả năng thu thập dữ liệu để đánh giá tình trạng sức khỏe bệnh nhân theo thời gian thực Công nghệ này không chỉ hỗ trợ các chuyên gia y tế trong việc phát hiện các xu hướng và tín hiệu quan trọng, mà còn nâng cao khả năng chẩn đoán và cải thiện phương pháp điều trị bệnh.
Kinh doanh hiện đại ngày nay ngày càng dựa vào Machine Learning để phân tích hành vi mua sắm của khách hàng Các trang web sử dụng công nghệ này để xem xét lịch sử mua hàng, từ đó đề xuất những sản phẩm mà khách hàng có thể quan tâm và yêu thích Khả năng thu thập, phân tích dữ liệu và cá nhân hóa trải nghiệm mua sắm không chỉ nâng cao sự hài lòng của khách hàng mà còn mở ra hướng đi mới cho các chiến dịch Marketing, đánh dấu tương lai tươi sáng cho ngành bán lẻ.
Ngành dầu khí đang tích cực tìm kiếm nguồn nguyên liệu mới và phân tích các mỏ dầu dưới đất Việc dự đoán tình trạng thất bại của bộ cảm biến lọc dầu cũng rất quan trọng Đồng thời, việc sắp xếp các kênh phân phối nhằm đạt hiệu quả và tiết kiệm chi phí là cần thiết Số lượng ứng dụng Machine Learning trong ngành công nghiệp này rất lớn và đang tiếp tục mở rộng.