Trong các mạng ad-hoc không dây (Wahns), các nút di động thường bị giới hạn bởi nguồn năng lượng có hạn, khiến việc nạp tiền hoặc thay thế trở nên khó khăn Do đó, bảo tồn năng lượng là vấn đề quan trọng trong thiết kế mạng và đã thu hút sự chú ý của nhiều nhà nghiên cứu trong những năm gần đây Để đạt được hiệu quả năng lượng trong thiết kế giao thức MAC cho Wahns, chúng ta có thể điều chỉnh điện truyền tải và sử dụng đáp ứng tốc độ đa tỷ lệ, cho phép mạng tận dụng sự biến đổi của điều kiện kênh Tuy nhiên, việc này có thể dẫn đến giảm tỷ lệ truyền tải và hy sinh sự đa dạng thời gian Một giải pháp khả thi là chương trình truyền cơ hội, trong đó các gói tin được lên kế hoạch truyền tải khi điều kiện kênh thuận lợi, nhằm khai thác biến thể kênh để cải thiện hiệu suất mạng và tiết kiệm năng lượng.
Các kênh không dây hoạt động với chất lượng biến đổi theo thời gian do fading và nhiễu, điều này tạo ra nhiều thách thức trong thiết kế các chương trình truyền năng lượng hiệu quả Khi các kênh không dây gặp khó khăn, việc truyền tải có thể thất bại và gây lãng phí năng lượng Để khắc phục, người gửi có thể chờ đợi cho đến khi kênh cải thiện, nhưng điều này có thể làm giảm thông lượng và tăng độ trễ Do đó, việc thiết kế một chương trình truyền năng lượng hiệu quả cần phải cân nhắc giữa việc thích ứng với sự biến đổi của kênh và duy trì sự cân bằng giữa các yếu tố đối lập.
Trong những năm gần đây, đã có nhiều kỹ thuật được đề xuất nhằm nâng cao hiệu quả năng lượng trong mạng cảm biến không dây (Wahns) Một trong những kỹ thuật đáng chú ý là kỹ thuật thích ứng liên kết, được nghiên cứu và phân tích trong tài liệu [8].
Trong bài báo này, các tác giả đã đề xuất điều chỉnh khung kích thước trong truyền tải và khai thác bộ lọc Kalman mở rộng để dự đoán kích thước khung hình tối ưu Một chương trình truyền áp dụng multicast Request-to-Send (RTS) và ưu tiên Clear-to-Send (CTS) đã được phát triển nhằm ưu tiên thiết bị đầu cuối có kênh tốt Tốc độ truyền tải được tự động điều chỉnh dựa trên cường độ tín hiệu nhận được, với giao thức RBAR cho phép người nhận chọn tốc độ dữ liệu dựa trên tỷ lệ tín hiệu-to-noise (SNR) của gói RTS Các tác giả đã đề xuất một khuôn khổ lớp chéo để thiết kế chương trình truyền năng lượng hiệu quả, nhằm giảm thiểu tổng công suất phát và đảm bảo chất lượng dịch vụ (QoS) Một công thức chung cho tuổi thọ mạng đã được rút ra, dẫn đến việc đề xuất giao thức max-min để tối đa hóa tuổi thọ mạng bằng cách khai thác thông số của từng nút Việc thực hiện phân phối của giao thức max-min cho phép mỗi nút quyết định truyền tải dựa trên trạng thái kênh và năng lượng còn lại Các tác giả cũng đã phát triển mô hình mạng phai Rayleigh, ánh xạ kênh fading tới các thông số thiết kế cho mạng năng lượng hiệu quả Cuối cùng, các chiến lược truyền tối ưu trong kênh fading không dây đã được phát triển thông qua lập trình động, nhằm tối đa hóa thông lượng dữ liệu dự kiến dựa trên thông tin nhà nước kênh (CSI).
Trong nghiên cứu liên quan đến việc xây dựng MDP để thiết kế chiến lược truyền năng lượng hiệu quả cho Wahns, các tác giả đã phát triển phương pháp truyền tải điện tối ưu và sơ đồ điều chế nhằm tối đa hóa thông lượng hệ thống trong các giới hạn của truyền tải điện năng Vấn đề tối ưu hóa này được xây dựng dưới dạng MDP, và các kỹ thuật lập trình động được áp dụng để tìm ra các giải pháp khả thi Một nghiên cứu khác đã giải quyết việc tìm kiếm các mức điều chế tối ưu và phương pháp truyền điện để tối đa hóa thông lượng trung bình dài hạn với tổng tiêu thụ năng lượng Các tác giả cũng đã áp dụng MDP để tối ưu hóa vấn đề và tìm ra giải pháp gần đạt được thông qua các thuật toán học Một nghiên cứu khác sử dụng MDP để xác định chính sách tối ưu cho chiến lược truyền tải, trong đó cả việc truyền sức mạnh và khả năng của người dùng bị hạn chế đều được tối ưu hóa để tối đa hóa thông lượng hệ thống.
Các tác giả đã phát triển một khuôn khổ MDP để tối ưu hóa sức mạnh và khả năng truyền tải tại nguồn và nút chuyển tiếp, nhằm nâng cao thông lượng mạng trên mỗi đơn vị năng lượng tiêu thụ Họ cũng đã nghiên cứu sự chậm trễ nhạy cảm điện và kiểm soát ngưỡng truyền tải phân phối cho mạng Slotted ALOHA trong môi trường kênh fading không dây Trong bài báo này, thông tin địa phương về CSI, xếp hàng thông tin trạng thái, và phản hồi từ các điểm truy cập được áp dụng để thiết lập một chính sách tối ưu về chậm trễ, dựa trên các chính sách không nhớ trong mô hình K-agent với chân trời vô hạn, được xây dựng theo cấu trúc DEC-MDP.
Lý thuyết trò chơi đã trở thành công cụ quan trọng trong phân tích và thiết kế mạng không dây thế hệ mới, đặc biệt trong việc kiểm soát truy cập trung bình Nhiều nghiên cứu đã áp dụng lý thuyết này để phát triển các giao thức kiểm soát truy cập ngẫu nhiên cho mạng không dây với các kênh fading Ví dụ, một nghiên cứu đã trình bày cách tiếp cận lý thuyết trò chơi cho việc thiết kế kiểm soát truy cập trong rãnh ALOHA CSMA, trong đó các cơ hội truyền được mô hình hóa như các trò chơi Bayes với các ngưỡng truyền là trạng thái cân bằng Nash Bayesian Hơn nữa, một nghiên cứu khác đã xây dựng một trò chơi truy cập kênh cho chiến lược truyền, chứng minh sự tồn tại của cân bằng Nash Bayesian trong bối cảnh can thiệp giữa các cụm.
Trong nghiên cứu [24], các vấn đề liên quan đến việc tìm kiếm chính sách truyền cho từng nút trong mạng ALOHA đã được xây dựng, với các bản đồ trạng thái kênh thông tin nhằm tối đa hóa tiện ích cá nhân như một trò chơi không hợp tác Các điều kiện tồn tại của chính sách truyền ngưỡng cân bằng Nash đã được xác định, và một thuật toán ngẫu nhiên dựa trên độ dốc đã được áp dụng để xử lý phản ứng tốt nhất trong quá trình động của các trò chơi truyền Bài viết [25] mô hình hóa lý thuyết trò chơi khai thác thông tin trạng thái kênh từ mỗi người dùng để quyết định về việc truyền gói trong mạng ALOHA rãnh trong môi trường mờ dần Trong mô hình này, mỗi người dùng thiết lập ngưỡng kênh và chỉ gửi một gói khi kênh vượt qua ngưỡng, nhằm tối đa hóa lợi ích ròng, tính bằng tiện ích trừ đi năng lượng tiêu thụ.
Trong nghiên cứu này, chúng tôi đã nỗ lực thiết kế và khảo sát một dự án truyền thông hiệu quả năng lượng cho giao thức MAC, nhằm tối ưu hóa hoạt động của Wahns trong môi trường hạn chế năng lượng.
Báo cáo này bắt đầu bằng việc mô tả ngắn gọn các mô hình cơ bản trong Chương 2, trong đó sử dụng mô hình kênh Markov hữu hạn trạng thái (FSMC) để nắm bắt hành vi thời gian thay đổi của kênh fading không dây Ngoài ra, chúng tôi cũng giới thiệu giao thức MAC liên quan đến chiến lược truyền gói đề xuất.
Trong chương 3, chúng tôi trình bày thiết kế và phân tích các cơ hội truyền sơ đồ dưới kích thước bộ đệm hạn chế Sử dụng MDP để kiểm tra ngưỡng tối ưu cho việc truyền thành công, chúng tôi tiến hành các thí nghiệm nhằm phân tích hành vi của các chương trình BDT trong các điều kiện mạng khác nhau, bao gồm cường độ giao thông, hạn chế kích thước bộ đệm và tốc độ kênh.
Chương 4 nghiên cứu các hành vi của chiến lược truyền cơ hội (OTS) trong bối cảnh thời gian khác nhau của kênh không dây và các ứng dụng nhạy cảm với độ trễ Các hành vi này được phân tích với sự chú ý đến việc hạn chế xây dựng để tối ưu hóa hiệu suất truyền tải.
10 phí đi đôi ngẫu nhiên trò chơi dựa trên quyết định Markov quá trình để có được những chính sách truyền tối ưu
Cuối cùng, chúng tôi tóm tắt các công việc ban đầu trong Chương 5.
2.1 Mô hình kênh Makov trạng thái hữu hạn
Chúng tôi mô hình hóa kênh fading Rayleigh bằng cách sử dụng mô hình Markov K-nhà nước, trong đó giá trị SNR nhận được được phân chia thành K quốc gia Đối với kênh fading Rayleigh, SNR tức thời nhận (y) tuân theo phân phối cấp số nhân với hàm mật độ xác suất, trong đó ρ = E[y] Các ngưỡng SNR nhận được được ký hiệu là yk, với 0 = y0 < y1 < y2 < < yk = ∞ Tại mỗi khe thời gian i, kênh được quan sát ở trạng thái gi = k, với 0 ≤ k.
Trong mô hình FSMC, quá trình chuyển đổi xảy ra tại ranh giới của khe thời gian khi một khung cố định kích thước được phát đi, với các chuyển đổi chỉ diễn ra giữa các quốc gia lân cận Mức tăng kênh được coi là hằng số trong một khe thời gian truyền tải Các thông số của kênh Markovian có thể được xác định dựa trên các kết quả từ tài liệu [27] Chúng tôi ký hiệu N(y) là tỷ lệ vượt mức.
Hình 2 1: Mô hình kênh Makov trạng thái hữu hạn
Tần số Doppler fm của kênh ảnh hưởng đến xác suất chuyển trạng thái, trong đó Tf là thời gian truyền khung và πk là xác suất trạng thái ổn định Đối với BPSK, xác suất lỗi symbol Pb (gk) cho trạng thái gk được xác định bởi hàm phân phối tích lũy (CDF) của biến ngẫu nhiên chuẩn.
Trong suốt bài này thống kê lỗi theo các trường hợp BPSK như công thức ở trên
Trong môi trường mô phỏng, chúng tôi thiết lập các mô hình FSMC trên giao thức IEEE 802.11 MAC (đại lý MAC) trong ns-2 Các thông số kênh như SNR trung bình và tần số Doppler được sử dụng để tính xác suất truyền tải và BER trung bình cho mỗi tiểu bang, theo các phương trình đã định nghĩa, và lưu trữ trong bảng trạng thái Mỗi đại lý MAC duy trì một bảng gọi là Link State, liệt kê trạng thái kênh hiện tại của từng liên kết tới các láng giềng Các trạng thái kênh trong bảng được khởi tạo ngẫu nhiên tại các khe thời gian 0 và được cập nhật theo xác suất chuyển trạng thái ở đầu mỗi khe thời gian Khi khung được tiếp nhận từ một liên kết chỉ định, BER tương ứng với trạng thái hiện tại của liên kết sẽ được sử dụng để tính toán xác suất lỗi khung.
Trong một mạng ad-hoc với N nút di động, các nút sử dụng giao thức MAC để truy cập kênh chung, trong đó thời gian được chia thành các khe thời gian dài Tf giây Khi có gói tin cần gửi, các nút di động có thể chọn giữa việc truyền ngay lập tức hoặc trì hoãn việc truyền, tùy thuộc vào thông tin chất lượng kênh (CSI) mà chúng có Để đánh giá chất lượng kênh không dây, các nút di động sử dụng khung kiểm soát gọi là khung Pilot và khung Response Khi nhận được khung Pilot từ người gửi, các nút sẽ đo lường chất lượng kênh dựa trên tỷ lệ tín hiệu trên nhiễu (SNR) và thông tin này sẽ được gửi lại trong khung Response cho người gửi.
Hình 2 2: Đo lường kênh và hồi tiếp thông qua trao đổi các frame điều khiển
Trong một mạng ad-hoc với N nút di động, các nút này sử dụng giao thức MAC rãnh để truy cập vào kênh chung, trong đó thời gian được chia thành các khe thời gian dài Tf giây Khi có gói tin cần gửi, các nút di động có thể chọn giữa hai hành động: truyền ngay hoặc trì hoãn việc truyền, dựa trên thông tin CSI địa phương Để đánh giá chất lượng kênh không dây, các nút di động sử dụng khung kiểm soát gọi là khung thí điểm và khung phản hồi Khi nhận được khung thí điểm từ người gửi, các nút sẽ đo lường chất lượng kênh thông qua tỷ lệ tín hiệu trên nhiễu (SNR) và thông tin này sẽ được gửi lại cho người gửi trong khung phản hồi.
2.3 Xử lý quyết định Markov
MDP (Mô hình quyết định Markov) là công cụ quan trọng trong việc xây dựng mô hình và giải quyết các vấn đề ra quyết định năng động theo thời gian dưới sự không chắc chắn Được giới thiệu lần đầu vào năm 1960, MDP đã trở thành một phương pháp hiệu quả trong lĩnh vực này.
[29] và đã được quan tâm trong một thời gian dài và đến nay có rất nhiều công trình ở
Có ba loại MDP: MDP rời rạc thời gian, MDP liên tục thời gian và bán MDP Trong bài viết này, chúng tôi chỉ tập trung vào MDP rời rạc thời gian, trong đó S đại diện cho hệ thống nhà nước và quan sát tại các khoảng thời gian rời rạc, được gọi là kỷ nguyên quyết định n = 0, 1, 2, Khi hệ thống ở trạng thái i ∈ S, nó cần chọn một hành động từ tập hợp các hành động A(i) liên quan đến các tiêu chí V Sau khi lựa chọn hành động, hệ thống sẽ nhận phần thưởng r(i, a) và chuyển sang trạng thái j ở các giai đoạn tiếp theo với xác suất chuyển pij(a).
Hình 2 3: Kênh đo lường sử dụng các frame RTS/CTS trong IEEE 801.11
Chúng tôi cũng cho rằng không gian trạng thái S là hữu hạn và tất cả các hành động đặt
A là một tập hợp đếm được, với A = i∈SA đại diện cho sự kết hợp của tất cả các bộ chức năng Nguyên tắc ra quyết định xác định quy trình lựa chọn hành động trong mỗi trạng thái tại một điểm quyết định cụ thể Quyết định này có thể được xác định bởi một chức năng quyết định d: S → A, với d thỏa mãn (i) ∈ A (i) cho trạng thái i ∈ S Khi hệ thống ở trạng thái i, hành động d(i) sẽ được lựa chọn D là tập hợp tất cả các chức năng quyết định.
Một chính sách hoặc chiến lược xác định các quy tắc quyết định sẽ được áp dụng trong mọi giai đoạn quyết định, đóng vai trò là nguyên tắc lựa chọn hành động trong tương lai của hệ thống nhà nước hoặc lịch sử Tập hợp các cặp có thể có của nhà nước và hành động ở mỗi thời kỳ được biểu thị bởi Γ {(i, a) | i ∈ S, a ∈ A (i)} Lịch sử đến n được ký hiệu là hn = (s1, a1, , sn-1, an-1, sn) và được xác định đệ quy là hn = (hn-1, an-1, sn) Tập hợp tất cả các lịch sử được biểu thị bởi Hn, với H0 = S và Hn = Hn-1 × A × S Một chính sách π = (π0, π1, ) ∈ Π được xác định, trong đó πn (| hn) là phân bố xác suất trên A (in) cho bất kỳ n ≥ 0 và lịch sử hn Nếu πn (| hn) = πn (| in) cho mọi n, thì π được gọi là chính sách Markov.
Chính sách π Markov được phân loại thành chính sách cố định hoặc chính sách tinh khiết khi điều kiện πn (| In) = π0 (| In) được thỏa mãn Điều này có nghĩa là tồn tại một dn ∈ D sao cho πn (dn (i) | i) = 1 cho mọi n và cho tất cả các giá trị i.
Chính sách văn phòng phẩm được biểu diễn dưới dạng π = (d, d, ), hay còn gọi là d∞ Các chính sách này đóng vai trò quan trọng trong việc phát triển lý thuyết về vô hạn chân trời trong MDP.
2.3.2 Các qui luật dừng tối ưu
Tại thời điểm kỷ nguyên n ≥ 0, hệ thống thực hiện một hành động dựa trên trạng thái xn theo chính sách π và nhận phần thưởng r (xn, an) Kỳ vọng của các quá trình ngẫu nhiên {xn, an, r (xn, an)} dưới chính sách π và trạng thái ban đầu i được biểu thị bằng Eπ, i Để đánh giá chính sách, chúng tôi áp dụng các tiêu chí dựa trên kỳ vọng Eπ, i, bao gồm hai tiêu chí chính: tổng dự kiến giảm giá của phần thưởng và trung bình dự kiến của phần thưởng.
Việc giảm giá dự kiến tổng số tiêu chí khen thưởng những chân trời vô hạn được định nghĩa là sau
Quá trình quyết định Markov, trong đó β là yếu tố giảm giá, với β nằm trong khoảng [0, 1), đảm bảo sự hội tụ của tổng các kỳ vọng Chúng tôi xác định các chức năng tối ưu giá trị để tối ưu hóa quyết định trong quá trình này.
Một chính sách π * được coi là tối ưu khi nó tối đa hóa giá trị cho từng trạng thái ban đầu Chính sách này có thể được phát sinh từ các nguyên tắc và phương pháp tối ưu hóa phù hợp.
Mặt khác, trung bình dự kiến tiêu chí khen thưởng những chân trời vô hạn là thể hiện như sau:
Tương tự như vậy, các chức năng giá trị tối ưu có thể được xác định bởi
Một chính sách π * cũng được gọi là tối ưu nếu nó tối đa hóa giá trị cho mỗi trạng thái ban đầu và có thể thu được như sau
TRUYỀN DẪN VỚI KÍCH THƯỚC BỘ ĐỆM GIỚI HẠN
Chiến lược truyền cơ hội cho Wahns được thảo luận trong chương trước chỉ xem xét các mô hình mạng với kích thước bộ đệm hạn chế của một frame Do đó, bất kỳ khung đến mới nào đều gây cản trở cho khung hiện tại Trong chương này, chúng tôi tập trung vào các mạng mô hình cho ứng dụng không nhạy cảm với độ trễ, nơi các nút sử dụng bộ đệm để lưu trữ một số lượng khung nhất định và chỉ thả khung khi bộ đệm vượt quá kích thước cho phép Trong bối cảnh này, cần xem xét ảnh hưởng của giao thông, điều kiện kênh, và chế độ đệm tại mỗi nút trước khi đưa ra quyết định về truyền dẫn tối ưu.
Chương này trình bày thiết kế và phân tích cơ hội truyền sơ đồ dưới điều kiện kích thước bộ đệm hạn chế cho Wahns hoạt động trong các kênh không dây khác nhau Đóng góp chính của nghiên cứu bao gồm việc sử dụng MDP để xây dựng mô hình các chương trình BDT, trong đó mỗi node sử dụng bộ đệm hạn chế để duy trì khung khi truyền dữ liệu chậm Ngưỡng truyền tối ưu được xác định dựa trên thông tin địa phương của người gửi và chất lượng liên kết giữa người gửi và nhận Đồng thời, chúng tôi thực hiện thí nghiệm để phân tích hành vi của các chương trình BDT trong các điều kiện mạng khác nhau, như cường độ giao thông và tốc độ kênh Kết quả từ các mô phỏng cho thấy rằng kế hoạch BDT cải thiện đáng kể hiệu quả năng lượng so với IEEE 802.11, đồng thời đạt được thông lượng tương đương.
Chương này được cấu trúc như sau: Trong phần 3.2, chúng tôi sẽ trình bày mô hình hệ thống cùng với các giả định sẽ được áp dụng trong các dẫn xuất tối ưu.
Trong phần 3.3, chúng tôi xây dựng MDP cho các cơ hội chương trình truyền với kích thước bộ đệm hạn chế Kết quả số và các kết quả mô phỏng được trình bày trong phần 3.4 Cuối cùng, phần 3.5 cung cấp một thảo luận về các kết luận.
Trong một mạng WAHN, mỗi node sử dụng giao thức MAC rãnh để truy cập kênh chung, với thời gian được chia thành các khe bằng nhau dài Tf giây Thời gian của khe đủ dài để chứa cả khung điều khiển và khung dữ liệu Khi có gói tin cần gửi, các node sẽ thực hiện một trong hai hành động: truyền hoặc trì hoãn, tùy thuộc vào CSI địa phương mà chúng thu được thông qua giao thức khung kiểm soát (CFE), bao gồm khung Pilot và khung Response.
Chúng tôi mô hình hóa các kênh fading Rayleigh theo thời gian như một kênh Markov với K trạng thái, trong đó giá trị SNR nhận được được phân chia thành K quốc gia Biểu thức yk đại diện cho ngưỡng của SNR nhận được, với điều kiện 0 = y0 < y1 < y2.
Tại mỗi khe thời gian i, kênh được quan sát ở trạng thái gi = k, với 0 ≤ k < K, nếu SNR nằm trong khoảng [yk, yk + 1) Chúng tôi giả định rằng sự chuyển tiếp giữa các tiểu bang trong mô hình FSMC xảy ra tại ranh giới của khe thời gian, nơi một khung cố định được truyền, và quá trình chuyển đổi chỉ diễn ra giữa các quốc gia lân cận Mức tăng kênh được coi là hằng số trong một khe thời gian truyền Đối với mô hình này, quá trình chuyển đổi xác suất giữa các quốc gia và tỷ lệ lỗi bit tại mỗi tiểu bang của FSMC có thể được lấy từ nghiên cứu trong tài liệu [27].
Hình 3 1: Mô hình kênh Markov K trạng thái
Hình 3 2: Mô hình truyền với hồi tiếp CSI
Trong nghiên cứu này, chúng tôi tập trung vào các đèn giao thông, nơi các khung được gửi đến tại mỗi khe thời gian theo phân phối Bernoulli với tham số α Chúng tôi giả định rằng kết quả truyền dẫn có sẵn ngay lập tức sau mỗi lần truyền Trong mô hình mạng, mỗi node được giả định sử dụng một bộ đệm có kích thước giới hạn B để lưu trữ các khung hình khi quá trình truyền tải bị hoãn.
"xấu" của kênh như hình 3.2
3.3.1 Các trạng thái hệ thống
Chúng tôi chỉ tập hợp tất cả các tiểu bang của hệ thống theo quan sát của S, tạo thành một tập hợp hữu hạn Mỗi phần tử trong S bao gồm một trạng thái của nút và một trạng thái của kênh Các trạng thái của hệ thống tại thời điểm t được trình bày như sau:
Trong bài viết này, chúng ta sẽ khám phá trạng thái kênh tại khe thời gian i, ký hiệu là gi, với điều kiện 0 ≤ gi < K Đồng thời, ti đại diện cho trạng thái của nút tại khe thời gian i Các trạng thái có thể có của các nút bao gồm quốc gia đệm Idle và 2B.
B đại diện cho kích thước bộ đệm, với các thiết lập trạng thái được chia thành hai tập con tùy thuộc vào tình trạng của CFE Fj, Sj (j = 1, 2, , B) lần lượt biểu thị độ chờ, tình trạng bộ đệm không thành công và tình trạng bộ đệm thành công của CFE Các nút được coi là ở trạng thái thứ j của bộ đệm (ký hiệu là Fj hoặc Sj) khi có một số khung j trong bộ đệm, và chúng ở trạng thái nhàn rỗi khi không có khung nào hiện diện.
Chúng tôi xác định tập hợp tất cả các cặp trạng thái hành động khả thi tại khe thời gian t, được biểu thị bằng ký hiệu Θ.
Hình 3 3: Sơ đồ trạn thái của hệ thống BDT
Xác suất chuyển đổi của hệ thống được biểu diễn bởi Pr [si + 1 | si, ai], với điều kiện Pr [si + 1 | si, ai] ≥ 0 cho mọi (si, ai) ∈ Θ Đây là xác suất mà hệ thống sẽ chuyển từ trạng thái si tại thời điểm khe i sang trạng thái si + 1 tại khe thời gian i + 1, sau khi thực hiện hành động kiểm soát ai Pr [si + 1 | si, ai] có thể được phân tách thành hai phần: P g (gi, gi + 1), xác suất chuyển đổi giữa các kênh gi và gi + 1 mà không phụ thuộc vào hành động kiểm soát, và Pt (ti, ti + 1, ai), xác suất chuyển đổi từ trạng thái nút ti sang ti + 1 dưới tác động của hành động kiểm soát ai Hình 3.3 minh họa quá trình chuyển tiếp giữa các trạng thái nút khi thực hiện một trong hai hành động kiểm soát: Truyền hoặc trì hoãn.
Xác suất chuyển đổi của nhà nước node, Pt (ti, ti + 1, a), được xác định dựa trên trạng thái nhàn rỗi của nút khi nhận khung mới, có thể ở hai trạng thái S1 hoặc F1, tùy thuộc vào kết quả truyền khung kiểm soát Đối với các trường hợp liên quan đến CFE thất bại, chỉ có hành động Trì hoãn là khả thi Xác suất chuyển đổi của các quốc gia liên quan đến nút phụ thuộc vào ba yếu tố: sự xuất hiện của khung mới, kết quả truyền tải khung điều khiển và trạng thái hiện tại của bộ đệm.
Khi nút được quan sát trong trạng thái Sj (j = 1, 2, , B) tại khe thời gian t, nó có thể thực hiện một trong hai hành động: Trì hoãn hoặc Truyền tải, tùy thuộc vào giá trị hiện tại của CSI Do đó, xác suất chuyển không chỉ phụ thuộc vào ba yếu tố đã đề cập mà còn vào kết quả của việc truyền khung.
Chúng tôi tập trung vào việc phân tích toán học của chiến lược truyền cơ hội (OTS) với ràng buộc chậm trễ trong bối cảnh kênh không dây và các yếu tố chậm trễ nhạy cảm với thời gian Trước khi gửi gói tin, người gửi quyết định có nên truyền ngay hay trì hoãn dựa trên trạng thái kênh, nhằm giảm thiểu tiêu thụ năng lượng trong điều kiện bộ đệm hạn chế Các hành vi trong OTS được xây dựng dựa trên mô hình trò chơi ngẫu nhiên kết hợp với quá trình ra quyết định Markov để tối ưu hóa chính sách truyền tải.
Trong một mạng ad hoc với N nút di động sử dụng giao thức MAC rãnh, thời gian được chia thành các khe thời gian Tf, với tất cả các nút được đồng bộ hóa Khi có gói tin chờ gửi, các nút sẽ thực hiện một trong hai hành động: Truyền hoặc Trì hoãn, dựa trên thông tin trạng thái kênh địa phương (CSI) có sẵn ở đầu mỗi khe thời gian Các khe thời gian được giả định ngắn và tải giao thông nhẹ, với các gói đến mỗi khe theo phân phối Bernoulli với tham số qa Kết quả từ các đóng góp giao thông được cập nhật ngay lập tức vào cuối mỗi khe thời gian Mô hình kênh Markov trạng thái hữu hạn (FSMC) được sử dụng để mô tả hành vi thời gian của kênh không dây.
4.3 Hạn chế lý thuyết trò chơi ngẫu nhiên
Trong mô hình này, chúng ta phân tích một mạng với khả năng lưu trữ bộ đệm tại mỗi nút cho các ứng dụng yêu cầu dữ liệu mới nhất Khi một khung mới đến, khung hiện có trong bộ đệm sẽ bị thay thế, dẫn đến độ trễ Độ nhạy của giao thông được mô hình hóa qua thời gian tồn tại D của mỗi khung Điều này có nghĩa rằng nếu một khung nằm trong bộ đệm lâu hơn D, nó sẽ bị loại bỏ Các trạng thái của nút i tại thời điểm t được ký hiệu, trong đó gi đại diện cho trạng thái kênh và ni là trạng thái của nút di động Các trạng thái của nút di động có thể bao gồm Idle và (D + 1) Trì hoãn, với D là thời gian tồn tại của khung.
Biểu thị độ chờ (D) và độ trễ (D + 1) tương ứng, các nút di động ở trạng thái thứ k Delay (ký hiệu Dk) khi một khung bị trì hoãn bởi các khe thời gian k, và ở trạng thái nhàn rỗi khi không có khung nào hiện tại Ai (xi) là tập hợp tất cả các hành động điều khiển cho máy nghe nhạc i trong trạng thái xi, trong đó ai là hành động kiểm soát được thực hiện ở khe thời gian i.
Mỗi hành động trong A (xi) tương ứng với các giá trị sau:
Hãy để Pn (ni, ni + 1, a) biểu thị xác suất chuyển đổi trạng thái của điện thoại di động từ ni sang ni + 1 dưới tác động của một hành động kiểm soát a trong các sơ đồ trạng thái như đã trình bày trong Vả 4.1 Khi trạng thái hệ thống là gi, ni và một hành động kiểm soát ai, xác suất chuyển đổi sang trạng thái xi + 1 = gi + 1, ni + 1 trong khe thời gian tiếp theo được xác định như sau:
35 nơi P g (gi, gi + 1) là xác suất chuyển từ kênh gi bang để gi + 1 và xác suất chuyển trạng thái nút Pn (ni, ni + 1, a) được cho bởi
Các chiến lược được lựa chọn bởi tất cả các nút di động xác định chi phí cho mỗi nút di động Theo hệ thống bang xt = (xt1, xt2, , xtN) và các hoạt động kiểm soát tại = (tại1, tại2, , tạiN) của tất cả các nút di động tại thời điểm t, chi phí cho mỗi nút di động được xác định dựa trên các yếu tố này.
Mô hình trạng thái của hệ thống truyền với kênh truyền giới hạn cho thấy tiêu thụ năng lượng trên mỗi khung (Ec) và tầm quan trọng tương đối của khung va chạm và lỗi khung kênh qua yếu tố δ (0 ≤ δ ≤ 1) Tỷ lệ lỗi khung Pf(gi) phụ thuộc vào trạng thái kênh gi, với giả định rằng các bit lỗi độc lập Tỷ lệ lỗi khung này được xác định dựa trên kích thước khung L và mô hình kênh Pb(gi) Để tiết kiệm năng lượng, các nút có thể trì hoãn việc truyền dẫn khi có lỗi tràn bộ đệm có thể chấp nhận Lỗi tràn bộ đệm của nút i được xác định bởi trạng thái XTI và hành động ati.
Trong bài viết này, chúng ta xem xét 37 nơi (0 ≤ k < D) và định nghĩa ui(ai, |xi) là xác suất mà các nút di động sẽ hành động khi ở trong trạng thái xi Hơn nữa, βi đại diện cho phân bố xác suất của trạng thái ban đầu xt = 0i Cuối cùng, chúng ta cũng đề cập đến khái niệm về dự kiến trung bình hạn chế tràn bộ nhớ đệm.
Chúng tôi xác định vectơ u = (u1, u2, , uN) và β = (β1, β2, , βN) là tập hợp các chiến lược và phân bố xác suất trạng thái ban đầu cho tất cả các nút di động Chi phí trung bình cho mỗi giai đoạn của mỗi nút di động được định nghĩa rõ ràng.
Mục tiêu của mỗi nút là để tìm ui chiến lược tối ưu để giảm thiểu (4.7) chịu (4.6)
Các thiết lập tối ưu cho máy nghe nhạc i có thể đạt được thông qua các chương trình tuyến tính, như đã được định nghĩa trong tài liệu [37].
LP (i: u): Tìm z * i: = {z * i (x, a)} x, một nơi (x, a) ∈ Ki, nhằm tối đa hóa
Bảng 4 1: Các thông số được dùng để tính toán và mô phỏng
Trong bài viết này, chúng tôi phân tích các đặc điểm của chương trình OTS và cách nó đại diện cho chương trình truyền cơ hội trong các điều kiện khác nhau Chúng tôi đã thực hiện nhiều thí nghiệm số để điều tra các đặc điểm của chương trình OTS, với Bảng 4.1 tóm tắt các giá trị của các thông số khác nhau Hình 4.2 cho thấy tác động của các kênh khác nhau lên ngưỡng truyền tối ưu mà không có khó khăn về độ trễ, với các trạng thái kênh được phân chia thành ba bộ: B, M và G Bộ B chứa các trạng thái kém, nơi truyền luôn bị trì hoãn, trong khi bộ M bao gồm các trạng thái cho phép truyền với xác suất tối ưu và ngưỡng truyền tối ưu Hình 4.3 trình bày tác động của sự thay đổi kênh lên ngưỡng truyền tối ưu trong bối cảnh có hạn chế về độ trễ Khi hạn chế độ trễ (D) trở nên thoải mái hơn, chiến lược truyền tối ưu sẽ dẫn đến ngưỡng truyền cao hơn, cho thấy sự tương quan giữa ngưỡng trì hoãn và ngưỡng truyền.
Ngưỡng tối ưu trong truyền dẫn với độ trễ cao cho thấy rằng kênh truyền tải cần phải được cải thiện để giảm chi phí thất bại, đặc biệt khi đối mặt với các kênh fading thay đổi nhanh chóng Sự nhạy cảm với độ trễ trong truyền tải làm nổi bật tầm quan trọng của việc tối ưu hóa kênh để đảm bảo hiệu suất tốt hơn.
Chúng tôi đã nghiên cứu các chi phí ngẫu nhiên liên quan đến trò chơi hạn chế để phân tích các đặc điểm của chương trình OTS, một chiến lược truyền cơ hội cho các mạng không dây hoạt động trên các kênh thời gian khác nhau Qua nhiều thí nghiệm, chúng tôi đã quan sát và phân tích hành vi của chương trình OTS trong bối cảnh ứng dụng nhạy cảm với độ trễ Chúng tôi đã phát triển một chính sách truyền tối ưu cho chương trình OTS, trong đó các nút di động chỉ tiến hành truyền khi chất lượng kênh đạt ngưỡng tối ưu, nhằm giảm thiểu lãng phí năng lượng do các lần truyền không thành công.
Hình 4 3 : Ngưỡng tối ưu đối với trạng thái kênh có độ trễ giới hạn