DRL和IRS的结合(主要关注IRS怎么获取CSI)

Deep Reinforcement Learning for Intelligent Reflecting Surfaces: Towards Standalone Operation. Abdelrahman Taha et.al. 2020 IEEE 21st International Workshop on Signal Processing Advances in Wireless Communications (SPAWC), 26-29 May 2020 (pdf) (Citations 24)

Quick Overview

提出一种DRL(Deep Reinforcement Learning)的方法,不用额外的训练开销就可以获得接近Supervised Learning 和Perfect CSI的性能。而且这个方法不受其他基站控制,是standalone的。

示意图

值得注意的是,对于整个IRS,并不是全部无源的,而是部分有源,称为Active element,等同于对全部IRS CSI进行sample。

实验结果说明:

实验一

实验结果说明,虽然DRL需要更多的样本训练,但是DRL方案仅对每个训练片段使用一个Beam,而DL方案需要400个。

然后利用类似半监督-伪标记的方法,用DRL预测最优希望的波束,并把这些波束添加到训练集中

image-20220408102154327

同时,还可以看到,Ideal Rewarding 性能更加,即仅当可达速率等于期望值时,才给正向反馈,否则都是负向反馈。

具体内容

算法流程