Summary

针对集中式认知网络的信道和功率分配问题,提出了一种基于案例推理和启发式Q学习算法。为了提高Q学习算法的收敛速度,将当前分配问题与存储的历史案例进行相似度匹配,选取最相似案例的Q值,归一化处理后作为启发式Q学习算法的初值。为了提高启发式Q学习的算法性能,引入一个基于信息强度的指导函数,通过强调动作的重要性来改变动作策略;设计的奖赏函数反映了认知系统的能量效率。仿真结果表明,该算法可以明显提高认知网络信道和功率分配的认知系统能量效率和收敛速度。

  • Institution
    杭州电子科技大学

Full-Text