使用强化学习的神经自适应比特率流
增强学习和神经网络用于提高视频流的比特率自适应性能,其性能比目前最先进的算法提高了13.1% - 25.0%。
客户端视频播放器采用比特率自适应算法,以满足用户不断增长的QoE要求。
这些ABR算法必须平衡多个QoE因素,如最大化视频比特率和最小化退稿时间。
尽管最近提出了大量的ABR算法,但最先进的方案仍然面临两个实际挑战:
(1)吞吐量预测是困难的,不准确的预测会导致性能下降;
(2)现有算法使用固定的启发式,这些启发式已根据部署环境的严格假设进行了微调,这种优化排除了跨网络条件和QoE目标的通用性。
为了克服这些挑战,开发了Pensieve系统,该系统完全使用Rein- forcement Learning (RL)生成ABR算法。
Pensieve使用RL训练一个神经网络模型,该模型根据客户端视频播放器收集的观察结果为未来的视频块选择比特率。
与现有的方法不同,冥想盆不依赖于预先编程的模型或对环境的假设。相反,它学习仅仅通过观察过去决策的结果表现来做出ABR决策。
因此,冥想盆可以自动学习适应广泛的环境条件和QoE指标的ABR算法。
我们将Pensieve与最先进的ABR算法进行比较,这些算法使用跟踪驱动和真实世界的实验,涵盖了各种网络条件、QoE度量和视频属性。
在所有考虑的情况下,冥想盆表现优于最好的最先进的方案,平均QoE的改善为13.1% -25.0%。
Pensieve的策略具有很好的通用性,甚至在未经过培训的网络上也优于现有的方案。
相关推荐
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。