[发明专利]面向交互视频传输质量提升的混合学习方法、装置及设备有效

申请号：	202010954328.2	申请日：	2020-09-11
公开（公告）号：	CN112367490B	公开（公告）日：	2021-05-25
发明（设计）人：	张欢欢;周安福;张新宇;马华东	申请（专利权）人：	北京邮电大学
主分类号：	H04N7/14	分类号：	H04N7/14;H04N21/647
代理公司：	北京柏杉松知识产权代理事务所(普通合伙) 11413	代理人：	马敬;项京
地址：	100876 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	面向交互视频传输质量提升混合学习方法装置设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种面向交互视频传输质量提升的混合学习方法，其特征在于，所述方法包括：

针对视频通话的当前传输时隙，获取上一传输时隙的传输参数及包间延迟序列，其中，所述包间延迟序列为所述当前传输时隙之前接收端所接收到的预设数量的数据包中相邻数据包之间的包间延迟对应的序列；

将所述上一传输时隙的传输参数输入码率预测模型，确定所述当前传输时隙的备选传输码率，作为第一备选传输码率，其中，所述码率预测模型为基于各个传输时隙对应的奖励函数值调整模型参数得到的强化学习模型，所述每个传输时隙对应的奖励函数值为根据该传输时隙的传输参数及其对应的预设权重确定的，所述码率预测模型包括传输参数与备选传输码率之间的对应关系；

根据公式计算所述当前传输时隙对应的网络状态标识值D(t_i)；其中，T为所述预设数量，T∈N+，i∈(1，2，...T-1)，Δd(t_T-i)为所述包间延迟序列中按照时间由早到晚的顺序的第T-i个包间延迟；

根据公式γ(t_i)＝γ(t_i-1)+k_γ×(|D(t_i)|-γ(t_i-1))，计算所述当前传输时隙对应的网络状态阈值γ(t_i)；其中，γ(t_i-1)为所述上一传输时隙对应的网络状态阈值，k_γ为预设的阈值权重系数，D(t_i)为所述当前传输时隙对应的网络状态标识值，所述网络状态阈值的初始值为基于历史通话的包间延迟确定的；

如果所述网络状态标识值不大于所述当前传输时隙对应的网络状态阈值，基于所述第一备选传输码率向接收端发送数据包；

如果所述网络状态标识值大于所述当前传输时隙对应的网络状态阈值，基于预设的传输码率调整规则、所述上一传输时隙的传输码率及所述上一传输时隙的传输参数，确定所述当前传输时隙的备选传输码率，作为第二备选传输码率，并基于所述第二备选传输码率向接收端发送数据包，其中，所述传输码率调整规则为降低传输码率的规则。

2.根据权利要求1所述的方法，其特征在于，在所述基于所述第一备选传输码率向接收端发送数据包的步骤之后，所述方法还包括：

获取所述当前传输时隙的传输参数，作为目标传输参数；

基于所述目标传输参数包括的参数及其对应的预设权重，确定所述当前传输时隙的奖励函数值，作为第一奖励函数值；

基于所述第一奖励函数值调整所述码率预测模型的参数。

3.根据权利要求1所述的方法，其特征在于，在所述基于所述第二备选传输码率向接收端发送数据包的步骤之后，所述方法还包括：

获取所述当前传输时隙的传输参数，作为目标传输参数；

基于所述目标传输参数包括的第一类参数及其对应的预设权重，以及第二类参数及其对应的预设权重和第一调整系数，确定所述当前传输时隙的奖励函数值，作为第二奖励函数值，其中，第二类参数为包间延迟；

基于所述第二奖励函数值调整所述码率预测模型的参数。

4.根据权利要求2或3所述的方法，其特征在于，所述传输参数还包括码率差异，所述码率差异为预测的传输码率与实际发送码率之间的差异；

在所述确定所述当前传输时隙的奖励函数值的步骤之后，所述方法还包括：