[发明专利]基于语言模型的译码处理方法、装置、设备和介质在审
申请号: | 202210129816.9 | 申请日: | 2022-02-11 |
公开(公告)号: | CN114519346A | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 魏急波;赵海涛;张亦弛;曹阔;熊俊;张姣;张晓瀛 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 段盼姣 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语言 模型 译码 处理 方法 装置 设备 介质 | ||
1.一种基于语言模型的译码处理方法,其特征在于,包括步骤:
接收信道译码后的输入码字;
在码表中选取所述输入码字的合法码字;所述合法码字包括所述码表中与所述输入码字的码字距离小于设定阈值的所有码字;
对所有的所述合法码字均进行信源译码,得到相应的所有信源译码结果并作为所述输入码字的译码结果候选项;
根据各译码结果候选项的上下文间语义关联概率,计算得到各译码结果候选项的候选排列组合的共现概率;
将共现概率最大的所述候选排列组合确定为所述输入码字的语义译码输出结果。
2.根据权利要求1所述的基于语言模型的译码处理方法,其特征在于,各所述译码结果候选项的候选排列组合的上下文间语义关联概率的获取方式,包括利用词袋模型计算得到或利用基于长短时记忆的神经网络计算获得。
3.根据权利要求1或2所述的基于语言模型的译码处理方法,其特征在于,各所述译码结果候选项的候选排列组合的共现概率,通过如下模型计算得到:
其中,Pr(w1...wn)表示各所述译码结果候选项的候选排列组合的共现概率,wi表示序列第i个码字对应的译码结果候选项,n表示序列中码字的总数量,
4.根据权利要求1所述的基于语言模型的译码处理方法,其特征在于,利用状态压缩动态规划算法找到共现概率最大的所述候选排列组合。
5.一种基于语言模型的译码处理装置,其特征在于,包括:
码字接收模块,用于接收信道译码后的输入码字;
码字选取模块,用于在码表中选取所述输入码字的合法码字;所述合法码字包括所述码表中与所述输入码字的码字距离小于设定阈值的所有码字;
信源译码模块,用于对所有的所述合法码字均进行信源译码,得到相应的所有信源译码结果并作为所述输入码字的译码结果候选项;
概率计算模块,用于根根据各译码结果候选项的上下文间语义关联概率,计算得到各译码结果候选项的候选排列组合的共现概率;
输出确定模块,用于将共现概率最大的所述候选排列组合确定为所述输入码字的语义译码输出结果。
6.权利要求5所述的基于语言模型的译码处理装置,其特征在于,各所述译码结果候选项的候选排列组合的上下文间语义关联概率的获取方式,包括利用词袋模型计算得到或利用基于长短时记忆的神经网络计算获得。
7.权利要求5或6所述的基于语言模型的译码处理装置,其特征在于,各所述译码结果候选项的候选排列组合的共现概率,通过如下模型计算得到:
其中,Pr(w1...wn)表示各所述译码结果候选项的候选排列组合的共现概率,wi表示序列第i个码字对应的译码结果候选项,n表示序列中码字的总数量,
8.权利要求5所述的基于语言模型的译码处理装置,其特征在于,利用状态压缩动态规划算法找出共现概率最大的所述候选排列组合。
9.一种通信设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述基于语言模型的译码处理方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,计算机程序被处理器执行时实现权利要求1至4中任一项所述基于语言模型的译码处理方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210129816.9/1.html,转载请声明来源钻瓜专利网。