[发明专利]基于多个预测模型的标点符号预测方法及相关设备有效
申请号: | 201910515571.1 | 申请日: | 2019-06-14 |
公开(公告)号: | CN110413987B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 李秀丰 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06N3/0464 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 高茹 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 预测 模型 标点符号 方法 相关 设备 | ||
1.一种基于多个预测模型的标点符号预测方法,其特征在于,包括以下步骤:
构建第一标点符号预测模型、第二标点符号预测模型及第三标点符号预测模型,并分别为所述第一标点符号预测模型、第二标点符号预测模型及第三标点符号预测模型预先配置预测概率权重,其中,所述第一标点符号预测模型为双向递归神经网络模型,所述第二标点符号预测模型为语音停顿标点符号预测模型,所述第三标点符号预测模型为关键词匹配标点符号预测模型;
获取待预测文本,将所述待预测文本输入所述第一标点符号预测模型,基于双向递归神经网络模型中联系所述待预测文本的前后文信息进行标点符号的预测,获取所述第一标点符号预测模型的预测结果;
将所述待预测文本输入所述第二标点符号预测模型,基于关键词匹配标点符号预测模型中对所述待预测文本的关键词词频进行标点符号的预测,获取所述第二标点符号预测模型的预测结果;
将所述待预测文本输入所述第三标点符号预测模型,基于关键词匹配标点符号预测模型中对所述待预测文本的关键词词频进行标点符号的预测,获取所述第三标点符号预测模型的预测结果;
根据所述第一标点符号预测模型、第二标点符号预测模型及第三标点符号预测模型的预测结果及预测概率权重进行所述待预测文本的标点符号的预测。
2.如权利要求1所述的基于多个预测模型的标点符号预测方法,其特征在于,所述构建第一标点符号预测模型、第二标点符号预测模型及第三标点符号预测模型,包括:
构建双向递归神经网络标点符号预测模型、语音停顿标点符号预测模型及关键词匹配标点符号预测模型,并在所述双向递归神经网络标点符号预测模型中创建注意力层,所述注意力层的注意力机制满足公式:
其中,αij=softmax(vaTtanh(Wasi-1+Uahj)),vaT为注意力矩阵,Wa为过往时刻的隐含层激活矩阵,si-1为过往时刻的隐含层激活的输出,Ua为当前时刻的隐含层输出矩阵,hj为当前时刻的隐含层输出,αij为注意力层的激活的输出,ci为经过注意力机制的输出层输出。
3.如权利要求2所述的基于多个预测模型的标点符号预测方法,其特征在于,所述将所述待预测文本输入所述第一标点符号预测模型,获取所述第一标点符号预测模型的预测结果,包括:
将所述待预测文本输入双向递归神经网络标点符号预测模型,获取所述双向递归神经网络标点符号预测模型的预测项及与所述预测项对应的预测概率;
将所述双向递归神经网络标点符号预测模型的预测项及与所述预测项对应的预测概率存储在临时缓存中。
4.如权利要求3所述的基于多个预测模型的标点符号预测方法,其特征在于,所述将所述待预测文本输入所述第二标点符号预测模型,获取所述第二标点符号预测模型的预测结果,包括:
将所述待预测文本输入语音停顿标点符号预测模型,获取所述语音停顿标点符号预测模型的预测项及与所述预测项对应的预测概率;
将所述语音停顿标点符号预测模型的预测项及与所述预测项对应的预测概率存储在临时缓存中。
5.如权利要求4所述的基于多个预测模型的标点符号预测方法,其特征在于,所述将所述待预测文本输入所述第三标点符号预测模型,获取所述第三标点符号预测模型的预测结果,包括:
将所述待预测文本输入关键词匹配标点符号预测模型,获取所述关键词匹配标点符号预测模型的预测项及与所述预测项对应的预测概率;
将所述关键词匹配标点符号预测模型的预测项及与所述预测项对应的预测概率存储在临时缓存中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910515571.1/1.html,转载请声明来源钻瓜专利网。