[发明专利]添加分隔符的方法及终端设备有效
申请号: | 201910184608.7 | 申请日: | 2019-03-12 |
公开(公告)号: | CN110046344B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 占小杰;马骏;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/284;G06F40/166 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 冷仔 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 添加 分隔 方法 终端设备 | ||
本发明适用于人工智能技术领域,提供了一种添加分隔符方法及终端设备,通过对目标语句进行分词处理得到多个目标词,根据目标词在预设的词语集合中的位置生成目标词对应的位置矩阵,并通过Word2Vec模型将目标词的位置矩阵转换为词向量;通过预设的神经网络模型将目标语句包含的多个目标词的词向量转换为目标语句对应的混合矩阵;将混合矩阵输入预设的分类器模型,输出各个目标词对应各个分隔符的概率,并将目标词对应的概率最高的分隔符添加在该目标词之后,从而为目标语句添加分隔符,使得目标语句被不同类型的分割符隔断,方便用户阅读和理解目标语句。
技术领域
本发明属于人工智能领域,尤其涉及一种添加分隔符的方法及终端设备。
背景技术
近年来,越来越多的语音识别软件可以将语音转换为文字,但是当语音转换为文字之后,往往由于语音识别无法为生成的文字添加诸如标点符号等分割符,导致用户难以很顺畅的阅读这些文字。尤其是当停顿时间极短的大段语音一次性转换为文字时,会给用户造成更大的阅读困难。
发明内容
有鉴于此,本发明实施例提供了一种添加分隔符的方法及终端设备,以解决现有技术存在的由于难以为文字自动添加分隔符导致的用户阅读困难的问题。
本发明实施例的第一方面提供了一种添加分隔符的方法,包括:
获取待添加分隔符的目标语句,并对所述目标语句进行分词处理,生成多个目标词;根据预设的词语集合,生成所述目标词对应的用于表征所述目标词在所述词语集合中的位置的位置矩阵,并通过预设的Word2Vec模型将所述目标词的位置矩阵转换为该目标词的词向量;分别按照各个所述目标词在所述目标语句中由前到后的顺序以及由后到前的顺序,将各个所述目标词的词向量输入到预设的神经网络模型,生成所述目标语句对应的前向矩阵以及后向矩阵,并将所述前向矩阵以及所述后向矩阵进行拼接,生成所述目标语句对应的混合矩阵;将所述混合矩阵输入预设的分类器模型,输出各个所述目标词对应各个分隔符的概率,并将所述目标词对应的概率最高的分隔符添加在该目标词之后,以为所述目标语句添加分隔符。
本发明实施例的第二方面提供了一种添加分隔符的装置,包括:获取模块,用于获取待添加分隔符的目标语句,并对所述目标语句进行分词处理,生成多个目标词;转换模块,用于根据预设的词语集合,生成所述目标词对应的用于表征所述目标词在所述词语集合中的位置的位置矩阵,并通过预设的Word2Vec模型将所述目标词的位置矩阵转换为该目标词的词向量;计算模块,用于分别按照各个所述目标词在所述目标语句中由前到后的顺序以及由后到前的顺序,将各个所述目标词的词向量输入到预设的神经网络模型,生成所述目标语句对应的前向矩阵以及后向矩阵,并将所述前向矩阵以及所述后向矩阵进行拼接,生成所述目标语句对应的混合矩阵;添加模块,用于将所述混合矩阵输入预设的分类器模型,输出各个所述目标词对应各个分隔符的概率,并将所述目标词对应的概率最高的分隔符添加在所述目标词之后,以为所述目标语句添加分隔符。
本发明实施例的第三方面提供了一种终端设备,包括存储器以及处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述计算机程序被处理器执行时,实现本发明实施例的第一方面提供的方法的步骤。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例的第一方面提供的方法的步骤。
在本发明实施例中,通过对目标语句进行分词处理得到多个目标词,根据目标词在预设的词语集合中的位置生成目标词对应的位置矩阵,并通过Word2Vec模型将目标词的位置矩阵转换为词向量;通过预设的神经网络模型将目标语句包含的多个目标词的词向量转换为目标语句对应的混合矩阵;将混合矩阵输入预设的分类器模型,输出各个目标词对应各个分隔符的概率,并将目标词对应的概率最高的分隔符添加在该目标词之后,从而为目标语句添加分隔符,使得目标语句被不同类型的分割符隔断,方便用户阅读和理解目标语句。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910184608.7/2.html,转载请声明来源钻瓜专利网。