[发明专利]语句识别方法、装置以及计算机可读介质在审
申请号: | 201911025098.5 | 申请日: | 2019-10-25 |
公开(公告)号: | CN110781660A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 胡鹏飞;黄申 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/279 |
代理公司: | 44285 深圳市深佳知识产权代理事务所(普通合伙) | 代理人: | 王兆林 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 类别标签 替换 概率 计算机可读介质 语句识别 语序排列 语句 句子 申请 | ||
1.一种语句识别方法,其特征在于,包括:
获取按照语序排列的多个词的原始组合;
将所述原始组合输入至目标N元语法模型中,得到所述原始组合作为一个句子的概率;其中,若所述原始组合中含有人名地名列表中的名称,则所述目标N元语法模型将所述原始组合中含有的名称替换成所述人名地名列表中对应的类别标签,得到替换后的组合,并计算得到所述替换后的组合中的所述类别标签相关的概率,根据所述替换后的组合中每一个词的词相关的概率、所述类别标签相关的概率、以及所述原始组合中的名称在所述人名地名列表中对应的类别标签下的所有名称的占比,得到所述原始组合作为一个句子的概率;
所述人名地名列表中的名称包括:人名和地名;所述人名地名列表中的名称所对应的类别标签依据预设的分类规则设定。
2.根据权利要求1所述的方法,其特征在于,所述目标N元语法模型的构建方法,包括:
创建第一语料集;其中,所述第一语料集的每一个句子均含有名称;所述名称包括人名和/或地名;
根据所述预设的分类规则,将所述第一语料集中的名称替换成对应的类别标签,得到替换后的第一语料集;
根据所述替换后的第一语料集,训练得到初始N元语法模型;其中,所述初始N元语法模型用于计算含有替换后的类别标签的组合中每一个词的词相关的概率、以及所述替换后的类别标签相关的概率;
根据所述人名地名列表和所述初始N元语法模型,得到所述目标N元语法模型;其中,所述目标N元语法模型用于计算得到含有所述人名地名列表中的名称的多个词的组合作为一个句子的概率;所述人名地名列表中至少包括所述第一语料集中的每一个句子包括的人名和地名。
3.根据权利要求1所述的方法,其特征在于,所述根据所述替换后的组合中每一个词的词相关的概率、所述类别标签相关的概率、以及所述原始组合中的名称在所述人名地名列表中对应的类别标签下的所有名称的占比,得到所述原始组合作为一个句子的概率,包括:
根据所述类别标签相关的概率、以及所述原始组合中的名称在所述人名地名列表中对应的类别标签下的所有名称的占比,得到所述原始组合中的名称相关的概率;
根据所述原始组合中的名称相关的概率、以及所述替换后的组合中每一个词的词相关的概率,得到所述原始组合作为一个句子的概率。
4.根据权利要求1所述的方法,其特征在于,所述根据所述替换后的组合中每一个词的词相关的概率、所述类别标签相关的概率、以及所述原始组合中的名称在所述人名地名列表中对应的类别标签下的所有名称的占比,得到所述原始组合作为一个句子的概率,包括:
根据所述替换后的组合中的类别标签在所述人名地名列表中对应的名称个数,得到所述原始组合中的名称在所述人名地名列表中对应的类别标签下的所有名称的占比;
将所述类别标签相关的概率,与所述原始组合中的名称在所述人名地名列表中对应的类别标签下的所有名称的占比作乘,得到所述原始组合中的名称相关的概率;
将所述原始组合中的名称相关的概率,与所述替换后的组合中每一个词的词相关的概率作乘,得到所述原始组合作为一个句子的概率。
5.根据权利要求1所述的方法,其特征在于,所述人名地名列表中还包括:所述人名地名列表中的每一个名称所对应的权重值;
其中,所述根据所述替换后的组合中每一个词的词相关的概率、所述类别标签相关的概率、以及所述原始组合中的名称在所述人名地名列表中对应的类别标签下的所有名称的占比,得到所述原始组合作为一个句子的概率,包括:
根据所述原始组合中的名称在所述人名地名列表中对应的类别标签下的所有名称对应的权重值,得到所述原始组合中的名称在所述人名地名列表中对应的类别标签下的所有名称的占比;
将所述类别标签相关的概率,与所述原始组合中的名称在所述人名地名列表中对应的类别标签下的所有名称的占比作乘,得到所述原始组合中的名称相关的概率;
将所述原始组合中的名称相关的概率,与所述替换后的组合中每一个词的词相关的概率作乘,得到所述原始组合作为一个句子的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911025098.5/1.html,转载请声明来源钻瓜专利网。