[发明专利]语句识别方法、装置以及计算机可读介质在审
申请号: | 201911025098.5 | 申请日: | 2019-10-25 |
公开(公告)号: | CN110781660A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 胡鹏飞;黄申 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/279 |
代理公司: | 44285 深圳市深佳知识产权代理事务所(普通合伙) | 代理人: | 王兆林 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种语句识别方法、装置以及计算机可读介质,通过获取按照语序排列的多个词的原始组合;将原始组合输入至目标N元语法模型中,若原始组合中含有人名地名列表中的名称,则目标N元语法模型将原始组合中含有的名称替换成人名地名列表中对应的类别标签,得到替换后的组合,并计算得到替换后的类别标签相关的概率,根据替换后的组合中每一个词的词相关的概率、类别标签相关的概率、以及原始组合中的名称在人名地名列表中对应的类别标签下的所有名称的占比,得到原始组合作为一个句子的概率。相较于现有的N元语法模型,本申请的目标N元语法模型使得含有人名或者地名的语句更容易被正确识别出来。 | ||
搜索关键词: | 类别标签 替换 概率 计算机可读介质 语句识别 语序排列 语句 句子 申请 | ||
【主权项】:
1.一种语句识别方法,其特征在于,包括:/n获取按照语序排列的多个词的原始组合;/n将所述原始组合输入至目标N元语法模型中,得到所述原始组合作为一个句子的概率;其中,若所述原始组合中含有人名地名列表中的名称,则所述目标N元语法模型将所述原始组合中含有的名称替换成所述人名地名列表中对应的类别标签,得到替换后的组合,并计算得到所述替换后的组合中的所述类别标签相关的概率,根据所述替换后的组合中每一个词的词相关的概率、所述类别标签相关的概率、以及所述原始组合中的名称在所述人名地名列表中对应的类别标签下的所有名称的占比,得到所述原始组合作为一个句子的概率;/n所述人名地名列表中的名称包括:人名和地名;所述人名地名列表中的名称所对应的类别标签依据预设的分类规则设定。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911025098.5/,转载请声明来源钻瓜专利网。