[发明专利]一种语言识别方法、系统及装置有效
申请号: | 201911408163.2 | 申请日: | 2019-12-31 |
公开(公告)号: | CN113128216B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 邓千;刚周伟;郭麟;陈田川 | 申请(专利权)人: | 中国移动通信集团贵州有限公司;中国移动通信集团有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F18/22 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 李秋华;赵传海 |
地址: | 550081 贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语言 识别 方法 系统 装置 | ||
本发明公开了一种语言识别方法、系统和装置,属于识别技术领域。本发明的语言识别方法中,针对专业技术领域,建立存储有标准指标名的标准词汇库,在获取语句的指标类描述后,首先判断标准词汇库中是否具有完全对应的标准指标名,若有,则以该标准指标名作为语句的指标类信息,以此提高在专业领域上的语言识别;若没有,结合标准词汇库和常规词库进行分词后得到分词列表,解析分词列表或获取指标类信息,由于分词是结合标准词汇库和常规词库进行的,相比单纯依靠常规词库进行分词,本发明的分词更贴近该领域的相近词汇,从而使得分词后得到的指标类信息更准确,语言识别也更精确。
技术领域
本发明涉及识别技术领域,尤其涉及一种语言识别方法、系统及装置。
背景技术
自然语言处理属于人工智能技术的一大方向,目前已经在各行各业中开始应用。自然语言处理可以用于人机交谈,交谈的内容可以是闲聊。
由于,闲聊通常不存在特定的目的,其分词通常是基于常规词库进行的,将自然语言处理应用于专业领域的人机交谈时,由于常规词库不能对专业领域的描述进行正确的分词,常常出现机器人无法正确识别专业领域的术语与问题,导致机器人的回答显得答非所问。为此,需要提出一种能够应用于专业领域的语言识别方法。
发明内容
为了解决上述问题,本发明提供一种语言识别方法、系统和装置。
第一方面,本发明提供一种语言识别方法,包括:
获取语句的指标类描述;
判断所述指标类描述是否在标准词汇库中具有完全对应的标准指标名;
若是,以所述标准指标名为指标类信息;
若否,结合所述标准词汇库和常规词库对所述指标类描述进行分词后得到分词列表,解析所述分词列表得到目标指标名,以所述目标指标名为所述指标类信息。
上述的语言识别方法,所述结合所述标准词汇库和常规词库对所述指标类描述进行分词后得到分词列表,包括:
提取指标类描述中的第一分词,所述第一分词在所述标准词汇库中具有对应标准词汇;
提取指标类描述中的第二分词,所述第二分词在所述常规词库中具有对应的常规词汇;
结合所述第一分词和所述第二分词得到所述分词列表。
上述的语言识别方法,所述解析所述分词列表得到目标指标名,包括:
在所述标准词汇库中,查找与分词列表中各分词至少部分对应的标准指标名,依据至少部分对应的所述标准指标名,生成各分词对应的分词集合,所述分词集合中的元素为标准词汇库中的标准指标名;
将所有分词的分词集合取交集;
若所述交集为非空集合时,以所述交集的元素为目标指标名;
若所述交集为空集时,将所有分词的分词集合取并集,分别计算所述并集中每个元素与所述分词列表的相似度,依据相似度的计算结果,从所述并集中获取目标元素,并作为目标指标名。
上述的语言识别方法,所述分别计算所述并集中每个元素与所述分词列表的相似度,包括:
将所述并集中的每个元素按标准词汇库中的标准词汇进行分词,得到每个元素的元素分词;
依次计算分词相似度,所述分词相似度为每个元素中的每个元素分词与所述分词列表中的各分词的相似度;
计算每个元素中所有的分词相似度的平均值,作为对应元素与分词列表的相似度。
上述的语言识别方法,所述依据相似度的计算结果,从所述并集中获取目标元素,并作为目标指标名,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团贵州有限公司;中国移动通信集团有限公司,未经中国移动通信集团贵州有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911408163.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:水质监管系统
- 下一篇:降低干扰方法、接入网设备、通信终端和计算机可读介质