[发明专利]口语词识别和语义识别方法及其装置有效
申请号: | 201810714177.6 | 申请日: | 2018-06-29 |
公开(公告)号: | CN108829894B | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 李剑风;姜文斌;孙珂 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/35;G06F40/289;G06F40/284 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 口语 识别 语义 方法 及其 装置 | ||
本发明提出一种口语词识别和语义识别方法及其装置,其中,口语词识别方法包括:获取经过训练的第一语言模型,其中,第一语言模型已预先学习得到口语词在语句中的上下文特征,对待识别语句中的各单词进行上下文特征提取,采用经过训练的第一语言模型,对各单词的上下文特征进行识别,确定各单词是否为口语词,提高了询问问题中口语化词的识别准确率。通过训练完成的第一语言模型,对待识别语句中的各单词进行上下文特征提取,并进行上下文特征识别,从而确定各单词是否为口语词,提高了口语词识别的效率和准确度,解决现有技术中用户询问问题中口语化词语较多,识别效率和准确度较低的技术问题。
技术领域
本发明涉及智能应答技术领域,尤其涉及一种口语词识别和语义识别方法及其装置。
背景技术
通用对话系统作为人工智能的重要场景,得到越来越多的关注,通用对话系统通过人机交互以一问一答的方式为用户智能提供信息服务。在智能问答中,人们随口说出的询问问题常常使用口语化词,而对话系统常常因为询问问题中含有口语化词而导致识别难度增大,随着输入问题的语音占比越来越大,识别询问问题中的口语化词成为了一个有实用价值的问题。
现有技术中,通过一个简单的通用口语词表,将询问问题中属于口语词表中的词进行忽略,但通用口语词表中的词一般无法识别丰富的口语词汇,使得询问问题中的口语词无法全部识别出,识别准确度较低。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种口语词识别方法,通过训练完成的第一语言模型,对待识别语句中的各单词进行上下文特征提取,并进行上下文特征识别,从而确定各单词是否为口语词,提高了口语词识别的效率和准确度。
本发明的第二个目的在于提出一种口语词识别装置。
本发明的第三个目的在于提出一种语义识别方法。
本发明的第四个目的在于提出一种语义识别装置。
本发明的第五个目的在于提出一种计算机设备。
本发明的第六个目的在于提出一种非临时性计算机可读存储介质。
本发明的第七个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种口语词识别方法,包括:
获取经过训练的第一语言模型,其中,所述第一语言模型已预先学习得到口语词在语句中的上下文特征;
对待识别语句中的各单词进行上下文特征提取;
采用经过训练的第一语言模型,对所述各单词的上下文特征进行识别,确定各单词是否为口语词。
为达上述目的,本发明第二方面实施例提出了一种口语词识别装置,包括:
获取模块,用于获取经过训练的第一语言模型,其中,所述第一语言模型已预先学习得到口语词在语句中的上下文特征;
提取模块,用于对待识别语句中的各单词进行上下文特征提取;
识别模块,用于采用经过训练的第一语言模型,对所述各单词的上下文特征进行识别,确定各单词是否为口语词。
为达上述目的,本发明第三方面实施例提出了一种语义识别方法,该方法包括:
获取经过训练的第一语言模型,其中,所述第一语言模型已预先学习得到口语词在语句中的上下文特征;
对待识别语句中的各单词进行上下文特征提取;
采用经过训练的第一语言模型,对所述各单词的上下文特征进行识别,确定各单词是否为口语词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810714177.6/2.html,转载请声明来源钻瓜专利网。