[发明专利]基于语音交互的语义识别方法及装置、存储介质、计算机设备在审
申请号: | 201710619763.8 | 申请日: | 2017-07-26 |
公开(公告)号: | CN107451119A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 韩潼瑜;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G10L15/18;G10L15/187;G10L15/26 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 张振军,吴敏 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 交互 语义 识别 方法 装置 存储 介质 计算机 设备 | ||
技术领域
本发明涉及语音识别技术领域,尤其涉及一种基于语音交互的语义识别方法及装置、存储介质、计算机设备。
背景技术
随着语音识别技术的发展,语音识别在许多领域都得到了应用。通常基于语音交互的语义理解方法和系统是针对输入的语音输出应答,以便用户进行进一步的操作。
在现有技术中,语音识别处理过程与语义理解处理过程串行且相互独立。语音识别负责利用语音识别技术将交互语音识别成为文字文本,语义理解负责利用语义理解技术,根据语音识别的文字文本给出语义理解应答。具体地,在语音识别处理过程中,将语音数据识别为单字,以形成文字文本;然后在语义理解过程中,利用分词词典将文字文本进行词语匹配,再进行语义理解。
但是,在现有的基于语音交互的语义理解方法和系统对语音数据的输出结果中,仍然存在语义理解偏差的问题。
发明内容
本发明解决的技术问题是如何提高语音识别的准确性。
为解决上述技术问题,本发明实施例提供一种基于语音交互的语义识别方法,基于语音交互的语义识别方法包括:将获取到的语音数据转换为音学文本,所述音学文本中包括至少一个表音字;利用所述音学文本中的表音字进行词语匹配,以得到文字文本,所述文字文本中包括与所述表音字匹配的表义词;对所述文字文本进行语义理解处理,以得到所述语音数据的语义。
可选的,所述利用所述音学文本中的表音字进行词语匹配包括:利用所述音学文本中的表音字与包括表音字索引的预设词典进行词语匹配。
可选的,所述利用所述音学文本中的表音字进行词语匹配包括:将所述音学文本中的表音字与所述预设词典中各个预设表义词的表音字进行匹配,其中,所述预设词典中包括至少一个表音字、多个表义词,以及每个预设表义词与相应表音字的对应关系;将匹配的预设表义词作为与所述音学文本中的表音字匹配的表义词。
可选的,所述将所述音学文本中的表音字与所述预设词典中各个预设表义词的表音字进行匹配包括:按照在所述预设词典中出现频率递减的方式选取预设表义词;将选取的预设表义词的表音字与所述音学文本中的表音字进行匹配,直至所述音学文本中的所有表音字匹配完成。
可选的,所述将所述音学文本中的表音字与所述预设词典中各个预设表义词的表音字进行匹配包括:将所述音学文本中的表音字或表音字组合与所述预设词典中各个预设表义词的表音字进行匹配,直至所述音学文本中的所有表音字匹配完成。
可选的,所述利用所述音学文本进行词语匹配包括:确定所述音学文本中的表音字在预设词典中所属的近音词类,其中,所述预设词典中包括至少一个表音字、多个表义词、每个预设表义词与相应表音字的对应关系以及至少一个近音词类,每一近音词类包括多个近音表音字以及针对每一近音表音字的预设权重;选取所述音学文本中的表音字所属的近音词类中权重值最大的近音表音字,将其与预设词典中的表音字进行匹配;如果匹配结果为一致,则将匹配的表音字对应的表义词作为与所述音学文本中的表音字匹配的表义词。
可选的,所述利用所述音学文本进行词语匹配还包括:如果匹配结果为不一致,则按照权重值递减的方式,在所述音学文本中的表音字所属的近音词类中依次选取近音表音字;将选取的近音表音字与预设词典中的表音字进行匹配,直至匹配结果为一致,并将匹配的表音字对应的表义词作为与所述音学文本中的表音字匹配的表义词。
可选的,所述近音表音字包括标准表音字以及与所述标准表音字发音相似的相似表音字。
可选的,所述预设词典为分词词典,所述分词词典包括针对所有表义词的表音字。
可选的,所述表音字为汉字的拼音,所述预设表义词为汉语词语。
可选的,所述基于语音交互的语义识别方法还包括:将所述语音数据的语义与知识库中的知识点进行匹配;输出与所述语音数据的语义相匹配的知识点中的答案。
本发明实施例还公开了一种基于语音交互的语义识别装置,基于语音交互的语义识别装置包括:转换模块,用以将获取到的语音数据转换为音学文本,所述音学文本中包括至少一个表音字;匹配模块,用以利用所述音学文本中的表音字进行词语匹配,以得到文字文本,所述文字文本中包括与所述表音字匹配的表义词;语义理解模块,用以对所述文字文本进行语义理解处理,以得到所述语音数据的语义。
可选的,所述匹配模块利用所述音学文本中的表音字与包括表音字索引的预设词典进行词语匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710619763.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:激光检测胶带涂布稳定系统
- 下一篇:料加热式涂布系统