[发明专利]一种调整语义逻辑混乱的语料的方法及系统有效
申请号: | 201811326950.8 | 申请日: | 2018-11-08 |
公开(公告)号: | CN109545202B | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 魏誉荧 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/26;G06F40/289;G06F40/30 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 调整 语义 逻辑 混乱 语料 方法 系统 | ||
本发明提供了一种调整语义逻辑混乱的语料的方法及系统,其方法包括:获取逻辑清晰、语义完整的语料样本,根据所述语料样本建立语音库、语义槽和正则表达式库;获取用户语音;将所述用户语音和所述语音库进行匹配,得到匹配分词,所述匹配分词为所述用户语音中匹配结果相符的分词;根据所述语义槽确定所述匹配分词对应的匹配分词词性;根据所述正则表达式库中的正则表达式和所述匹配分词词性调整所述用户语音中分词的位置,得到逻辑正确的文本数据;根据所述文本数据进行语义解析。本发明通过调整逻辑混乱的语料中分词之间的相对位置,从而智能识别真实的用户意图。
技术领域
本发明涉及语音识别技术领域,尤指一种调整语义逻辑混乱的语料的方法及系统。
背景技术
当今社会随着互联网的快速发展,人们的日常生活的方方面面也是变得越来越智能化,因此人们也越来越习惯地使用智能终端完成各种需求。而且随着人工智能相关技术的日益成熟,各类终端的智能化程度也越来越高。语音交互作为智能终端中人机交互主流的交流应用之一,也是越来越受到用户的青睐。
智能终端都是基于用户输入的语音进行识别,然后采取相应的措施,因此用户通过终端终端所输入的语音的准确性严重影响着智能终端所作出的反馈。
由于用户输入语音过程中可能出现的意外,例如用户输入语音时比较着急,来不及理清逻辑,说话语无伦次,导致输入的语音逻辑比较混乱,或者用户自身对于自己描述的事物并不了解或者只理解一部分,导致输入语音描述时不知道如何组织语言进行清晰说明。对于上述获取的语音出现逻辑混乱的现象,如果直接对获取的语音进行识别解析难以准确识别用户的真实意图。
另外,对于小学低年级的学生而言,由于他们还是处于刚刚开始学习的阶段,对于字、词、句的理解都还不够深入,并不能准确运用,导致自身的语言表达能力比较薄弱。因此他们在表达过程中,经常会出现语义逻辑混乱、意图不清晰的情况,导致语音识别产品难以智能识别真实的用户意图。
因此市场上急需一种能够识别用户语音逻辑混乱并进行相应调整的方法及系统。
发明内容
本发明的目的是提供一种调整语义逻辑混乱的语料的方法及系统,实现通过调整逻辑混乱的语料中分词之间的相对位置,从而智能识别真实的用户意图的目的。
本发明提供的技术方案如下:
本发明提供了一种调整语义逻辑混乱的语料的方法,其特征在于,包括:
获取逻辑清晰、语义完整的语料样本,根据所述语料样本建立语音库、语义槽和正则表达式库;
获取用户语音;
将所述用户语音和所述语音库进行匹配,得到匹配分词,所述匹配分词为所述用户语音中和所述语音库匹配结果相符的分词;
根据所述语义槽确定所述匹配分词对应的匹配分词词性;
根据所述正则表达式库中的正则表达式和所述匹配分词词性调整所述用户语音中分词的相对位置,得到逻辑正确的文本数据;
根据所述文本数据进行语义解析。
进一步的,所述的获取逻辑清晰、语义完整的语料样本,根据所述语料样本建立语音库、语义槽和正则表达式库具体包括:
获取逻辑清晰、语义完整的所述语料样本;
通过分词技术对所述语料样本进行分词得到所述语料样本中包含的样本分词以及对应的样本分词词性;
根据所述样本分词和所述样本分词词性建立所述语义槽;
获取所述样本分词对应的样本分词音频,根据所述样本分词音频建立语音库;
根据所述语料样本和所述样本分词词性总结得出正则表达式,根据所述正则表达式建立所述正则表达式库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811326950.8/2.html,转载请声明来源钻瓜专利网。