[发明专利]语义识别的方法、装置及系统在审
申请号: | 201911421165.5 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111192572A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 蔡勇 | 申请(专利权)人: | 斑马网络技术有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/16;G10L15/06;G06F40/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张宁;臧建明 |
地址: | 200030 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 识别 方法 装置 系统 | ||
本发明提供一种语义识别的方法、装置及系统,该方法包括:获取语音信息并根据所述语音信息,提取语音状态;将所述语音状态输入目标语义识别模型,其中,所述目标语义识别模型用于根据所述语音状态获得拼音特征、或者拼音特征和文字特征,得到与所述语音信息对应的语义信息。以实现专业的语义提取,提高语义理解的精确率,降低由于同音文字的识别错误导致的语义理解误差,且具有广泛的通用性,适用于汽车、家居等控制类语音识别场景。
技术领域
本发明涉及计算机自然语言处理的技术领域,尤其涉及一种语义识别的方法、装置及系统。
背景技术
随着ASR(automatic speech recognition自动语音识别)的快速发展,基于ASR识别出的文字的语义理解技术也因此获得了广阔的应用发展。
虽然ASR发展成熟,但在具体落地领域时ASR的识别效果并不理想。比如医学,生物,化学这些领域,虽然ASR可以进行识别,但是ASR的识别准确率不高,且在每个领域的使用要求不同,需针对每个领域进行开发,开发成本高,造成ASR语音识别在专业领域效果不好。
由于语义的理解需要使用ASR识别出的文字,当ASR识别出的文字有偏差时,会严重影响语义的理解。
发明内容
本发明提供一种语义识别的方法、装置及系统,以实现专业的语义识别,提高识别的精确率,降低由于ASR的同音文字识别错误导致的语义理解错误,且具有广泛的通用性,适用于汽车、家居等控制类语音识别场景。
第一方面,本发明实施例提供的一种语义识别的方法,包括:
获取语音信息并根据所述语音信息,提取语音状态;
将所述语音状态输入目标语义识别模型,其中,所述目标语义识别模型用于根据所述语音状态获得拼音特征、或者拼音特征和文字特征,得到与所述语音信息对应的语义信息。
在一种可能的设计中,在将所述语音状态输入所述目标语义识别模型之前,还包括:
获取训练数据集;
将所述训练数据集输入至初始语义识别模型中,其中,所述初始语义识别模型包括拼音转换支路和匹配支路,所述拼音转换支路用于根据所述语音状态获得拼音特征、或者拼音特征和文字特征,所述匹配支路用于根据所述拼音特征得到对应的语义信息,得到所述目标语义识别模型。
在一种可能的设计中,
根据所述语音状态获得拼音特征、或者拼音特征和文字特征,包括:
根据多个依次排列的语音状态,依次得到每个语音状态对应的文字特征,并根据所述文字特征依次得到对应的拼音特征;
或者,根据多个依次排列的语音状态得到对应的文字特征,其中包括第一语音状态对应的文字特征,并从所述第一语音状态对应的文字特征开始向前端和后端的文字特征依次得到对应的拼音特征,直到获得所有文字特征对应的拼音特征。
在一种可能的设计中,还包括:
对所述拼音特征标注对应的音调特征,所述音调特征用于结合所述拼音特征得到对应的语义信息。
在一种可能的设计中,还包括:
在多个拼音特征之间设置空格标识,将所述拼音特征连接成拼音特征串。
在一种可能的设计中,根据所述拼音特征得到对应的语义信息,包括:
根据所述拼音特征串,获取所述拼音特征串对应的最高语义信息概率;
若所述最高语义信息概率不小于概率阈值,则确定所述拼音特征对应的语义信息。
在一种可能的设计中,在得到与所述语音信息对应的语义信息之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斑马网络技术有限公司,未经斑马网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911421165.5/2.html,转载请声明来源钻瓜专利网。