[发明专利]语音检测方法、装置、电子设备及存储介质有效
申请号: | 202010124064.8 | 申请日: | 2020-02-27 |
公开(公告)号: | CN111369980B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 刘阳;邱硕;付凯 | 申请(专利权)人: | 网易有道信息技术(江苏)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26;G10L25/51;G06F40/289;G06F40/247 |
代理公司: | 北京维昊知识产权代理事务所(普通合伙) 11804 | 代理人: | 陈姗姗 |
地址: | 210019 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 检测 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种语音检测方法、装置、电子设备及存储介质,以满足现实场景中检查背诵或朗读正确性的需求,减轻检查者的工作量,同时还能够满足被查着进行自查的需求,提升查验效率。所述方法包括:获取针对参考文本的语音信号,并将语音信号转换为待检测文本;获取参考文本包含的关键词;将待检测文本和参考文本包含的关键词逐一进行匹配;根据匹配失败的关键词,输出参考文本中包含匹配失败的关键词的文本。
技术领域
本申请涉及计算机技术领域,尤其涉及一种语音检测方法、装置、电子设 备及存储介质。
背景技术
本部分旨在为权利要求书中陈述的本申请的实施方式提供背景或上下 文。此处的描述不因为包括在本部分中就承认是现有技术。
现实场景下背诵检查或朗读正确性检查一般由人工完成,但是人工检 查容易受到背诵或朗读的文本长度、被检查者表述方式等因素影响。并且 对于教师、家长等检查者而言,在检查大量背诵者或朗读者的过程中,保 持专注度及一致的判罚尺度较为困难,同时比较耗费时间精力;而对于学 生等被检查者而言,在没有另一个人作为检查者的情况下,只能对背诵的文本进行录音后,再充当检查者对录音进行检查,整体效率很低。
发明内容
针对上述技术问题,非常需要一种改进的方法,以满足现实场景中检 查背诵或朗读正确性的需求,减轻检查者的工作量,同时还能够满足被查 着进行自查的需求,提升查验效率。
一方面,本申请一实施例提供了一种语音检测方法,包括:
获取针对参考文本的语音信号,并将所述语音信号转换为待检测文本;
获取所述参考文本包含的关键词;
将所述待检测文本和所述参考文本包含的关键词逐一进行匹配;
根据匹配失败的关键词,输出所述参考文本中包含所述匹配失败的关键词 的文本。
可选地,所述将所述待检测文本和所述参考文本包含的关键词逐一进 行匹配,具体包括:
通过以下至少一种方式确定所述参考文本包含的每个关键词是否匹配 成功:
针对所述参考文本包含的每个关键词,若所述待检测文本中不存在与 所述关键词匹配的词,则确定所述关键词匹配失败;
针对所述参考文本包含的每个关键词,若所述待检测文本对应的拼音 序列中不存在与所述关键词对应的拼音序列匹配的拼音序列,则确定所述 关键词匹配失败。
可选地,通过以下至少一种方式确定所述待检测文本中是否存在与所 述关键词匹配的词:
若所述待检测文本中存在与所述关键词相同的词,则确定所述待检测 文本中存在与所述关键词匹配的词;
若所述待检测文本中存在与所述关键词对应的任一同义词相同的词, 则确定所述待检测文本中存在与所述关键词匹配的词;
若所述待检测文本中存在与所述关键词对应的任一读法相同的词,则 确定所述待检测文本中存在与所述关键词匹配的词。
可选地,通过以下方式确定所述待检测文本中不存在与所述关键词对 应的拼音序列匹配的拼音序列:
根据预设的谐音对照表,为每个关键词对应的拼音序列构建谐音序列;
若所述待检测文本中不存在与所述关键词对应的拼音序列,且不存在 与所述关键词的谐音序列相同的拼音序列,则确定所述待检测文本对应的 拼音序列中不存在与所述关键词对应的拼音序列匹配的拼音序列。
可选地,所述将所述待检测文本和所述参考文本包含的关键词逐一进 行匹配,还包括:
对每个匹配失败的关键词进行分词处理,获得每个匹配失败的关键词 对应的多个分词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易有道信息技术(江苏)有限公司,未经网易有道信息技术(江苏)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010124064.8/2.html,转载请声明来源钻瓜专利网。