[发明专利]语音信息处理方法、装置及存储介质在审
申请号: | 201910848567.7 | 申请日: | 2019-09-09 |
公开(公告)号: | CN112562675A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 牛毅;王宏宇;吴学芳 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/02;G06F40/284 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 徐晨影 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信息处理 方法 装置 存储 介质 | ||
本公开是关于一种语音信息处理方法、装置、存储介质及电子设备,所述方法包括:基于语音识别技术,确定采集到的语音信息对应的文本信息,所述文本信息包括单词;将所述文本信息中的单词作为目标单词,根据所述目标单词对应的音素序列和预先设置的发音词典,确定所述目标单词对应的模糊词,其中,所述发音词典包括多个单词以及每一单词对应的音素序列;输出所述目标单词以及所述目标单词对应的模糊词。通过本公开的技术方案,可以解决现有的语音识别技术对同音、发音易混等单词识别不准确的问题,提升用户体验。
技术领域
本公开涉及信息技术领域,尤其涉及一种语音信息处理方法、装置及存储介质。
背景技术
随着信息技术的高速发展,语音识别(Automatic Speech Recognition,ASR)技术也得到了快速发展。语音识别是一门利用计算机实现从语音到文本自动转换的综合性应用技术,集成了包括信号处理、模式识别、机器学习、数值分析、自然语言处理、高性能计算等一系列基础学科的优秀成果,是一门跨领域、跨学科的应用型研究,已在语言学习等领域得到了广泛应用。
相关技术中的语音识别技术,通常采用基于统计模式识别算法对采集到的语音信息进行识别。然而,对于语言学习等领域,英文等语言中存在大量同音的单词、发音易混等单词,采用相关技术中的语音识别技术很难准确识别出这些单词。
发明内容
为克服相关技术中存在的问题,本公开提供一种语音信息处理方法、装置及存储介质。
根据本公开实施例的第一方面,提供一种语音信息处理方法,包括:
基于语音识别技术,确定采集到的语音信息对应的文本信息,所述文本信息包括单词;
将所述文本信息中的单词作为目标单词,根据所述目标单词对应的音素序列和预先设置的发音词典,确定所述目标单词对应的模糊词,其中,所述发音词典包括多个单词以及每一单词对应的音素序列;
输出所述目标单词以及所述目标单词对应的模糊词。
可选地,所述根据所述目标单词对应的音素序列和预先设置的发音词典,确定所述目标单词对应的模糊词,包括:
从所述发音词典的单词中选取所对应的音素序列与所述目标单词对应的音素序列相同的单词,作为所述目标单词对应的模糊词。
可选地,所述根据所述目标单词对应的音素序列和预先设置的发音词典,确定所述目标单词对应的模糊词,包括:
若所述目标单词对应的音素序列包括第一预设类型音素,则以所述目标单词对应的音素序列为基准序列,从所述发音词典的单词中选取所对应的音素序列满足以下条件的单词,作为所述目标单词对应的模糊词:
所对应的音素序列包括所述第一预设类型音素,且所述第一预设类型音素在该音素序列中的位置,与所述基准序列中的所述第一预设类型音素在所述基准序列中的位置相同;
该音素序列中除所述第一预设类型音素以外的音素组成的第一音素序列,与所述基准序列中除所述第一预设类型音素以外的音素组成的第二音素序列相同。
可选地,所述根据所述目标单词对应的音素序列和预先设置的发音词典,确定所述目标单词对应的模糊词,包括:
若所述目标单词对应的音素序列的第一个音素和/或最后一个音素为第二预设类型音素,则将该音素序列中除所述第二预设类型音素以外的音素整合为新的音素序列,从所述发音词典的单词中,选取所对应的音素序列与该新的音素序列相同的单词,作为所述目标单词对应的模糊词。
可选地,所述输出所述目标单词以及所述目标单词对应的模糊词,包括:
根据预设优先级对所述目标单词对应的模糊词进行排序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910848567.7/2.html,转载请声明来源钻瓜专利网。