[发明专利]一种信息处理方法及装置在审
申请号: | 202110881513.8 | 申请日: | 2021-08-02 |
公开(公告)号: | CN113569013A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 张银平;赵泽清;夏光敏 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/683;G06F16/68;G06F40/194 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 周伟 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 | ||
本申请提供了一种信息处理方法,包括:获取第一音频信息中的第一音频片段;确定所述第一音频片段的起始时间和结束时间,以及确定所述第一音频片段对应的预测文本信息;根据所述第一音频片段的起始时间和结束时间,确定所述第一音频信息对应的第一文本信息中所述第一音频片段对应的第二文本信息;利用所述预测文本信息替换所述第二文本信息;本申请还提供一种信息处理装置。
技术领域
本申请涉及语音信息处理技术领域,尤其涉及一种信息处理方法及装置。
背景技术
在自动语音识别技术(Automatic Speech Recognition,ASR)中,某一领域中的专有名词的识别准确率相对于常规名词的识别准确率较低,使得语音识别的结果出现误差,影响用户体验;因此,如何提升语音识别技术中,专有名词的识别准确率亟需解决。
发明内容
本申请提供一种信息处理方法及装置,以至少解决现有技术中存在的以上技术问题。
本申请一方面提供一种信息处理方法,包括:
获取第一音频信息中的第一音频片段;
确定所述第一音频片段的起始时间和结束时间,以及确定所述第一音频片段对应的预测文本信息;
根据所述第一音频片段的起始时间和结束时间,确定所述第一音频信息对应的第一文本信息中所述第一音频片段对应的第二文本信息;
利用所述预测文本信息替换所述第二文本信息。
上述方案中,所述预测文本信息基于文本模型确定,所述方法还包括:
获取第一语句样本;
基于所述文本模型确定所述第一语句样本对应的文本预测标签;
确定与所述第一语句样本对应的文本样本标签和所述文本预测标签之间的差异;
基于所述文本样本标签和所述文本预测标签之间的差异,调整所述文本模型的模型参数。
上述方案中,所述文本样本标签至少对应不同情绪、不同语气、不同语调或者不同语速的至少一个所述第一语句样本。
上述方案中,所述确定所述第一音频片段对应的预测文本信息包括:
基于采集所述第一音频信息的应用程序和/或语言环境,确定识别所述第一音频片段的文本模型;
基于所述文本模型,识别所述第一音频片段对应的预测文本信息。
上述方案中,所述获取第一音频信息中的第一音频片段包括:
基于当前接收所述第一音频信息的第一时间以及时间阈值,确定所述第一时间之前的第二时间;
确定所述第一音频信息中,起始时间为所述第二时间,结束时间为所述第一时间的音频片段为所述第一音频片段。
上述方案中,所述获取第一音频信息中的第一音频片段包括:
识别所述第一音频信息中包括目标语句类型的情况下,基于所述目标语句类型对的音频片段结束的第一时间以及时间阈值,确定所述第一时间之前的第二时间;
确定所述第一音频信息中,起始时间为所述第二时间,结束时间为所述第一时间的音频片段为所述第一音频片段;
其中,所述目标语句类型至少包括:具备目标文本结构的语句类型、包括目标关键词的语句类型或者包括目标关键字的语句类型。
上述方案中,所述目标语句类型基于语句类型模型确定,所述识别所述第一音频信息包括目标语句类型之前,所述方法还包括:
获取第二语句样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110881513.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耐高压调光膜及其制造方法
- 下一篇:一种智能插座