[发明专利]音频识别方法、装置、存储介质和计算设备有效
申请号: | 202211612005.0 | 申请日: | 2022-12-15 |
公开(公告)号: | CN115602154B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 穆学锋;李勇;郑加强;沈忱;吴敏;周倩 | 申请(专利权)人: | 杭州网易云音乐科技有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/06;G10L15/16;G10L15/26;H04L51/52 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 王剑 |
地址: | 310052 浙江省杭州市萧山区钱江世*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 识别 方法 装置 存储 介质 计算 设备 | ||
本公开的实施方式提供了一种音频识别方法、装置、存储介质和计算设备。包括:检测用户哼唱的音频片段或用户输入的音频片段,对所述音频片段进行语音识别;在语音识别结果为失败的情况下,显示第一控件;在检测到所述用户对所述第一控件点击的情况下,根据所述音频片段生成帖子并将所述帖子分享到社区论坛。如此,在语音识别结果为失败时,自动将包含音频片段的帖子分享到社区论坛上,利用社区论坛上众多的用户帮助识别音频片段对应的歌名信息。将音频识别与社区论坛结合,提升用户在使用音频识别时的使用体验。
技术领域
本公开的实施方式涉及计算机技术领域,更具体地,本公开的实施方式涉及一种音频识别方法、装置、存储介质和计算设备。
背景技术
本部分旨在为说明书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
用户在听到某一首感兴趣的歌曲时,由于不知道歌名而无法了解更多的与歌曲相关的信息。
为此,相关音乐类应用程序相继推出语音识别功能,用户在听到感兴趣的歌曲时,可以开启该语音识别功能,以对接收到的音频信息进行识别,并显示识别到的相关信息例如歌名信息。
但是,现有的这种语音识别功能准确性并不高,容易出现无法识别到相关信息,从而造成识别失败的问题。
发明内容
在本公开实施方式的第一方面中,提供了一种音频识别方法包括:
检测用户哼唱的音频片段或用户输入的音频片段,对所述音频片段进行语音识别;
在语音识别结果为失败的情况下,显示第一控件;
在检测到所述用户对所述第一控件点击的情况下,根据所述音频片段生成帖子并将所述帖子分享到社区论坛。
可选的,所述根据所述音频片段生成帖子并将所述帖子分享到社区论坛之后,还包括:
跳转至所述社区论坛,在所述社区论坛中显示所述帖子,所述帖子包括文案和所述音频片段的标识;
其中,所述文案为系统自动生成的文案或为将所述帖子分享到社区论坛之前所述用户在文本输入框输入的文本信息。
可选的,所述方法还包括:
在检测到所述帖子存在回复评论时,向所述用户发出提醒信息。
可选的,所述方法还包括:
根据所述帖子的回复评论的互动信息,对所述回复评论进行排序显示。
可选的,所述方法还包括:
根据所述帖子的回复评论的互动信息,确定所述帖子的最佳评论。
可选的,所述对所述音频片段进行语音识别,包括:
基于语音识别模型对所述音频片段进行语音识别;
所述方法还包括:
根据所述帖子的回复评论的互动信息,对所述语音识别模型进行迭代训练。
可选的,所述根据所述帖子的回复评论的互动信息,对所述语音识别模型进行迭代训练,包括:
对所述帖子的回复评论进行实体识别处理,得到所述回复评论中存在的歌名信息;
基于所述歌名信息对应的回复评论的互动信息对每个歌名信息进行打分处理,将分值最高的目标歌名信息确定为所述音频片段对应的歌名信息;
将所述音频片段和目标歌名信息作为带标签的训练样本,加入到所述语音识别模型的训练样本库;
基于更新的训练样本库对所述语音识别模型进行迭代训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易云音乐科技有限公司,未经杭州网易云音乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211612005.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带控制功能的直线电机驱动器
- 下一篇:一种射频电源及温度调控方法