[发明专利]一种基于语音识别的音频摘要文本创建方法及其创建装置有效
申请号: | 201810007804.2 | 申请日: | 2018-01-04 |
公开(公告)号: | CN108305622B | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 王守峰;李晓琳 | 申请(专利权)人: | 海尔优家智能科技(北京)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;H04N21/854;H04N21/439 |
代理公司: | 北京名华博信知识产权代理有限公司 11453 | 代理人: | 李冬梅;苗源 |
地址: | 100080 北京市海淀区知春*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语音 识别 音频 摘要 文本 创建 方法 及其 装置 | ||
1.一种基于语音识别的音频摘要文本创建方法,其特征在于,包括以下步骤:
S1:播放音频文件时,接收创建摘要命令;
S2:确定接收创建摘要命令时所述音频文件的播放位置;
S3:根据所述播放位置确定目标音频段的位置信息;
S4:获取所述目标音频段中的音频内容;
S5:识别所述音频内容获得文本信息;
所述步骤S5包括:将获取到的N个音频内容组合成新的音频内容;识别所述新的音频内容获得文本信息;
所述步骤S5中还包括步骤S51:对获得的N个音频摘要进行整合;具体包括:
S511:将所述N个音频摘要按时间顺序排列形成一摘要集合文件;
S512:删除所述摘要集合文件中重复的语音信息;
所述步骤S512包括:
S5121:按照播放时间顺序计算所述摘要集合文件中每个语音元素的播放速率;每当检测到所述播放速率发生变化时,在发生变化的语音元素前插入一个分组标签;
S5122:将相邻的两个分组标签之间的语音元素视为一个播放组;
S5123:将所有的播放组相互之间进行两两比较,当进行比较的两个播放组中语音元素的相似度大于一预设阈值时,删除所述两个播放组中的任一个。
2.根据权利要求1所述的音频摘要文本创建方法,其特征在于,步骤S3中根据所述播放位置确定所述目标音频段的位置信息的方法包括以下内容中的任一种:
将所述播放位置作为所述目标音频段的起始位置,将所述起始位置之后的预设时长的位置作为所述目标音频段的结束位置;
将所述播放位置作为所述目标音频段的结束位置,将所述结束位置之前的预设时长的位置作为所述目标音频段的起始位置;
将所述播放位置和偏移时长位置的和作为所述目标音频段的起始位置,将所述起始位置之后的预设时长的位置作为所述目标音频段的结束位置;和
将所述播放位置和偏移时长位置的和作为所述目标音频段的结束位置,将所述结束位置之前的预设时长的位置作为所述目标音频段的起始位置。
3.根据权利要求1所述的音频摘要文本创建方法,其特征在于,步骤S3中根据所述播放位置确定所述目标音频段的位置信息的方法包括:
接收到的创建摘要命令的类型为指示提取起始点的第一创建摘要命令时,将当前播放位置作为所述目标音频段的起始位置;
接收到的创建摘要命令的类型为指示提取结束点的第二创建摘要命令时,将当前播放位置作为所述目标音频段的结束位置。
4.根据权利要求1所述的音频摘要文本创建方法,其特征在于,所述步骤S5之前还包括:重复执行所述步骤S1至所述步骤S4,直至所述音频文件播放完毕;具体包括:
S11:播放音频文件时接收到第N次创建摘要命令;
S21:确定接收到第N次创建摘要命令时音频文件的播放位置;
S31:根据所述播放位置确定目标音频段的位置信息;
S41:获取所述目标音频段中的第N个音频内容;其中N为大于1的自然数。
5.根据权利要求1-4中任一项所述的音频摘要文本创建方法,其特征在于,还包括步骤S6:选择固定字数的关键词作为所述文本信息的名称进行保存。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海尔优家智能科技(北京)有限公司,未经海尔优家智能科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810007804.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音指令处理方法及电子设备
- 下一篇:电器控制方法及装置