[发明专利]音频打点数据获取方法、装置、存储介质及电子设备有效
申请号: | 202110668121.3 | 申请日: | 2021-06-16 |
公开(公告)号: | CN113129935B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 李爽;曲健宁;闫智慧 | 申请(专利权)人: | 北京新唐思创教育科技有限公司 |
主分类号: | G11B27/10 | 分类号: | G11B27/10;G10L15/26 |
代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 李丽 |
地址: | 100039 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 打点 数据 获取 方法 装置 存储 介质 电子设备 | ||
1.一种音频打点数据获取方法,其特征在于,包括:
获取待打点音频和与所述待打点音频对应的原始文本;
将所述待打点音频和所述原始文本输入文字级时间打点模型,获取文字级初始打点文本,其中,所述文字级初始打点文本包括打点文字和各个所述打点文字在所述待打点音频中的起止时间;
当获取到所述文字级初始打点文本时,获取所述原始文本的原始文字,以及所述文字级初始打点文本中与所述原始文字位置对应的所述打点文字;
当位于同一文字位置的所述原始文字和所述打点文字一致时,确定所述原始文字前后的标点符号,基于所述标点符号的类型以及所述标点符号与所述原始文字的相对位置,确定所述标点符号与所述打点文字的合并方式,根据所述合并方式对所述标点符号与所述打点文字进行合并,得到符号打点文字,并将对应的所述起止时间打点至所述符号打点文字,直至完成所述原始文本全部所述原始文字与标点符号的处理,得到所述待打点音频的音频打点数据。
2.如权利要求1所述的音频打点数据获取方法,其特征在于,所述基于所述标点符号的类型以及所述标点符号与所述原始文字的相对位置,确定所述标点符号与所述打点文字的合并方式的步骤包括以下至少一者:
当所述标点符号的类型为配对标点,所述标点符号位于所述原始文字的前面,所述原始文字位于所述原始文本的语句的首位时,将所述配对标点按照所述原始文本中的位置与所述打点文字合并,并将所述配对标点存储于符号匹配空间;
当所述标点符号的类型为配对标点,所述标点符号位于所述原始文字的前面,所述原始文字位于所述原始文本的语句的中位,且所述符号匹配空间中未存储有与所述标点符号相匹配的匹配标点符号时,将所述配对标点按照所述原始文本中的位置与所述打点文字合并,并在确定所述配对标点未存储于所述符号匹配空间时,将所述配对标点存储于符号匹配空间;
当所述标点符号的类型为配对标点,所述标点符号位于所述原始文字的后面,所述原始文字位于所述原始文本的语句的中位或末位,且所述符号匹配空间中存储有与所述标点符号相匹配的匹配标点符号时,将所述配对标点按照所述原始文本中的位置与所述打点文字合并,并清除所述符号匹配空间中的所述配对标点符号;
当所述标点符号的类型为配对标点,所述标点符号位于所述原始文字的后面,所述原始文字位于所述原始文本的语句的中位或末位,且所述符号匹配空间中未存储有与所述标点符号相匹配的匹配标点符号时,保持所述打点文字不变,并在确定所述配对标点未存储于所述符号匹配空间时,将所述配对标点存储于符号匹配空间;
当所述标点符号的类型为非配对标点,且所述标点符号位于所述原始文字的后面时,将所述非配对标点按照所述原始文本中的位置与所述打点文字合并。
3.如权利要求1所述的音频打点数据获取方法,其特征在于,所述基于所述标点符号的类型以及所述标点符号与所述原始文字的相对位置,确定所述标点符号与所述打点文字的合并方式的步骤包括以下至少一者:
当所述标点符号的类型为配对标点,所述标点符号位于所述原始文字的前面,所述原始文字位于所述原始文本的语句的首位时,将所述配对标点按照所述原始文本中的位置与所述打点文字合并,并将所述配对标点存储于符号匹配空间;
当所述标点符号的类型为配对标点,所述标点符号位于所述原始文字的后面,所述原始文字位于所述原始文本的语句的非首位,且所述符号匹配空间中存储有与所述标点符号相匹配的匹配标点符号时,将所述配对标点按照所述原始文本中的位置与所述打点文字合并,将所述配对标点存储于符号匹配空间;
当所述标点符号的类型为配对标点,所述标点符号位于所述原始文字的后面,所述原始文字位于所述原始文本的语句的非首位,且所述符号匹配空间中未存储有与所述标点符号相匹配的匹配标点符号时,保持所述打点文字不变,按照所述原始文本中位于所述原始文字后的位置确定后一打点文字,将所述配对标点与所述打点文字合并,将所述配对标点存储于符号匹配空间;
当所述标点符号的类型为非配对标点,且所述标点符号位于所述原始文字的后面时,将所述非配对标点按照所述原始文本中的位置与所述打点文字合并。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京新唐思创教育科技有限公司,未经北京新唐思创教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110668121.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:热采井口装置
- 下一篇:一种声回波到达时刻检测装置及方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置