[发明专利]一种段落分割方法和装置有效
申请号: | 201810961760.7 | 申请日: | 2018-08-22 |
公开(公告)号: | CN109241526B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 任灿 | 申请(专利权)人: | 北京慕华信息科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06F16/35;G10L15/04 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 徐丽 |
地址: | 100083 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种段落分割方法和装置,其中,段落分割方法包括:获取待分割音视频文件的文本内容中包括各个句子的句子向量;根据各个句子的时间序列,获取各个句子的语速信息;根据该句子的语速信息,以及与其相邻的下个句子的语速信息,计算该句子的语速相关性系数;根据目标特征权重和语速相关性系数,计算拼接元素;将拼接元素和该句子的句子向量中的元素进行拼接,生成该句子的语速上下文向量;基于各个语速上下文向量之间的距离对句子进行分类,得到段落分割结果。该段落分割方法,能够充分利用音视频中发言者的语速对段落分割的影响,解决了现有技术中单纯借助文本的内容使得段落分割结果杂乱无章的问题,使得段落分割结果更加准确。 | ||
搜索关键词: | 一种 段落 分割 方法 装置 | ||
【主权项】:
1.一种段落分割方法,其特征在于,包括:获取待分割音视频文件的文本内容中包括的除最末的一个句子以外的其它各个句子分别对应的句子向量;根据所述待分割音视频文件的文本内容中各个句子的时间序列,获取各个句子分别对应的语速信息;针对除最末的一个句子以外的其它每个句子,根据该句子的语速信息,以及与该句子相邻的下一个句子的语速信息,计算该句子在至少一个相关性特征下的语速相关性系数;根据与每个相关性特征对应的目标特征权重,以及与该相关性特征对应的语速相关性系数,计算与每个相关性特征对应的拼接元素;将所述拼接元素以及所述该句子的句子向量中的元素进行拼接,生成该句子的语速上下文向量;基于每个句子的语速上下文向量之间的距离对所述句子进行分类,得到待分割音视频文件的段落分割结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京慕华信息科技有限公司,未经北京慕华信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810961760.7/,转载请声明来源钻瓜专利网。