[发明专利]一种长篇幅语音全自动切分方法有效

申请号：	201310280159.9	申请日：	2013-07-05
公开（公告）号：	CN103345922A	公开（公告）日：	2013-10-09
发明（设计）人：	张巍;王永远;张志楠	申请（专利权）人：	张巍
主分类号：	G10L15/04	分类号：	G10L15/04
代理公司：	暂无信息	代理人：	暂无信息
地址：	266100 山东省青岛市中***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种长篇幅语音全自动切分方法，是一种具有更高准确度的无标注的句子自动切分算法，该算法将基于HMM的Force-alignment无监督算法和半监督学习方法相融合，并通过建立一种基于时间轴的迭代机制，利用半监督学习极小化标注的句子切分算法对无标注的句子切分算法所提供的少量精确标注集进行自动扩充，以达到最大化精确标注集合的目的，进而再依据得到的正确的句点将原始篇幅语音切分成更小的段落或是句子的集合。本发明将HMM下的Force-aligned和半监督学习中的Co_training方法融合在一起，保证了在对篇幅语音进行句子切分的过程中，无需人工干预并且有着较高的切分准确率。可以应用于语音语料库的快速自动构建。
搜索关键词：	一种篇幅语音全自动切分方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种长篇幅语音全自动切分方法，其特征在于，包括以下步骤：(1)先由ZLSS方法提供精确的标注句点的时间数据，再由HashMap追踪查找机制按照时间轴的对应关系，将其和MLSS算法的输入对应；(2)由边界特征抽取程序，利用上述已经对应的好的时间数据，将对应的数据帧特征从原始文件中抽取出来，为做Co_training的分类迭代做准备；(3)将上面抽取得来的正确句点位置的边界特征信息加入MLSS的训练集，做Co_training，进一步分类得到新的句点；(4)分类结果只给出了对应句点位置的起始帧和结束帧，还要进一步经过转换程序，将其对应到与ZLSS一致的时间轴上来，再转到下一步骤操作；(5)做一次判断，看是否本次的迭代过程找到了新的句点，如没有找到，则整个迭代过程结束，若找到了新的句点，则进行下一步；(6)得到转换程序输出的时间点信息之后，再利用ZLSS提供的切分方法，将当前篇幅语音和文本进一步切分成更小更多的段落或句子，并将结果替换上一次迭代的初始语音和文本集；(7)重复执行以上步骤。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于张巍，未经张巍许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310280159.9/，转载请声明来源钻瓜专利网。

上一篇：一种聚光光伏电池片不挂尘真空吸笔
下一篇：中控主机与无线设备之间的无线编码对接方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种长篇幅语音全自动切分方法有效

专利文献下载