[发明专利]语音语料库的构建方法和系统有效
申请号: | 201310116396.1 | 申请日: | 2013-04-03 |
公开(公告)号: | CN103198828A | 公开(公告)日: | 2013-07-10 |
发明(设计)人: | 江南;陈德全 | 申请(专利权)人: | 中金数据系统有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/30 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 寇海侠 |
地址: | 100176 北京市大*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 语料库 构建 方法 系统 | ||
1.一种语音语料库的构建系统,其特征在于:包括,
语音录入客户端,其进一步包括:
声音采集装置,采集基于话术录入的语音作为基础语音语料,并将采集得到的所述基础语音语料和对应的所述话术传输给网络发送装置;
网络发送装置,接收所述声音采集装置采集的基础语音语料并将所述基础语音语料和对应的所述话术通过网络传输给服务器;
服务器,接收所述网络发送装置发送的基础语音语料和对应的所述话术并存储至语料库。
2.根据权利要求1所述的一种语音语料库的构建系统,其特征在于:还包括实际场景语音语料采集装置,用于采集实际应用场景中产生的语音语料,并将采集得到的实际场景语音语料进行识别并将实际场景语音语料和识别结果传输至所述服务器的临时语料库。
3.根据权利要求2所述的一种语音语料库的构建系统,其特征在于:还包括对所述临时语料库存储的实际场景语音语料进行在线标注的标注用客户端。
4.根据权利要求3所述的一种语音语料库的构建系统,其特征在于:所述标注用客户端进一步包括,
实际场景语音语料获取装置,获取所述实际场景语音语料和对应的识别结果文件,并传送至第一语音标注装置;
第一语音标注装置,接收所述实际场景语音语料获取装置传输的所述实际场景语音语料和其语音识别结果,在线调听所述实际场景语音语料,并判断在线调听的所述实际场景语音语料的语音识别结果是否正确,若正确,则标注为正确,并将标注结果发送给所述服务器的接收装置;否则,标注为错误,将标注结果发送给所述服务器的接收装置;
第二语音标注装置,获取服务器传输的语音文件,调听所述语音文件,并根据调听结果生成所述语音文件的识别结果,将所述识别结果与所述语音文件发送至所述服务器的语料库;
其中,所述标注结果包括:录音文件的唯一标识、起止时间和正确或错误的标识;
服务器,其进一步包括:
接收装置,接收所述第一语音标注装置发送的标注结果,将标注为正确的所述实际场景语音语料和其语音识别结果存储至所述服务器中的所述语料库中;同时,将标注为错误的所述实际场景语音语料发送至切分装置;
切分装置,接收所述接收装置发送的所述实际场景语音语料,将标注为错误的所述语音段落从所述实际场景语音语料中切分,并将切分出的所述语音文件发送至客户端的第二语音标注装置。
5.根据权利要求4所述的一种语音语料库的构建系统,其特征在于:所述切分装置为基于白高斯模型的切分装置。
6.一种基于权利要求1-5任一所述的一种语音语料库的构建系统的语音语料库的构建方法,其特征在于:包括如下步骤,
S01:声音采集装置录入语音信息形成基础语音语料并传输给网络发送装置;
S02:所述网络发送装置将从所述语音录入客户端接收到的所述基础语音语料发送给服务器;
S03:所述服务器接收所述网络发送装置发送的基础语音语料并存储至语料库。
7.根据权利要求6所述的一种语音语料库的构建方法,其特征在于:还包括采集实际场景语音语料,并将采集到的所述实际场景语音语料行识别并将实际场景语音语料和识别结果传输至所述服务器的临时语料库的步骤。
8.根据权利要求7所述的一种语音语料库的构建方法,其特征在于:还包括对所述临时语料库存储的实际场景语音语料进行在线标注的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中金数据系统有限公司,未经中金数据系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310116396.1/1.html,转载请声明来源钻瓜专利网。