[发明专利]一种语音处理方法和装置有效
申请号: | 201610211171.8 | 申请日: | 2016-04-06 |
公开(公告)号: | CN107293285B | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 康洪;傅华;曾侃;温建军 | 申请(专利权)人: | 中国移动通信集团四川有限公司 |
主分类号: | G10L13/06 | 分类号: | G10L13/06;G10L15/26;G10L15/16;G06N3/04;G06N3/08 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张颖玲;蒋雅洁 |
地址: | 610041 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 装置 | ||
1.一种语音处理方法,其特征在于,所述方法包括:按预设业务类型对各标准业务文本进行分类,确定各标准业务文本的业务类型;所述方法还包括:
识别获取的语音,并转换成文本;确定转换后文本的各基本语言单位、以及所述各基本语言单位的语言功能类别;
采用向量空间模型确定所述各基本语言单位对应的权值向量组成的权值向量矩阵;
根据所述各标准业务文本及其业务类型、和所述权值向量矩阵,确定所述权值向量矩阵中所述各权值向量对应的基本语言单位的业务类型;
根据所述各基本语言单位的业务类型和语言功能类别,将所述各基本语言单位组成输出文本,并对所述输出文本进行后处理;
其中,所述根据所述各基本语言单位的业务类型和语言功能类别,将所述各基本语言单位组成输出文本,并对所述输出文本进行后处理,包括:
预设对不同业务类型和语言功能类别的基本语言单位处理方法,对所述各基本语言单位进行屏蔽、和/或修正、和/或保持处理;
将处理完成的所述各基本语言单位组成所述输出文本,根据所述业务类型和所述语言功能类别对所述输出文本进行进一步处理。
2.根据权利要求1所述的方法,其特征在于,所述确定转换后文本的各基本语言单位,包括:通过文本分词,确定所述转换后文本的字、和/或词、和/或短语、和/或短句。
3.根据权利要求1所述的方法,其特征在于,所述根据所述各标准业务文本及其业务类型、和所述权值向量矩阵,确定所述权值向量矩阵中所述各权值向量对应的基本语言单位的业务类型,包括:
采用学习向量量化LVQ神经网络分析所述权值向量矩阵;
采用向量空间模型确定所述各标准业务文本的权值向量,并将所述各分类的标准业务文本的权值向量确定为所述LVQ神经网络的隐含层神经元的权值向量;
根据所述各标准业务文本的业务类型,预先确定胜出神经元对应的业务类型;
将所述向量矩阵设置为所述LVQ神经网络的输入向量,确定所述权值向量矩阵中各权值向量对应的业务类型;
根据所述权值向量矩阵中各权值向量对应的业务类型,确定所述各权值向量对应的所述各基本语言单位的业务类型。
4.根据权利要求1所述的方法,其特征在于,所述将所述各基本语言单位组成输出文本,包括:
根据业务类型和语言功能类别,对所述各基本语言单位进行屏蔽、和/或修正、和/或保持处理,并将处理完成的所述各基本语言单位组成输出文本。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述对所述输出文本进行后处理,包括:
将所述输出文本转换成语音;和/或,
根据所述输出文本进行知识库检索;和/或,
对所述输出文本中的具体业务内容进行具体业务办理;和/或,
对所述输出文本进行质检。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述按预设业务类型对各标准业务文本进行分类,包括:按非法业务和合法业务对各标准业务文本进行分类;
所述语言功能类别,包括:具体业务内容、和/或惯用词、和/或中性名词、和/或语气词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团四川有限公司,未经中国移动通信集团四川有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610211171.8/1.html,转载请声明来源钻瓜专利网。