[发明专利]将书面文本转换为口语文本的方法及系统有效
申请号: | 201710987858.5 | 申请日: | 2017-10-21 |
公开(公告)号: | CN107844480B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 周明;江源;胡国平;胡郁 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/40 | 分类号: | G06F40/40;G06F40/289 |
代理公司: | 北京华圣典睿知识产权代理有限公司 11510 | 代理人: | 陈国伟 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 书面 文本 转换 口语 方法 系统 | ||
1.一种将书面文本转换为口语文本的方法,其特征在于,所述方法包括:
接收待转换的源文本数据;
对所述源文本数据进行分词及向量化处理,得到每句源文本数据的词向量序列;
依次将每句源文本数据的词向量序列输入预先通过收集书面语文本数据及与其对应的口语化本数据构建的文本转换模型,根据所述文本转换模型的输出得到所述源文本数据对应的目标文本数据;所述文本转换模型包括编码网络和解码网络,在训练过程中利用所述书面语文本数据输入所述编码网络后,所述解码网络输出的目标文本序列与所述书面语文本数据对应的口语化文本数据之间的差值对模型参数进行更新;在所述目标文本数据中插入副语言信息,得到带有副语言信息的口语化文本数据。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述文本转换模型的构建过程包括:
确定文本转换模型的拓扑结构,所述拓扑结构包括编码网络和解码网络,所述编码网络的输入为词向量序列、输出为词编码向量;所述解码网络的输入为所述编码网络输出的词编码向量及当前待转换词之前的历史词向量、输出为目标文本序列;
收集大量文本数据,所述文本数据包括书面语文本数据及与其对应的口语化文本数据;
对所述书面语文本数据进行分词及向量化处理,得到每句书面语文本数据的词向量序列;
根据所述词向量序列及对应的目标文本数据训练模型参数,在训练过程中依次将每句源文本数据的词向量序列输入所述编码网络,利用所述解码网络输出的目标文本序列与所述源文本数据对应的目标文本数据之间的差值对模型参数进行更新;并在训练结束后,得到模型参数。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述目标文本数据中插入副语言信息之前,确定所述目标文本数据是否需要进行词序调整;
如果需要,则对所述目标文本数据进行词序调整。
4.根据权利要求3所述的方法,其特征在于,所述确定所述目标文本数据是否需要进行词序调整包括:
计算所述目标文本数据的语言模型得分;
如果所述得分低于设定阈值,则根据预先构建的词序调整判断模型依次判断所述目标文本数据中相邻词的词序是否需要调整。
5.根据权利要求4所述的方法,其特征在于,所述根据预先构建的词序调整判断模型依次判断所述目标文本数据中相邻词的词序是否需要调整包括:
依次将所述目标文本数据中的各词作为当前待判断词,将所述当前待判断词及其上下文信息输入所述词序调整判断模型,根据所述词序调整判断模型的输出确定是否对当前待判断词及其相邻词的词序进行调整。
6.根据权利要求5所述的方法,其特征在于,所述待判断词的上下文信息包括以下任意一项或多项:所述待判断词的前、后一个或多个词,所述待判断词所属句子的语义信息,所述待判断词所属句子的语言模型得分。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述在所述目标文本数据中插入副语言信息包括:
将所述目标文本数据的词序列输入预先构建的位置预测模型,根据所述位置预测模型的输出确定每种副语言信息的插入位置;
在每种副语言信息的插入位置插入对应的副语言信息。
8.根据权利要求7所述的方法,其特征在于,所述位置预测模型的输出为:副语言信息的类型和位置,或者副语言信息的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710987858.5/1.html,转载请声明来源钻瓜专利网。