[发明专利]一种口语转换为书面语的方法和装置有效
申请号: | 201510088855.9 | 申请日: | 2015-02-26 |
公开(公告)号: | CN104731775B | 公开(公告)日: | 2017-11-14 |
发明(设计)人: | 刘伟权;杨立波;李健;张连毅;武卫东 | 申请(专利权)人: | 北京捷通华声语音技术有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 刘祥景 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 口语 转换 书面语 方法 装置 | ||
1.一种口语转换为书面语的方法,其特征在于,所述方法包括:
依据翻译模型中的转换概率参数和对齐概率参数以及语言模型,对经过预处理的口语语句进行搜索解码,得到相应的最优解码结果;其中,所述翻译模型和语言模型为依据包括口语语句和书面语语句的对照语料库训练所得;
将所述口语语句对应的最优解码结果作为书面语语句进行输出;
所述依据翻译模型中的转换概率参数和对齐概率参数以及语言模型,对经过预处理的口语语句进行搜索解码,得到相应的最优解码结果的步骤,包括:
依据翻译模型中的转换概率参数和对齐概率参数以及语言模型,对所述口语语句包含的所有口语词汇进行启发式搜索解码,生成相应的多个书面语结果假设;
依据启发式函数计算每个书面语结果假设的转换得分,并确定转换得分最高的书面语结果假设为最优解码结果;
所述启发式函数具体为所述口语语句对所述书面语结果假设的贡献参数与目标书面语词汇的合理性参数的乘积;其中,所述口语语句对所述书面语结果假设的贡献参数为依据所述口语语句到书面语语句的转换概率参数与所述口语语句到书面语语句的对齐概率参数计算得到;所述合理性参数为其中ei为句长为l的书面语结果假设中第i个书面语词汇;
所述依据启发式函数计算每个书面语结果假设的转换得分,确定转换得分最高的书面语结果假设为最优解码结果的步骤,包括:
将所述多个书面语结果假设存入预设的栈容器中;
从所述栈容器中取出转换得分最高的书面语结果假设;
判断在取出转换得分最高的书面语结果假设时,当前口语词汇是否为最后一个口语词汇,若是,则终止所述启发式搜索解码;若不是,则继续对下一个口语词汇进行启发式搜索解码。
2.如权利要求1所述的方法,其特征在于,所述最优解码结果具体为:将所述口语语句以最大概率转换为书面语语句的解码结果。
3.一种翻译模型的训练方法,其特征在于,所述方法包括:
收集对照语料库;所述语料库包括口语语句和书面语语句的对照语料;其中,所述口语语句包括多个口语词汇文本,所述书面语语句包括多个书面语词汇文本;
依据所述对照语料以及所述口语词汇文本和书面语词汇文本之间的对齐关系训练翻译模型,得到翻译模型中的转换概率参数和对齐概率参数、及以转换概率参数和对齐概率参数为自变量的翻译模型;
所述口语词汇文本和书面语词汇文本之间的对齐关系包括:
每个口语词汇文本对应且仅对应一个书面语词汇文本;
多个口语词汇文本对应同一个书面语词汇文本;
在不存在与当前口语词汇文本相对应的书面语文本时,则记当前口语词汇文本对应的书面语文本为空。
4.如权利要3所述的方法,其特征在于,所述依据所述对照语料以及所述口语词汇文本和书面语词汇文本之间的对齐关系训练翻译模型,得到翻译模型中的转换概率参数和对齐概率参数、及以转换概率参数和对齐概率参数为自变量的翻译模型的步骤,包括:
初始化所述对照语料中每个口语词汇文本对应书面语词汇文本的转换概率参数和对齐概率参数;
利用最大似然估计算法,依据所述对照语料以及所述口语词汇文本和书面语词汇文本之间的对齐关系对所述转换概率参数和对齐概率参数进行迭代计算,直到所有的转换概率参数和对齐概率参数都收敛为止;
确定以所述收敛的转换概率参数和对齐概率参数为自变量的翻译模型。
5.如权利要求4所述的方法,其特征在于,所述利用最大似然估计算法,依据所述对照语料以及所述口语词汇文本和书面语词汇文本之间的对齐关系对所述转换概率参数和对齐概率参数进行迭代计算,直到所有的转换概率参数和对齐概率参数都收敛为止的步骤,包括:
遍历所述对照语料中的所有口语语句、书面语语句、口语词汇文本、以及书面语词汇文本,通过第一对齐参数、第二对齐参数、第三对齐参数以及语句长度参数对所述转换概率参数和对齐概率参数进行迭代计算,直到所有的转换概率参数和对齐概率参数都收敛为止;
其中,所述第一对齐参数为所述对照语料中口语词汇文本与书面语词汇文本对齐的次数;
所述第二对齐参数为所述对照语料中口语词汇文本与任意一个书面语词汇文本对齐的次数;
所述第三对齐参数为预置长度的口语语句和书面语语句中,某个口语词汇文本与书面语词汇文本对齐的次数;
所述语句长度参数为口语语句与书面语语句的长度为预置长度的次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声语音技术有限公司,未经北京捷通华声语音技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510088855.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:视觉搜索方法、系统以及移动终端
- 下一篇:天然气管网仿真方法和装置