[发明专利]一种口语转换为书面语的方法和装置有效
申请号: | 201510088855.9 | 申请日: | 2015-02-26 |
公开(公告)号: | CN104731775B | 公开(公告)日: | 2017-11-14 |
发明(设计)人: | 刘伟权;杨立波;李健;张连毅;武卫东 | 申请(专利权)人: | 北京捷通华声语音技术有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 刘祥景 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种口语转换为书面语的方法和装置、以及一种翻译模型的训练方法和装置,其中,所述口语转换为书面语的方法,具体包括依据翻译模型中的转换概率参数和对齐概率参数以及语言模型,对经过预处理的口语语句进行搜索解码,得到相应的最优解码结果;其中,所述翻译模型和语言模型为依据包括口语语句和书面语语句的对照语料库训练所得;将所述口语语句对应的最优解码结果作为书面语语句进行输出。本发明能够使得智能客服系统准确理解用户提出的口语化问题,从而可以提高智能客服系统应答的准确率。 | ||
搜索关键词: | 一种 口语 转换 书面语 方法 装置 | ||
【主权项】:
一种口语转换为书面语的方法,其特征在于,所述方法包括:依据翻译模型中的转换概率参数和对齐概率参数以及语言模型,对经过预处理的口语语句进行搜索解码,得到相应的最优解码结果;其中,所述翻译模型和语言模型为依据包括口语语句和书面语语句的对照语料库训练所得;将所述口语语句对应的最优解码结果作为书面语语句进行输出;所述依据翻译模型中的转换概率参数和对齐概率参数以及语言模型,对经过预处理的口语语句进行搜索解码,得到相应的最优解码结果的步骤,包括:依据翻译模型中的转换概率参数和对齐概率参数以及语言模型,对所述口语语句包含的所有口语词汇进行启发式搜索解码,生成相应的多个书面语结果假设;依据启发式函数计算每个书面语结果假设的转换得分,并确定转换得分最高的书面语结果假设为最优解码结果;所述启发式函数具体为所述口语语句对所述书面语结果假设的贡献参数与目标书面语词汇的合理性参数的乘积;其中,所述口语语句对所述书面语结果假设的贡献参数为依据所述口语语句到书面语语句的转换概率参数与所述口语语句到书面语语句的对齐概率参数计算得到;所述合理性参数为其中ei为句长为l的书面语结果假设中第i个书面语词汇;所述依据启发式函数计算每个书面语结果假设的转换得分,确定转换得分最高的书面语结果假设为最优解码结果的步骤,包括:将所述多个书面语结果假设存入预设的栈容器中;从所述栈容器中取出转换得分最高的书面语结果假设;判断在取出转换得分最高的书面语结果假设时,当前口语词汇是否为最后一个口语词汇,若是,则终止所述启发式搜索解码;若不是,则继续对下一个口语词汇进行启发式搜索解码。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声语音技术有限公司,未经北京捷通华声语音技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510088855.9/,转载请声明来源钻瓜专利网。
- 上一篇:视觉搜索方法、系统以及移动终端
- 下一篇:天然气管网仿真方法和装置