[发明专利]基于人工智能的信息输出方法和装置有效
申请号: | 201711078680.9 | 申请日: | 2017-11-06 |
公开(公告)号: | CN107861954B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 朱晓宁;何中军;吴华;王海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/44;G06F40/56 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 信息 输出 方法 装置 | ||
1.一种基于人工智能的信息输出方法,包括:
接收待翻译的源语句并输入第一机器翻译模型,得到目标语句,其中,所述第一机器翻译模型用于表征第一自然语言的源语句与第二自然语言的目标语句的对应关系;
将所述源语句和所述目标语句输入改写判定模型,输出所述源语句的类别,其中,所述改写判定模型用于表征源语句、目标语句以及源语句的类别的对应关系,所述类别包括改写和不改写;
若所述类别为改写,则通过所述源语句查询改写规则表,得到改写后的源语句,其中,所述改写规则表用于表征源语句与改写后的源语句的对应关系,再将所述改写后的源语句输入所述第一机器翻译模型,得到与所述改写后的源语句对应的最终目标语句作为翻译结果输出。
2.根据权利要求1所述的方法,其中,所述方法还包括:
获取至少一个语句组合,其中,所述至少一个语句组合中每个语句组合包括第一源语句和第一目标语句;
对于所述至少一个语句组合中每个语句组合的第一源语句,将该第一源语句输入所述第一机器翻译模型,得到第二目标语句;
对于所述至少一个语句组合中每个语句组合的第一目标语句,将该第一目标语句输入第二机器翻译模型,得到第二源语句,并将该第二源语句输入所述第一机器翻译模型,得到第三目标语句,其中,所述第二机器翻译模型用于表征所述第二自然语言的目标语句与所述第一自然语言的源语句的对应关系;
对于所述至少一个语句组合中每个语句组合,确定该语句组合对应的第一目标语句与第二目标语句之间的第一相似度,以及该语句组合对应的第一目标语句与第三目标语句之间的第二相似度,若所述第二相似度大于所述第一相似度,则根据该语句组合中的第一源语句和第二源语句生成改写源语句组合。
3.根据权利要求2所述的方法,其中,所述改写规则表通过如下步骤生成:
获取至少一个改写源语句组合,其中,所述至少一个改写源语句组合中每个改写源语句组合包括第一源语句和第二源语句;
对于所述至少一个源语句组合改写源语句组合中每个源语句组合改写源语句组合,对该源语句组合改写源语句组合中的第一源语句进行分词得到第一词语集合,并对该源语句组合改写源语句组合中的第二源语句进行分词得到第二词语集合,将所述第一词语集合中的第一词语和所述第二词语集合中的第二词语进行语义对齐,生成至少一个对齐词语组合,从所述至少一个对齐词语组合中提取第一词语和第二词语不同的对齐词语组合作为改写词语组合;
根据所述至少一个改写源语句组合对应的每个改写词语组合生成改写词语组合集合,并确定每个改写词语组合在所述改写词语组合集合中出现的概率;
按照概率由大到小的顺序根据所述改写词语组合集合生成改写规则表。
4.根据权利要求3所述的方法,其中,所述按照概率由大到小的顺序根据所述改写词语组合集合生成改写规则表,包括:
确定所述改写词语组合集合中每个改写词语组合对应的第二源语句与所述第一自然语言的语法规则的匹配度,并根据所述匹配度修正每个改写词语组合在所述改写词语组合集合中出现的概率;
按照修正后的概率由大到小的顺序根据所述改写词语组合集合生成改写规则表。
5.根据权利要求3或4所述的方法,其中,所述通过所述源语句查询改写规则表,得到改写后的源语句,包括:
查询所述改写规则表中与所述源语句对应的概率最高的源语句作为改写后的源语句。
6.根据权利要求2所述的方法,其中,所述改写判定模型通过如下步骤生成:
将第二相似度大于第一相似度的第一目标语句和第一源语句作为正样本,并将第二相似度小于等于第一相似度的第一目标语句和第一源语句作为负样本;
通过所述正样本和所述负样本训练神经网络分类器作为改写判定模型。
7.根据权利要求2-4之一所述的方法,其中,所述第二机器翻译模型的训练采用了所述第一自然语言的词库和所述第二自然语言的词库,并且所述第一自然语言的词库中词语数量小于所述第二自然语言的词库中词语数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711078680.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种名称自动翻译系统及方法
- 下一篇:一种翻译方法和移动终端
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置