[发明专利]基于人工智能的语言转换处理方法、装置及终端有效
申请号: | 201710336033.7 | 申请日: | 2017-05-12 |
公开(公告)号: | CN107193807B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 赵世奇 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/44 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 语言 转换 处理 方法 装置 终端 | ||
1.一种基于人工智能的语言转换处理方法,其特征在于,包括以下步骤:
接收语言转换请求,所述请求中包括待转换的语句,且所述待转换的语句中包括源语言词语及目标语言词语;
根据预设的规则,确定与所述源语言词语对应的各候选词语;
确定所述各候选词语,分别在所述待转换的语句中对应的各分值;
根据所述各候选词语分别对应的各分值,确定与所述源语言词语对应的目标词语;
所述确定所述各候选词语,分别在所述待转换的语句中对应的各分值,包括:
确定所述源语言词语与第一候选词语的第一对齐概率;
根据所述第一候选词语在目标领域中的第一语言模型,确定所述第一候选词语在所述待转换的语句中的第一分值,其中,所述目标领域为所述待转换的语句所属的领域;
根据所述第一对齐概率和所述第一分值,确定所述候选词语在所述待转换的语句中对应的分值。
2.如权利要求1所述的方法,其特征在于,所述待转换的语句中包括的源语言词语与目标语言词语的比例,小于第一阈值。
3.如权利要求1所述的方法,其特征在于,还包括:
根据所述待转换的语句包括的各类型语言的词语数量,确定源语言词语及目标语言词语。
4.如权利要求1所述的方法,其特征在于,所述根据预设的规则,确定与所述源语言词语对应的各候选词语,包括:
根据预设的语言对齐模型,确定与所述源语言词语对应的各候选词语;
或者,
根据语言模型,确定与所述源语言词语对应的各候选词语。
5.如权利要求4所述的方法,其特征在于,所述根据预设的语言对齐模型,确定与所述源语言词语对应的各候选词语之前,还包括:
获取所述源语言词语与所述目标语言词语,在通用领域中的平行语料;
对所述平行语料进行训练,确定与所述源语言词语对应的对齐模型。
6.如权利要求4所述的方法,其特征在于,所述根据预设的语言对齐模型,确定与所述源语言词语对应的各候选词语,包括:
根据预设的语言对齐模型,确定与所述源语言词语的对齐概率大于第二阈值的词语为候选词语。
7.如权利要求4所述的方法,其特征在于,所述根据语言模型,确定与所述源语言词语对应的各候选词语,包括:
确定所述源语言词语在目标领域中对应的各目标语言类型词语;
根据所述各目标语言类型词语,在目标领域中的语言模型,确定与所述源语言词语对应的各候选词语。
8.如权利要求1所述的方法,其特征在于,所述根据所述第一对齐概率和所述第一分值,确定所述候选词语在所述待转换的语句中对应的分值,包括:
根据第i个源语言词语与第j个候选词的对齐概率、预设参数及第j个候选词在所述待转换的语句中所属的目标领域中的分值,确定第i个源语言词语对应的第j个候选词在待转换的语句中的分值;
其中,所述第j个候选词在所述待转换的语句中所属的目标领域中的分值,是根据所述第j个候选词在所述待转换的语句所属的目标领域中的语言模型确定的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710336033.7/1.html,转载请声明来源钻瓜专利网。