[发明专利]应答的方法、装置、存储介质及电子设备有效
申请号: | 201811613083.6 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109815322B | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 董超 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 张岩龙;魏嘉熹 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应答 方法 装置 存储 介质 电子设备 | ||
1.一种应答的方法,其特征在于,包括:
获取待应答的目标输入文本,并对所述目标输入文本进行分词得到多个第一目标词语;
获取预先建立的语义识别数据库,以及预先训练的语境识别模型;
根据多个所述第一目标词语通过所述语义识别数据库确定所述目标输入文本的第一待确定应答文本;
根据多个所述第一目标词语和所述第一待确定应答文本通过所述语境识别模型,得到所述目标输入文本的第二待确定应答文本;
根据多个所述第一目标词语计算所述第一待确定应答文本与所述目标输入文本的第一关联参数,以及所述第二待确定应答文本与所述目标输入文本的第二关联参数;
根据所述第一关联参数和所述第二关联参数,从所述第一待确定应答文本和所述第二待确定应答文本中确定目标应答文本。
2.根据权利要求1所述的方法,其特征在于,所述语义识别数据库包括:至少一个样本输入文本,对每个所述样本输入文本分词后得到的样本词语以及每个所述样本输入文本对应的样本应答文本,所述根据多个所述第一目标词语通过所述语义识别数据库确定所述目标输入文本的第一待确定应答文本包括:
根据多个所述第一目标词语通过所述语义识别数据库确定所述目标输入文本与每个所述样本输入文本的相似度;
从所述样本输入文本中确定所述相似度最大的输入文本为相似输入文本;
将所述相似输入文本对应的样本应答文本作为所述第一待确定应答文本。
3.根据权利要求2所述的方法,其特征在于,所述语义识别数据库还包括:每个所述样本词语对应的识别权重,所述根据多个所述第一目标词语通过所述语义识别数据库确定所述目标输入文本与每个所述样本输入文本的相似度包括:
从所述语义识别数据库中确定每个所述样本输入文本的多个所述第一目标词语分别对应的识别权重;
将每个所述样本输入文本中所述第一目标词语对应的识别权重相加得到所述相似度。
4.根据权利要求3所述的方法,其特征在于,在获取预先建立的语义识别数据库前,所述方法还包括:
获取至少一个样本输入文本,以及每个所述样本输入文本对应的样本应答文本;
对所述样本输入文本进行分词得到所述样本词语,并计算每个所述样本词语在全部所述样本输入文本中的出现频率;
根据所述出现频率确定每个所述样本词语对应的识别权重;
根据所述样本输入文本、以及每个所述样本输入文本对应的所述样本应答文本、所述样本词语以及所述识别权重,得到所述语义识别数据库。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述语境识别模型包括编码-解码模型,所述编码-解码模型包括编码子模型和解码子模型;所述根据多个所述第一目标词语和所述第一待确定应答文本通过所述语境识别模型,得到所述目标输入文本的第二待确定应答文本包括:
对所述第一待确定应答文本进行分词得到第二目标词语;
将所述第一目标词语进行向量转换得到第一词向量,并将所述第一词向量输入所述编码子模型得到所述目标输入文本对应的第一编码向量;
将所述第二目标词语进行向量转换得到第二词向量,并将所述第二词向量输入所述编码子模型得到所述第一待确定应答文本对应的第二编码向量;
根据所述第一编码向量和所述第二编码向量得到目标编码向量;
将所述目标编码向量输入所述解码子模型得到应答向量,并根据所述应答向量得到所述第二待确定应答文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811613083.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:问答方法、装置、设备及存储介质
- 下一篇:一种人机交互训练问答生成算法