[发明专利]一种融合闲聊和常识的多技能任务型对话系统构建方法有效

专利信息
申请号: 202111334457.2 申请日: 2021-11-11
公开(公告)号: CN114153955B 公开(公告)日: 2023-04-07
发明(设计)人: 陈楷;熊京萍;廖奇;王辉 申请(专利权)人: 科讯嘉联信息技术有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F40/216;G06F40/284;G06F40/295;G06F40/35;G06N3/047;G06N3/048;G06N3/08
代理公司: 北京辰权知识产权代理有限公司 11619 代理人: 付婧
地址: 230000 安徽省合肥市中国(安徽)自由贸易试验区合肥市高*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 融合 闲聊 常识 技能 任务 对话 系统 构建 方法
【权利要求书】:

1.一种融合闲聊和常识的多技能任务型对话系统构建方法,其特征在于:包括以下步骤:

S1、收集大规模开源的中文闲聊语料,将相邻对话作为闲聊语料对,并构建闲聊模型;

S2、收集大规模各领域的常识问答语料以及三元组数据,构建知识图谱,基于常识问答语料训练相似度打分模型;

S3、对原始问题进行处理得到候选实体集合,从知识图谱中获取相关两跳关系内所有出度和入度的关系,并得到最终候选实体;

S4、利用最终候选实体筛选出实体关系路径,并对实体关系路径进行优选得到最终路径,基于最终路径从知识图谱中查询常识答案,完成常识对话模型的构建;

S5、分析任务对话语料,抽象出固定的本体数据存入数据库中,在会话级别构建任务对话模型;

S6、利用常识推理和任务对话语料训练生成话题判别模型;

其中,S1中收集大规模开源的中文闲聊语料,将相邻对话作为闲聊语料对,并构建闲聊模型,包括:

收集大规模开源的中文闲聊语料,对中文闲聊语料进行噪声清洗和质量检查,剔除敏感主题样本,将相邻对话的上文作为问题query,下文作为回答Answer,并利用对话神经网络训练一个生成式的闲聊模型;

S2中收集大规模各领域的常识问答语料以及三元组数据,构建知识图谱,基于常识问答语料训练相似度打分模型,包括:

利用三元组数据扩展常识问答语料的多样性,同时对三元组数据进行清洗和预处理操作,存入neo4j数据库中构建知识图谱,基于常识问答语料训练SimCSE-RoBerta相似度打分模型。

2.根据权利要求1所述的融合闲聊和常识的多技能任务型对话系统构建方法,其特征在于:S4中利用最终候选实体筛选出实体关系路径,并对实体关系路径进行优选得到最终路径,基于最终路径从知识图谱中查询常识答案,包括:

将最终候选实体分别与对应两跳关系内所有出度和入度的关系拼接成完整句子,利用相似度打分模型分别计算原始问题与每个完整句子之间的相似度,并筛选出实体关系路径;

对每条实体关系路径与原始问题进行打分,选取得分最高的实体关系路径作为最终路径,基于最终路径从知识图谱中查询常识答案。

3.根据权利要求2所述的融合闲聊和常识的多技能任务型对话系统构建方法,其特征在于:所述将最终候选实体分别与对应两跳关系内所有出度和入度的关系拼接成完整句子,包括:

所有最终候选实体对应拼接成的完整句子有:

其中,代表入度中所有关系及第i个最终候选实体组成的句子,Ii为第i个输入的最终候选实体,Rr1为两跳关系内的入度关系,Tr1为两跳关系内的入度实体,代表出度中所有关系及第i个最终候选实体组成的句子,Rr2为两跳关系内的出度关系,Tr2为两跳关系内的出度实体,M为最终候选实体的个数,R表示关系总数,E表示实体总数,i表示最终候选标识,r1表示入度关系数,e1表示入度实体数,r2表示出度关系数,e2表示出度实体数。

4.根据权利要求2所述的融合闲聊和常识的多技能任务型对话系统构建方法,其特征在于:所述利用相似度打分模型分别计算原始问题与每个完整句子之间的相似度,并筛选出实体关系路径,包括:

让原始问题和完整句子分别经过相似度打分模型,取最后一层N维特征向量相加,再拼接上最后一层N维特征向量差分形成的3*N向量,经过两层全连接层后输出,最后利用softmax函数进行打分,筛选出分数最高的预设个数的完整句子对应的实体关系路径。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科讯嘉联信息技术有限公司,未经科讯嘉联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111334457.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top