[发明专利]基于知识图谱的生成式问题推荐方法、设备、介质及系统在审
申请号: | 202211161774.3 | 申请日: | 2022-09-23 |
公开(公告)号: | CN116150315A | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 雋兆波;陈莹;何健军;代翔;李春豹;丁洪丽 | 申请(专利权)人: | 中国电子科技集团公司第十研究所 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/35;G06F16/36;G06F40/295;G06N3/045;G06N3/0442;G06N7/01 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 周浩杰 |
地址: | 610000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 生成 问题 推荐 方法 设备 介质 系统 | ||
本发明公开一种基于知识图谱的生成式问题推荐方法、设备、介质及系统,属于自然语言处理分析领域领域,包括步骤:S1,数据准备;S2,构建实体辅助Elasticsearch数据库;S3,基于Bert‑BILSTM‑CRF模型提取问题中实体;S4,基于NeZha+UniLM模型进行问题生成;S5,根据生成问题进行问题推荐。本发明解决推荐数据稀疏、关联性弱、多样性少的技术问题,可以提升用户问答体验,辅助获取更多隐藏信息,实现根据用户提问问题生成相关问题进行准确推荐。
技术领域
本发明涉及自然语言处理分析领域,更为具体的,涉及一种基于知识图谱的生成式问题推荐方法、设备、介质及系统。
背景技术
在文本语言处理分析中,用户积累了大量的结构化文本数据,为了更好的挖掘其中的关联关系,往往以知识图谱的形式对其进行存储,知识图谱将结构化文本通过网状形式进行关联,可以更加深刻的挖掘各个实体之间的关联关系,从而进行相关实体的多跳查询、知识推理。问答作为知识获取的方式之一,基于知识图谱的问答应用也愈加广发,在用户进行日常问答中,需要对用户提问问题进行分析,并做出个性化的相关问题推荐,如何提取用户问题关键信息并做出精确问题推荐,辅助用户获取更多关键信息、提升问答体验具有重要的研究意义。
目前传统的推荐系统基于用户历史行为,通过构建问题历史库以及问答对库,从中匹配和用户提问问题相似的问题进行推荐。在实际应用中,用户问题一般具有一定的泛化性,且数据库具有不完备性,该方法存在推荐数据稀疏、关联性弱、多样性少等问题,这样就导致推荐问题不准确,难以满足用户需求,实际推荐问题和用户提问问题相关性较弱。因此需要根据用户实际问题,建立精确、相关性强、多样性足的问题推荐系统。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于知识图谱的生成式问题推荐方法、设备、介质及系统,解决推荐数据稀疏、关联性弱、多样性少的技术问题,可以提升用户问答体验,辅助获取更多隐藏信息,实现根据用户提问问题生成相关问题进行准确推荐。
本发明的目的是通过以下方案实现的:
一种基于知识图谱的生成式问题推荐方法,包括以下步骤:
S1,数据准备;
S2,构建实体辅助Elasticsearch数据库;
S3,基于Bert-BILSTM-CRF模型提取问题中实体;
S4,基于NeZha+UniLM模型进行问题生成;
S5,根据生成问题进行问题推荐。
进一步地,在步骤S1中,包括子步骤:根据已有的知识图谱数据库,按需求构建实体识别模型以及问题生成模型所需训练语料。
进一步地,在步骤S2中,包括子步骤:以实体全称、简称、别名构建图谱实体的Elasticsearch数据库,基于Es检索获取问题中实体对应图谱库中实体全称,再去获取对应三元组。
进一步地,在步骤S3中,包括子步骤:针对用户提问问题,基于Bert-BILSTM-CRF模型进行命名实体识别,根据获取的问题实体进行Es检索,获取Elasticsearch数据库中对应实体全称,由对应实体全称至图谱数据库中进行相关三元组检索。
进一步地,在步骤S4中,包括子步骤:将三元组按顺序连接作为篇章,尾实体作为答案,即生成符合答案为尾实体的相关问题;在模型结构上,采用NeZha+UniLM模型;在模型输入上,对于单跳问题获取的三元组(entity1,relation,entity2),将头实体、关系、尾实体(entity1+relation+entity2)顺序拼接作为篇章,尾实体(entity2)作为答案,其形式表示为:
[CLS]entity1 relation entity2[SEP]entity2[SEP];
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第十研究所,未经中国电子科技集团公司第十研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211161774.3/2.html,转载请声明来源钻瓜专利网。