[发明专利]实体关系抽取方法、终端和计算机可读存储介质在审
申请号: | 202011386678.X | 申请日: | 2020-12-01 |
公开(公告)号: | CN112487109A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 朱胜青 | 申请(专利权)人: | 朱胜青 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F40/295;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 深圳市恒程创新知识产权代理有限公司 44542 | 代理人: | 刘冰 |
地址: | 新加坡黄浦*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 关系 抽取 方法 终端 计算机 可读 存储 介质 | ||
本申请公开了一种实体关系抽取方法、终端和计算机可读存储介质,实体关系抽取方法包括:获取与量子相关的文本数据,构建自注意力机制;基于自注意力机制构建双向长短期记忆网络,并基于双向长短期记忆网络计算实体感知注意力;将双向长短期记忆网络中的第一数据和实体感知注意力中的第二数据进行联合训练,得到训练模型;将文本数据输入至训练模型中进行训练,得到抽取结果。解决了因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理的技术问题,避免了繁琐的特征工程,提高了实体关系联合抽取效率。
技术领域
本申请涉及计算机技术领域,尤其涉及一种实体关系抽取方法、终端和计算机可读存储介质。
背景技术
随着国际先进国家和中国在量子领域科学研究、产业化、市场化的推展,特别是量子计算机、量子加密技术逐步开始商业应用,量子科技在中国各行各业的影响与日俱增。从公开发表的网络新闻文本中识别量子相关的实体,并抽取这些量子相关实体之间的关系、构建量子企业间的关系图谱成为重要研究内容。目前,量子相关实体之间的关系主要以手动方式甄别为主,基于量子相关实体的信息提取、实体关系抽取的方法还不多。综上所述,现有量子相关的网络新闻和资信文本实体关系联合抽取主要存在以下问题:因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理。
发明内容
本申请实施例通过提供一种实体关系抽取方法、终端和计算机可读存储介质,旨在解决因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理的问题。
为实现上述目的,本申请一方面提供一种实体关系抽取方法,所述实体关系抽取方法包括以下步骤:
获取与量子相关的文本数据,构建自注意力机制;
基于所述自注意力机制构建双向长短期记忆网络,并基于所述双向长短期记忆网络计算实体感知注意力;
将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练,得到训练模型;
将所述文本数据输入至所述训练模型中进行训练,得到抽取结果。
可选地,所述构建自注意力机制的步骤包括:
对查询和键值进行点乘计算,得到权重因子;
将所述权重因子进行缩放处理以获取缩放数据,将所述缩放数据进行归一化,得到权重系数,并将所述权重系数与设定值进行加权求和。
可选地,所述基于所述自注意力机制构建双向长短期记忆网络的步骤包括:
获取所述自注意力机制的数据层的数据;
基于所述数据层的数据构建向前长短期记忆网络和向后长短期记忆网络,并基于所述向前长短期记忆网络和所述向后长短期记忆网络组成所述双向长短期记忆网络。
可选地,所述基于所述双向长短期记忆网络计算实体感知注意力的步骤包括:
基于所述双向长短期记忆网络计算相对位置特征和潜在类型的实体特征;
根据所述相对位置特征和所述潜在类型的实体特征得到所述实体感知注意力。
可选地,所述将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练的步骤包括:
获取所述双向长短期记忆网络中参数共享层的第一数据以及所述实体感知注意力中联合解码层的第二数据;
将所述参数共享层的第一数据和所述联合解码层的第二数据进行联合训练。
可选地,所述将所述参数共享层的第一数据和所述联合解码层的第二数据进行联合训练的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于朱胜青,未经朱胜青许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011386678.X/2.html,转载请声明来源钻瓜专利网。