[发明专利]基于自监督和聚类技术从文本中抽取实体间关系的方法有效
申请号: | 202011466109.6 | 申请日: | 2020-12-13 |
公开(公告)号: | CN112487190B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 王鑫;王博;蒋沁学;陈根华;黄博帆 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/211;G06F40/284;G06F40/289;G06F40/30 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 刘子文 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于自监督和聚类技术从文本中抽取实体间关系的方法,基于自我监督的思想,在无标签的数据集中进行关系提取;包括下文编码模块、聚类模块以及分类模块;上下文编码模块用于将数据进行编码,用于之后进行关系抽取和分析;聚类模块分为实体的自适应聚类和实体类别的自适应聚类两部分;实体的自适应聚类用于将实体编码直接进行聚类,得到的聚类结果是实体类别;实体类别的自适应聚类是将实体类别进行聚类,得到的结果是实体类别之间的关系;分类模块用于将各个模块联系起来共同训练。 | ||
搜索关键词: | 基于 监督 技术 文本 抽取 实体 关系 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011466109.6/,转载请声明来源钻瓜专利网。