[发明专利]一种多关系的同步抽取方法在审
申请号: | 202110820329.2 | 申请日: | 2021-07-20 |
公开(公告)号: | CN113486181A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 傅啸;康文涛 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F16/28;G06N20/20 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种多关系的同步抽取方法。本发明具体实现步骤如下:步骤1:获取互联网语料库,并将其整理得到文本,关系格式的数据集;步骤2:对数据进行预处理,主要对所得数据集进行清洗和结构化整理,以便后续作为模型的输入;步骤3:构建关系抽取模型;该模型由主体关系抽取模型和客体抽取模型两部分组成;步骤4:关系抽取模型的训练;通过梯度下降算法,求得损失函数的最小化来训练模型;步骤5:模型预测;对需要预测的文本内容,利用求得的概率的最大值来确定文本包含的关系;使用维特比算法,得到文本的主体标注序列、客体标注序列。本发明将相同主体和关系合并,有助于减少计算次数,提升模型的运行效率并改善表现。 | ||
搜索关键词: | 一种 关系 同步 抽取 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110820329.2/,转载请声明来源钻瓜专利网。