[发明专利]一种面向关系抽取的句子结构信息获取方法有效
申请号: | 201911355241.7 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111126039B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 秦永彬;杨卫哲;程华龄;陈艳平;黄瑞章;王凯 | 申请(专利权)人: | 贵州大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/295;G06F40/30;G06F16/33;G06N3/04;G06N3/08 |
代理公司: | 贵阳中新专利商标事务所 52100 | 代理人: | 吴无惧 |
地址: | 550025 贵州省贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 关系 抽取 句子 结构 信息 获取 方法 | ||
1.一种面向关系抽取的句子结构信息获取方法,其特征在于:所述方法包括如下步骤:步骤一、从数据集中抽取包含两个实体且已知实体语义关系类别的关系提及语句;步骤二、使用实体标记符和分隔符将步骤一中抽取出来的关系提及语句中的实体进行分隔和标记;步骤三、基于预训练字向量查找表或随机产生的字向量查找表对文本进行向量映射;步骤四、通过神经网络对表示文本的向量矩阵进行卷积操作提取句子结构特征;步骤五、对卷积后的结果实施最大池化操作,进一步获取抽象特征;步骤六、全连接、Softmax层预测分类结果;
所述步骤二中,将步骤一抽取出来的关系提及语句中有且仅有的两个实体提取到句子最前面,并分别用标记符号标记在两个实体的开始和结束位置,然后将句子中标记后的实体对复制到句子开始位置,并用字符“0”分隔实体与实体,实体与句子,以期神经网络感知到句子中实体对的存在与位置,可以通过这种方式让神经网络获取句子的结构信息。
2.根据权利要求1所述的面向关系抽取的句子结构信息获取方法,其特征在于:所述步骤三中,基于构建的CNN神经网络模型,包括输入层、隐藏层、输出层三部分,其中,要对文本进行字向量映射,将句子转化成向量矩阵,作为网络的输入,根据自然语言处理中所需的字向量特征和格式,使用随机产生的字向量查找表以及加载预训练字向量查找表对文本中的文字进行向量映射,得到文本的向量表示矩阵X。
3.根据权利要求1所述的面向关系抽取的句子结构信息获取方法,其特征在于:所述步骤四中,对通过字向量查找表映射之后的向量矩阵X进行卷积操作,卷积结果为C,其中C =Conv(X)。
4.根据权利要求1所述的面向关系抽取的句子结构信息获取方法,其特征在于:所述数据集为ACE或SemEval数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州大学,未经贵州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911355241.7/1.html,转载请声明来源钻瓜专利网。