[发明专利]一种面向用户的多轮问答法律文书实体关系抽取方法在审
申请号: | 202110058268.0 | 申请日: | 2021-01-16 |
公开(公告)号: | CN112732942A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 李参宏 | 申请(专利权)人: | 江苏网进科技股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332;G06F40/126;G06F40/295;G06Q50/18 |
代理公司: | 苏州佳博知识产权代理事务所(普通合伙) 32342 | 代理人: | 唐毅 |
地址: | 215300 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 用户 问答 法律文书 实体 关系 抽取 方法 | ||
1.一种面向用户的多轮问答法律文书实体关系抽取方法,其特征在于:问题模板引擎提供的问题展示给用户,在获取用到户选择的问题后,判断是否存储过该文书的该问题,若有,直接输出答案;若无,将其问题分析,对该问题进行分析处理,得到答案,输出并存储该文书的问题及答案;将输出的答案传入到前端进行显示,根据答案动态选择之后的问题模板序列;之后重复上述过程直到用户无输入为止;其中,分析处理的方法步骤包括:
通过卷积和注意力把问题编码为一个固定的向量,将其拼接到文书的每个词向量中;在词向量中拼接位置向量、人工特征,得到一个混合了问题、文书信息的特征序列;接多层卷积进行编码处理,然后使用BEMO的序列标注方法直接对序列进行标注;每个词的表示反馈给sigmoid层来输出BMEO标签,获得答案的位置标记。
2.如权利要求1所述的面向用户的多轮问答法律文书实体关系抽取方法,其特征在于:卷积方法是基于如下模型的卷积过程完成的:
其中,X=[x1,x2,…,xn]是将要处理的向量序列,Conv1D1与Conv1D2是两个卷积核数窗口大小都一样的一维卷积,σ是sigmoid激活函数。
3.如权利要求1所述的面向用户的多轮问答法律文书实体关系抽取方法,其特征在于:
注意力方法是通过如下的卷积过程完成的:
其中,α,W是可训练参数,Act是激活函数。
4.如权利要求1所述的面向用户的多轮问答法律文书实体关系抽取方法,其特征在于:位置向量构造方法为:
上式表示将id为p的位置映射成一个dpos维的位置向量,这个向量的第i个元素的数值记为PEi(p)。
5.如权利要求1所述的面向用户的多轮问答法律文书实体关系抽取方法,其特征在于:通过训练提取头部实体和提取尾部实体及关系这两个阶段的目标函数,进一步提升实体关系抽取性能:
其中,λ∈[0,1]是控制两个目标函数之间权衡的参数,表示提取头部实体这一阶段的目标函数,表示提取尾部实体和关系这一阶段的目标函数;两个阶段的目标函数都是用如下的目标函数:P(wi|w1,...,wi-1,wi+1,...,wn);其中wi表示的是句子中第i个位置的词拼接后的向量表示。
6.如权利要求5所述的面向用户的多轮问答法律文书实体关系抽取方法,其特征在于:对于基于BEMO标注输出的方法,即选择一个文本段{w1,w2,...wn}的概率,定义为一个联合概率:
其中,B,E,M为BEM0标记。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏网进科技股份有限公司,未经江苏网进科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110058268.0/1.html,转载请声明来源钻瓜专利网。