[发明专利]一种自动生成法律文本标记事件的方法有效
申请号: | 202110058260.4 | 申请日: | 2021-01-16 |
公开(公告)号: | CN112733507B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 兰莉;周振东 | 申请(专利权)人: | 江苏网进科技股份有限公司 |
主分类号: | G06F40/169 | 分类号: | G06F40/169;G06F40/211;G06F40/247;G06F40/289;G06Q50/18 |
代理公司: | 苏州佳博知识产权代理事务所(普通合伙) 32342 | 代理人: | 唐毅 |
地址: | 215300 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 生成 法律 文本 标记 事件 方法 | ||
1.一种自动生成法律文本标记事件的方法,其特征在于,其步骤包括:
步骤S101,输入初始的法律文本数据进行预处理,识别事件的触发词、事件的参数、事件类型;
步骤S102,根据识别的事件参数与事件类型,使用GPT模型获取新的事件参数,获取新的事件参数,具体满足下述条件:
其中,a表示事件的参数向量,β表示使用GPT模型生成的嵌入,t表示识别的事件参数;
步骤S103,根据识别的触发词与事件类型,通过BERT模型根据输入的数据生成能够表示同一种事件发生的词语作为新的触发词,其中,所述新的触发词为与初始法律文本数据中触发词意思相近,符合识别的触发词上下文语境,能够表示同一种事件发生的词语;
步骤S104,根据新的触发词与新的事件参数,生成新的法律文本标记事件;
步骤S105,对新的法律文本标记事件进行评价;
步骤S106,从评价完成的法律文本标记事件中选出评价符合标准的法律文本标记事件。
2.如权利要求1所述的自动生成法律文本标记事件的方法,其特征在于,上述步骤S105中,针对新的法律文本标记事件进行评价,其步骤包括:
(1)获取生成标记事件的合理性R(S′),具体满足:
其中,R(S')表示新生成标记事件S′的合理性分数,S′表示重写过的句子,P(t)表示重写事件参数t的概率,A(S')表示在句子S′中调整过后的新的事件参数;
(2)获取生成的标记事件和原有的标记事件之间的偏差度D(S′),具体满足:
其中,D(S')表示重写过的句子与原有句子之间的偏差度,D表示原有的数据集,B(S)生成标记事件句子的元素集合的特征向量化处理,B(S’)表示原有标记事件句子的元素集合的特征向量化处理,||表示对向量化后的文本进行取模操作;
(3)根据所述生成标记事件的合理性与偏差度计算最终标记事件的评价分数,评价分数Q(S′)满足:Q(S′)=1-((1-λ)R(S′)+λD(S′)),其中,Q(S')为新生成标记事件S'的评价分数,μ、λ为自定义的平衡调节参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏网进科技股份有限公司,未经江苏网进科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110058260.4/1.html,转载请声明来源钻瓜专利网。