[发明专利]一种基于Word2Vec-BiLSTM-CRF模型的法律领域的实体抽取方法有效
申请号: | 202011620453.6 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112800764B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 李参宏 | 申请(专利权)人: | 江苏网进科技股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06Q50/18;G06N3/0442;G06N3/084 |
代理公司: | 苏州佳博知识产权代理事务所(普通合伙) 32342 | 代理人: | 唐毅 |
地址: | 215300 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于Word2Vec‑BiLSTM‑CRF的法律领域的命名实体识别方法,具体包括以下步骤:获取法律领域的原始数据并进行数据的预处理,获得的训练语料数据;将获得的训练语料数据输入Word2Vec算法结合CBOW模型,从而得到针对于法律领域的词向量;将预处理获取的训练语料数据,结合模板匹配和中文语料的顿等模式进行标注,获取标注语料,以Bi‑LSTM作为模型的编码层,将获得的标注语料与获得词向量相结合作为编码层的输入,输出得到文本语义信息特征;将Bi‑LSTM层获取的文本语义信息特征作为CRF的输入,最终输出命名实体的识别结果。识别法律文书中种类丰富的实体,实现法律领域实体的细粒度刻画,法律领域的数据结构化,进一步挖掘法律领域的不同实体之间的关系具有重要意义。 | ||
搜索关键词: | 一种 基于 word2vec bilstm crf 模型 法律 领域 实体 抽取 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏网进科技股份有限公司,未经江苏网进科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011620453.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种利用电流变体实现稳固定位的打孔钻辅助设备
- 下一篇:一种组合式电线绕包机