[发明专利]用于挖掘文本文档以识别开创性问题和开创性案件的系统、方法和计算机程序产品在审
申请号: | 201880084797.4 | 申请日: | 2018-12-24 |
公开(公告)号: | CN111542815A | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | P·张;V·天普拉 | 申请(专利权)人: | 雷克斯股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/93;G06Q50/18 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 杨学春;张鑫 |
地址: | 美国俄*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 挖掘 文本 文档 识别 开创性 问题 案件 系统 方法 计算机 程序 产品 | ||
1.一种用于识别解决特定法律问题的一个或多个开创性案件的系统,所述系统包括:
处理设备;以及
非瞬态处理器可读存储介质,所述非瞬态处理器可读存储介质与所述处理设备通信,所述非瞬态处理器可读存储介质包括一个或多个编程指令,所述一个或多个编程指令在被执行时使所述处理设备:
从储存库中获取电子法律文档,所述电子法律文档包括多个文本,
针对包括多个法律问题文本的多个引用理由,搜索所述电子法律文档的所述多个文本,
搜索所述多个引用理由以识别多个开创性线索,并且从所述多个引用理由生成具有所述多个开创性线索的数据列表以识别多个潜在的开创性案件,
过滤包含所述多个潜在的开创性案件的所述数据列表,以仅识别基于所计算的开创性参考频率的开创性案件并且从经过滤的数据列表生成工作语料库,以及
输出与来自所述工作语料库的所述开创性案件对应的数据,使得当所述开创性案件中的一个或多个作为搜索的结果返回时,所述数据使外部设备区分所述开创性案件。
2.根据权利要求1所述的系统,其中所计算的开创性参考频率由预定的一组规则来确定,所述预定的一组规则被配置成确定特定案件作为开创性案件被引用的次数以建立频率。
3.根据权利要求1所述的系统,其中所述引用理由文本是摘要文本。
4.根据权利要求1所述的系统,其中所述非瞬态处理器可读存储介质进一步包括一个或多个编程指令,当所述一个或多个编程指令被执行时使所述处理设备:
从在所述工作语料库中的所有所述开创性案件的所述多个引用理由中挖掘所述多个法律问题文本以建立句子数据,所述句子数据包含多个句子,所述多个句子包括来自在所述工作语料库中的所述开创性案件的所述多个法律问题文本的多个法律讨论,
为参考所述开创性案件的所述多个句子中的每一个句子分配唯一标识符,
针对在所述工作语料库中的每个开创性案件,从所述句子数据收集所述多个句子的所述句子,
针对在所述工作语料库中的所述开创性案件中的每一个开创性案件,将来自所述句子数据的所收集的句子存储为临时句子数据,
将文本聚类算法应用于所述临时句子数据以创建多个文本聚类,以及
从所述多个文本聚类中选择顶部聚类,其中所述顶部聚类包括围绕用所述开创性案件中的每一个开创性案件识别的所述多个法律问题文本的一个或多个句子。
5.根据权利要求4所述的系统,其中从所述临时句子数据的所述多个文本聚类中选择所述顶部聚类将未聚焦于用开创性案件识别的所述多个法律问题文本的所述句子从临时句子数据中移除。
6.根据权利要求4所述的系统,其中所述顶部聚类是多个句子。
7.根据权利要求4所述的系统,其中所述非瞬态处理器可读存储介质进一步包括一个或多个编程指令,当所述一个或多个编程指令被执行时使所述处理设备:
从所述顶部聚类的所述一个或多个句子中生成一组规范化关键术语,所述一组规范化关键术语表示用每个开创性案件识别的开创性问题,
收集与每个开创性案件相关联的所述多个引用理由,
针对所述多个引用理由中的每一个引用理由,扫描和提取多个规范化术语,
将所述一组规范化关键术语与所述多个规范化术语进行比较,
确定所述一组规范化关键术语和每一个引用理由的所述多个规范化术语之间的语义距离,
基于所述一组规范化关键术语和所述多个规范化术语之间的所述语义距离,选择特定引用理由,以及
为所述开创性案件分配所述引用理由的所述多个法律问题文本的所述特定法律问题作为所述开创性问题。
8.根据权利要求7所述的系统,其中所选择的引用理由是在所述开创性案件中的所述开创性问题中的至少一个开创性问题的质心。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于雷克斯股份有限公司,未经雷克斯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880084797.4/1.html,转载请声明来源钻瓜专利网。