[发明专利]生成法律文书的方法、装置、设备和存储介质在审
申请号: | 201910992336.3 | 申请日: | 2019-10-18 |
公开(公告)号: | CN110910283A | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 张学晨;刘嘉伟;于修铭;陈晨;李可;汪伟 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06Q50/18 | 分类号: | G06Q50/18;G06F16/36;G06F16/34;G06F40/289 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 刘挽澜 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 法律文书 方法 装置 设备 存储 介质 | ||
本申请涉及人工智能领域,提供了一种生成法律文书的方法、装置、设备和存储介质,方法包括:接收用户输入的语音数据;将语音数据通过语音转换技术转换成待处理的文本数据;创建图Graph数据,通过图Graph数据辨识特定的分隔符,以分句处理待处理的文本,通过图Graph数据的节点保存多个候选关键句;将多个候选关键句输入至分词模型,以得到分词后的词汇;构建边集E,通过边集E以及文本句子的内容覆盖率,以计算任意两个候选关键句以及的权重,并将权重高于阈值的候选关键句链接起来;分析权重高于阈值的候选关键句的重要性;对候选关键句进行排序,并按顺序提取候选关键句,以得到多个文摘句子。最大化的减少重复劳动,提高办案效率。
技术领域
本申请涉及智能决策领域,尤其涉及一种生成法律文书的方法、装置、设备和存储介质。
背景技术
法律文书是记载人民法院审理过程和结果的载体,一份结构完整、要素齐全、逻辑严谨的法律摘要,既是当事人享有权利和负担义务的凭证,也是上级人民法院监督下级人民法院民事审判活动的重要依据。但法律文摘的书写过程繁杂而冗长,并带有大量的重复性劳动。通过法律知识图谱对案件中原告、被告以及证据项等关键节点的解析进而自动生成法律文摘可以提高审案效率将法官从书写文摘的工作中解放出来。
现有的法律文摘自动生成系统中,用户需要根据固定模板中关键词对应的内容进行填写进行法律文摘的初步生成,基于固定模板的文书生产方式对于案件由来和审理经过、事实、理由、裁判依据部分的书写均不能起到很好的效果,依然需要用户进行大量的内容填写,并且大量填写的内容不一定能符合法律要求所需要的形式。
发明内容
本申请提供了一种通过配置生成法律文书的方法,能够解决现法律文摘的书写过程繁杂而冗长的问题。
第一方面,本申请提供一种生成法律文书的方法,包括:
接收用户输入的语音数据,将所述语音数据通过语音转换技术转换成待处理的文本数据;
创建图Graph数据,通过所述图Graph数据辨识特定的分隔符,以分句处理所述待处理的文本数据,并通过所述图Graph数据的节点保存多个候选关键句;
将所述多个候选关键句输入至分词模型,以得到分词后的词汇;
构建边集E,通过所述边集E以及文本句子的内容覆盖率,计算任意两个所述候选关键句Si以及所述候选关键句Sj的权重,并将所述权重高于阈值的所述候选关键句链接起来;
分析所述权重高于阈值的候选关键句的重要性,重复计算多次,直至计算前的S(Vi)以及计算后的S(Vi)之间差值小于阈值,其中S(Vi)表示第i个所述节点Vi的重要性,Vj表示与所述第i个节点相连的第j个节点;
根据计算的每一个所述候选句S(Vi)的值,将所述多个候选关键句按照S(Vi)的值从大到小排序,并按顺序提取多个所述候选关键句,以得到多个文摘句子;
在一些可能的设计中,所述接收用户输入的语音数据之前,所述方法还包括:
获取针对所述分词模型输出的反馈信息;
根据所述反馈信息对所述分词模型进行优化;
采集具有多元语义的网络词库,根据法律领域对网络词库进行训练;
接收待分词文本,根据所述网络词库对所述待分词文本进行初始分词;
对所述待分词文本进行初始分词后,对所述待分词文本进行特征提取,从而获得所述待分词文本的领域特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910992336.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网络视频直播中限制发红包的方法
- 下一篇:一种阿特拉津污染农田土壤修复方法