[发明专利]一种获取法律领域问句答案的方法和系统在审
申请号: | 202010332120.7 | 申请日: | 2020-04-24 |
公开(公告)号: | CN111553160A | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 郜成胜;熊冠铭;赵文;季昕;邹欢欢 | 申请(专利权)人: | 北京北大软件工程股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/35;G06F16/332;G06F16/33;G06F16/35;G06Q50/18 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 岳凤羽 |
地址: | 100089 北京市海淀区北四环西路67号中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 法律 领域 问句 答案 方法 系统 | ||
1.一种获取法律领域问句答案的方法,其特征在于,包括以下步骤:
获取用户的自然语言问句;
根据所述问句生成词语的实体;
识别所述实体并将所述实体分为命名实体和一般实体两类,所述命名实体用于表示名词;
根据所述命名实体和一般实体的关系生成所述问句的语法依存树;
根据所述语法依存树生成实体间的谓词路径;
根据所述谓词路径生成查询语句;
执行所述查询语句从数据库中获取问句答案。
2.根据权利要求1所述的方法,其特征在于:所述根据所述问句生成词语的实体包括:
加入法律领域字典对分词器进行调整;
采用调整后的分词器对所述问句进行分词获得词语的实体。
3.根据权利要求1所述的方法,其特征在于:所述识别所述实体并将所述实体分为命名实体和一般实体两类包括:
利用法律数据库中的数据训练得到分类模型;
采用所述分类模型识别所述实体并将所述实体分为命名实体和一般实体两类。
4.根据权利要求1所述的方法,其特征在于:所述根据所述命名实体和一般实体的关系生成所述问句的语法依存树包括:
将问句以实体的形式按顺序分开排列;
连接任意两个实体并标注所述两个实体的关系,获得所述语法依存树。
5.根据权利要求1所述的方法,其特征在于:所述根据所述语法依存树生成实体间的谓词路径包括:
根据语法依存树抽取能代表所述问句含义的最小子句;
根据所述最小子句生成查询图;
将所述查询图映射到数据库中生成实体间的谓词路径。
6.根据权利要求5所述的方法,其特征在于:所述将所述查询图映射到数据库中生成实体间的谓词路径包括:
通过预设规则将所述查询图内的谓词进行转换,以匹配所述数据库中的实体连接关系;
根据语法依存树中各实体的关系对转换后的实体连接关系进行补充标注,生成实体间的谓词路径。
7.根据权利要求1所述的方法,其特征在于:在根据所述语法依存树生成实体间的谓词路径之前还包括:
将问句中的实体与数据库中的的实体进行匹配;
将数据库中匹配成功的实体代替问句中的实体生成谓词路径。
8.根据权利要求7所述的方法,其特征在于:所述将数据库中匹配成功的实体代替问句中的实体生成谓词路径包括:
计算问句中实体与数据库中实体的相似度;
将数据库中相似度在预设数值以上的实体集合代表问句中对应的实体;
两个所述实体集合之间的谓词路径即问句中对应的实体间的谓词路径。
9.根据权利要求8所述的方法,其特征在于:
当根据所述语法依存树生成实体间的谓词路径时,代表所述命名实体的实体集合中存在不能生成谓词路径匹配的实体时,则从所述实体集合中删除所述实体。
10.一种获取法律领域问句答案的系统,其特征在于,包括:
问句获取模块,用于获取用户的自然语言问句;
命名实体生成模块,用于根据所述问句生成词语的实体;
命名实体分类模块,用于识别所述实体并将所述实体分为命名实体和一般实体两类,所述命名实体用于表示名词;
语法依存树生成模块,用于根据所述命名实体和一般实体的关系生成所述问句的语法依存树;
谓词路径生成模块,用于根据所述语法依存树生成实体间的谓词路径;
查询语句生成模块,用于根据所述谓词路径生成查询语句;
问句答案获取模块,用于执行所述查询语句从数据库中获取问句答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京北大软件工程股份有限公司,未经北京北大软件工程股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010332120.7/1.html,转载请声明来源钻瓜专利网。