[发明专利]一种获取法律领域问句答案的方法和系统在审
申请号: | 202010332120.7 | 申请日: | 2020-04-24 |
公开(公告)号: | CN111553160A | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 郜成胜;熊冠铭;赵文;季昕;邹欢欢 | 申请(专利权)人: | 北京北大软件工程股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/35;G06F16/332;G06F16/33;G06F16/35;G06Q50/18 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 岳凤羽 |
地址: | 100089 北京市海淀区北四环西路67号中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 法律 领域 问句 答案 方法 系统 | ||
本发明公开了一种获取法律领域问句答案的方法和系统,属于语义理解领域,在获取用户的自然语言问句后生成词语的实体,识别实体并将实体分为命名实体和一般实体,根据命名实体和一般实体的关系生成语法依存树,根据语法依存树生成实体间的谓词路径,在根据谓词路径生成查询语句,执行查询语句从数据库中获取用户问句的答案。通过上述方案能够理解用户的语义,帮助用户快速准确的获取问句的答案,同时获取的答案更全面。
技术领域
本发明涉及语义理解领域,特别地,涉及一种获取法律领域问句答案的方法和系统。
背景技术
当今的互联网上,传统的搜索引擎,比如:Google、雅虎、百度等,很大程度上解决了用户对信息搜索的需求。以Google为首的传统的搜索引擎主要是基于关键词匹配,它从互联网中以一定的策略搜集、爬取信息,对信息进行解析、索引,为用户提供检索服务。这种基于关键词匹配的方式在一般情况下能够非常快速的解决用户的问题。但是在法律领域,法律文本具有非常严格的定义,在不同的情景下,一个词往往具有不同的语义,这样基于关键词匹配的方式无法快速向用户给出明确具体的信息。
发明内容
为了克服现有技术的不足,本发明提供一种能够快速型用户给出明确具体信息的获取法律领域问句答案的方法和系统。
本发明解决其技术问题所采用的技术方案是:
一方面,
一种获取法律领域问句答案的方法,包括以下步骤:
获取用户的自然语言问句;
根据所述问句生成词语的实体;
识别所述实体并将所述实体分为命名实体和一般实体两类,所述命名实体用于表示名词;
根据所述命名实体和一般实体的关系生成所述问句的语法依存树;
根据所述语法依存树生成实体间的谓词路径;
根据所述谓词路径生成查询语句;
执行所述查询语句从数据库中获取问句答案。
进一步地,所述根据所述问句生成词语的实体包括:
加入法律领域字典对分词器进行调整;
采用调整后的分词器对所述问句进行分词获得词语的实体。
进一步地,所述识别所述实体并将所述实体分为命名实体和一般实体两类,所述命名实体用于表示名词包括:
利用法律数据库中的数据训练得到分类模型;
采用所述分类模型识别所述实体并将所述实体分为命名实体和一般实体两类。
进一步地,所述根据所述命名实体和一般实体的关系生成所述问句的语法依存树包括:
将问句以实体的形式按顺序分开排列;
连接任意两个实体并标注所述两个实体的关系,获得所述语法依存树。
进一步地,所述根据所述语法依存树生成实体间的谓词路径包括:
根据语法依存树抽取能代表所述问句含义的最小子句;
根据所述最小子句生成查询图;
将所述查询图映射到数据库中生成实体间的谓词路径。
进一步地,所述将所述查询图映射到数据库中生成实体间的谓词路径包括:
通过预设规则将所述查询图内的谓词进行转换,以匹配所述数据库中的实体连接关系;
根据语法依存树中各实体的关系对转换后的实体连接关系进行补充标注,生成实体间的谓词路径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京北大软件工程股份有限公司,未经北京北大软件工程股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010332120.7/2.html,转载请声明来源钻瓜专利网。