[发明专利]一种文本解析方法及装置有效
申请号: | 201910735564.2 | 申请日: | 2019-08-09 |
公开(公告)号: | CN110442682B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 姜振康;陈志刚;吴自成;陈涛;张友国 | 申请(专利权)人: | 科大讯飞(苏州)科技有限公司;讯飞智元信息科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/36 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨华 |
地址: | 215000 江苏省苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 解析 方法 装置 | ||
1.一种文本解析方法,其特征在于,包括:
获取第一文本,所述第一文本为指定领域的指定文档中的一个句子;
采用预设的解析规则解析所述第一文本,其中,所述解析规则用于将所述第一文本解析为计算机可理解的结构化描述;
若所述第一文本解析失败,则对所述第一文本进行指代消解,以将所述第一文本中的指代词转换为名词实体,指代消解后的文本作为第二文本;
对所述第二文本按所述预设的解析规则进行解析;
其中,在对所述第一文本进行指代消解的过程中,根据归一化后的所述第一文本的内容、所述指定领域的知识图谱以及预设的节点连接规则,生成的指代词与名词实体关系图,确定归一化后的所述第一文本中的指代词所指代的名词实体。
2.根据权利要求1所述的文本解析方法,其特征在于,所述解析规则包括至少一种,每种解析规则对应一种文本类型;
所述采用预设的解析规则解析所述第一文本,包括:
采用至少一种解析规则对所述第一文本进行解析,若所述至少一种解析规则中的任一种解析规则能够成功解析所述第一文本,则确定所述第一文本解析成功,若所述至少一种解析规则中的每种解析规则均无法成功解析所述第一文本,则确定所述第一文本解析失败。
3.根据权利要求1所述的文本解析方法,其特征在于,所述对所述第一文本进行指代消解,包括:
采用预先建立的文本归一化模型对所述第一文本进行归一化,归一化后得到的文本作为目标文本,其中,所述文本归一化模型用于将所述第一文本处理成规范的表达;
从所述目标文本中所包含的名词实体中,确定所述目标文本中的指代词所指代的名词实体,作为目标名词实体;
将所述目标文本中的指代词替换为所述目标名词实体。
4.根据权利要求3所述的文本解析方法,其特征在于,所述文本归一化模型包括编码模块和解码模块;
所述采用预先建立的文本归一化模型对所述第一文本进行归一化,包括:
获取所述第一文本对应的空间位置向量,其中,所述第一文本对应的空间位置向量能够表征所述第一文本中各实体的空间位置关系;
通过所述文本归一化模型的编码模块,将所述第一文本编码为上下文向量,作为所述第一文本对应的句向量;
通过所述文本归一化模型的解码模块,根据所述第一文本对应的空间位置向量和所述第一文本对应的句向量,确定所述第一文本规范的表达。
5.根据权利要求3所述的文本解析方法,其特征在于,所述从所述目标文本中所包含的名词实体中,确定所述目标文本中的指代词所指代的名词实体,包括:
根据所述目标文本的内容、所述指定领域的知识图谱以及预设的节点连接规则,生成指代词与名词实体关系图,其中,所述指代词与名词实体关系图包括名词实体节点、指代词节点、属性节点和属性值节点,节点之间通过有向连接线连接,所述预设的节点连接规则根据指代词、名词实体、指代词的属性、指代词的属性值、名词实体的属性、名词实体的属性值的关系设定;
根据所述指代词与名词实体关系图,从所述目标文本中所包含的名词实体中,确定所述目标文本中的指代词所指代的名词实体。
6.根据权利要求5所述的文本解析方法,其特征在于,所述预设的节点连接规则为:
指代词节点的属性值节点指向指代词节点的属性节点,指代词节点的属性节点指向指代词节点;
对于任一名词实体节点,该名词实体节点指向该名词实体节点的属性节点,该名词实体节点的属性节点指向该名词实体节点的属性值节点;
任意两个属性节点之间相互指向;
任意两个名词实体节点之间相互指向;
指代词节点分别指向各名词实体节点;
各名词实体节点的属性值节点均指向指代词的属性值节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞(苏州)科技有限公司;讯飞智元信息科技有限公司,未经科大讯飞(苏州)科技有限公司;讯飞智元信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910735564.2/1.html,转载请声明来源钻瓜专利网。